Gambar oleh Penulis
Gemini adalah model baru yang dikembangkan oleh Google, dan Bard dapat digunakan kembali. Dengan Gemini, sekarang Anda bisa mendapatkan jawaban yang hampir sempurna atas pertanyaan Anda dengan menyediakan gambar, audio, dan teks.
Dalam tutorial ini, kita akan belajar tentang Gemini API dan cara mengaturnya di mesin Anda. Kami juga akan mengeksplorasi berbagai fungsi Python API, termasuk pembuatan teks dan pemahaman gambar.
Gemini adalah model AI baru yang dikembangkan melalui kolaborasi antar tim di Google, termasuk Google Research dan Google DeepMind. Itu dibuat secara khusus untuk menjadi multimodal, artinya dapat memahami dan bekerja dengan berbagai jenis data seperti teks, kode, audio, gambar, dan video.
Gemini merupakan model AI tercanggih dan terbesar yang dikembangkan Google hingga saat ini. Ini telah dirancang agar sangat fleksibel sehingga dapat beroperasi secara efisien pada berbagai sistem, mulai dari pusat data hingga perangkat seluler. Artinya, hal ini berpotensi merevolusi cara bisnis dan pengembang membangun dan menskalakan aplikasi AI.
Berikut tiga versi model Gemini yang dirancang untuk kasus penggunaan berbeda:
- Gemini Ultra: AI terbesar dan tercanggih yang mampu melakukan tugas kompleks.
- GeminiPro: Model seimbang yang memiliki performa dan skalabilitas baik.
- Gemini Nano: Paling efisien untuk perangkat seluler.
Gambar dari Memperkenalkan Gemini
Gemini Ultra memiliki performa canggih, melebihi performa GPT-4 dalam beberapa metrik. Ini adalah model pertama yang mengungguli pakar manusia dalam tolok ukur Pemahaman Bahasa Multitugas Masif, yang menguji pengetahuan dunia dan pemecahan masalah di 57 mata pelajaran yang berbeda. Ini menunjukkan pemahaman tingkat lanjut dan kemampuan pemecahan masalah.
Untuk menggunakan API ini, pertama-tama kita harus mendapatkan kunci API yang dapat Anda peroleh dari sini: https://ai.google.dev/tutorials/setup
Setelah itu klik tombol “Dapatkan kunci API” dan kemudian klik “Buat kunci API di proyek baru”.
Salin kunci API dan atur sebagai variabel lingkungan. Kami menggunakan Deepnote dan cukup mudah bagi kami untuk mengatur kunci dengan nama “GEMINI_API_KEY”. Buka saja integrasi, gulir ke bawah dan pilih variabel lingkungan.
Pada langkah selanjutnya, kita akan menginstal Python API menggunakan PIP:
pip install -q -U google-generativeai
Setelah itu, kami akan menyetel kunci API ke GenAI Google dan memulai instance.
import google.generativeai as genai
import os
gemini_api_key = os.environ["GEMINI_API_KEY"]
genai.configure(api_key = gemini_api_key)
Setelah menyiapkan kunci API, menggunakan model Gemini Pro untuk menghasilkan konten sangatlah mudah. Berikan perintah ke fungsi `generate_content` dan tampilkan output sebagai Markdown.
from IPython.display import Markdown
model = genai.GenerativeModel('gemini-pro')
response = model.generate_content("Who is the GOAT in the NBA?")
Markdown(response.text)
Ini luar biasa, tapi saya tidak setuju dengan daftarnya. Namun, saya memahami bahwa ini semua tentang preferensi pribadi.
Gemini dapat menghasilkan banyak tanggapan, yang disebut kandidat, untuk satu perintah. Anda dapat memilih yang paling sesuai. Dalam kasus kami, kami hanya mempunyai satu tanggapan.
response.candidates
Mari kita minta untuk menulis game sederhana dengan Python.
response = model.generate_content("Build a simple game in Python")
Markdown(response.text)
Hasilnya sederhana dan to the point. Kebanyakan LLM mulai menjelaskan kode Python alih-alih menulisnya.
Anda dapat menyesuaikan respons Anda menggunakan argumen `generasi_config`. Kami membatasi jumlah kandidat menjadi 1, menambahkan kata berhenti “spasi”, dan menyetel token dan suhu maksimal.
response = model.generate_content(
'Write a short story about aliens.',
generation_config=genai.types.GenerationConfig(
candidate_count=1,
stop_sequences=['space'],
max_output_tokens=200,
temperature=0.7)
)
Markdown(response.text)
Seperti yang Anda lihat, responsnya berhenti sebelum kata “spasi”. Luar biasa.
Anda juga dapat menggunakan argumen `stream` untuk mengalirkan respons. Ini mirip dengan API Anthropic dan OpenAI tetapi lebih cepat.
model = genai.GenerativeModel('gemini-pro')
response = model.generate_content("Write a Julia function for cleaning the data.", stream=True)
for chunk in response:
print(chunk.text)
Di bagian ini, kita akan memuat milik Masood Aslami foto dan gunakan untuk menguji multimodalitas Gemini Pro Vision.
Muat gambar ke `PIL` dan tampilkan.
import PIL.Image
img = PIL.Image.open('images/photo-1.jpg')
img
Kami memiliki foto Rua Augusta Arch berkualitas tinggi.
Mari muat model Gemini Pro Vision dan berikan gambarnya.
model = genai.GenerativeModel('gemini-pro-vision')
response = model.generate_content(img)
Markdown(response.text)
Model tersebut secara akurat mengidentifikasi istana dan memberikan informasi tambahan tentang sejarah dan arsitekturnya.
Mari berikan gambar yang sama ke GPT-4 dan tanyakan tentang gambar tersebut. Kedua model memberikan jawaban yang hampir serupa. Tapi saya lebih menyukai respons GPT-4.
Kami sekarang akan menyediakan teks dan gambar ke API. Kami telah meminta model visi untuk menulis blog perjalanan menggunakan gambar sebagai referensi.
response = model.generate_content(["Write a travel blog post using the image as reference.", img])
Markdown(response.text)
Ini telah memberi saya sebuah blog singkat. Saya mengharapkan format yang lebih panjang.
Dibandingkan dengan GPT-4, model Gemini Pro Vision kesulitan menghasilkan blog berformat panjang.
Kita dapat mengatur model untuk melakukan sesi obrolan bolak-balik. Dengan cara ini, model mengingat konteks dan respons menggunakan percakapan sebelumnya.
Dalam kasus kami, kami telah memulai sesi obrolan dan meminta model untuk membantu saya memulai permainan Dota 2.
model = genai.GenerativeModel('gemini-pro')
chat = model.start_chat(history=[])
chat.send_message("Can you please guide me on how to start playing Dota 2?")
chat.history
Seperti yang Anda lihat, objek `obrolan` menyimpan riwayat pengguna dan mode obrolan.
Kami juga dapat menampilkannya dalam gaya Markdown.
for message in chat.history:
display(Markdown(f'**{message.role}**: {message.parts[0].text}'))
Mari kita ajukan pertanyaan lanjutan.
chat.send_message("Which Dota 2 heroes should I start with?")
for message in chat.history:
display(Markdown(f'**{message.role}**: {message.parts[0].text}'))
Kita dapat menggulir ke bawah dan melihat seluruh sesi dengan model tersebut.
Model penyematan menjadi semakin populer untuk aplikasi sadar konteks. Model Gemini embedding-001 memungkinkan kata, kalimat, atau seluruh dokumen direpresentasikan sebagai vektor padat yang menyandikan makna semantik. Representasi vektor ini memudahkan untuk membandingkan kesamaan antara berbagai bagian teks dengan membandingkan vektor penyematannya.
Kami dapat menyediakan konten ke `embed_content` dan mengonversi teks menjadi embeddings. Sesederhana itu.
output = genai.embed_content(
model="models/embedding-001",
content="Can you please guide me on how to start playing Dota 2?",
task_type="retrieval_document",
title="Embedding of Dota 2 question")
print(output['embedding'][0:10])
[0.060604308, -0.023885584, -0.007826327, -0.070592545, 0.021225851, 0.043229062, 0.06876691, 0.049298503, 0.039964676, 0.08291664]
Kita dapat mengonversi beberapa potongan teks menjadi embeddings dengan meneruskan daftar string ke argumen 'konten'.
output = genai.embed_content(
model="models/embedding-001",
content=[
"Can you please guide me on how to start playing Dota 2?",
"Which Dota 2 heroes should I start with?",
],
task_type="retrieval_document",
title="Embedding of Dota 2 question")
for emb in output['embedding']:
print(emb[:10])
[0.060604308, -0.023885584, -0.007826327, -0.070592545, 0.021225851, 0.043229062, 0.06876691, 0.049298503, 0.039964676, 0.08291664]
[0.04775657, -0.044990525, -0.014886052, -0.08473655, 0.04060122, 0.035374347, 0.031866882, 0.071754575, 0.042207796, 0.04577447]
Jika Anda kesulitan mereproduksi hasil yang sama, lihat milik saya Ruang kerja catatan mendalam.
Ada begitu banyak fungsi lanjutan yang tidak kami bahas dalam tutorial pendahuluan ini. Anda dapat mempelajari lebih lanjut tentang Gemini API dengan mengunjungi Gemini API: Mulai cepat dengan Python.
Dalam tutorial ini, kita telah mempelajari tentang Gemini dan cara mengakses API Python untuk menghasilkan respons. Secara khusus, kita telah mempelajari tentang pembuatan teks, pemahaman visual, streaming, riwayat percakapan, keluaran khusus, dan penyematan. Namun, ini hanyalah permukaan dari apa yang bisa dilakukan Gemini.
Jangan ragu untuk berbagi dengan saya apa yang telah Anda buat menggunakan API Gemini gratis. Kemungkinannya tidak terbatas.
Abi Ali Awan (@1abidaliawan) adalah ilmuwan data profesional bersertifikat yang suka membuat model pembelajaran mesin. Saat ini, ia berfokus pada pembuatan konten dan penulisan blog teknis tentang pembelajaran mesin dan teknologi ilmu data. Abid memiliki gelar Magister Manajemen Teknologi dan gelar Sarjana Teknik Telekomunikasi. Visinya adalah untuk membangun produk AI menggunakan jaringan saraf grafik untuk siswa yang berjuang dengan penyakit mental.
- Konten Bertenaga SEO & Distribusi PR. Dapatkan Amplifikasi Hari Ini.
- PlatoData.Jaringan Vertikal Generatif Ai. Berdayakan Diri Anda. Akses Di Sini.
- PlatoAiStream. Intelijen Web3. Pengetahuan Diperkuat. Akses Di Sini.
- PlatoESG. Karbon, teknologi bersih, energi, Lingkungan Hidup, Tenaga surya, Penanganan limbah. Akses Di Sini.
- PlatoHealth. Kecerdasan Uji Coba Biotek dan Klinis. Akses Di Sini.
- Sumber: https://www.kdnuggets.com/how-to-access-and-use-gemini-api-for-free?utm_source=rss&utm_medium=rss&utm_campaign=how-to-access-and-use-gemini-api-for-free
- :memiliki
- :adalah
- $NAIK
- 1
- 10
- 12
- 13
- 14
- 17
- 27
- 7
- 8
- 9
- a
- Tentang Kami
- mengakses
- akurat
- di seluruh
- menambahkan
- Tambahan
- Informasi Tambahan
- maju
- lagi
- AI
- alien
- Semua
- memungkinkan
- hampir
- juga
- menakjubkan
- an
- dan
- jawaban
- Antropik
- api
- Lebah
- aplikasi
- arsitektur
- ADALAH
- argumen
- AS
- meminta
- At
- audio
- seimbang
- BE
- menjadi
- menjadi
- sebelum
- patokan
- antara
- Blog
- blog
- kedua
- membangun
- Bangunan
- dibangun di
- bisnis
- tapi
- tombol
- by
- bernama
- CAN
- calon
- calon
- kemampuan
- mampu
- kasus
- kasus
- Pusat
- Tersertifikasi
- mengobrol
- memeriksa
- Pembersihan
- Klik
- kode
- kolaborasi
- membandingkan
- pembandingan
- kompleks
- Konten
- pembuatan konten
- konteks
- Percakapan
- percakapan
- mengubah
- Sesuai
- menutupi
- penciptaan
- Sekarang
- adat
- menyesuaikan
- data
- Pusat Data
- ilmu data
- ilmuwan data
- Tanggal
- DeepMind
- Derajat
- padat
- dirancang
- dikembangkan
- pengembang
- Devices
- tidak
- berbeda
- Display
- beberapa
- do
- dokumen
- don
- dota
- Dota 2
- turun
- mudah
- Mudah
- efisien
- efisien
- embedding
- Teknik
- Seluruh
- Lingkungan Hidup
- Eter (ETH)
- mengharapkan
- ahli
- Menjelaskan
- menyelidiki
- lebih cepat
- Pertama
- fleksibel
- berfokus
- mengikuti
- Untuk
- format
- Gratis
- dari
- fungsi
- fungsi
- permainan
- Gemini
- menghasilkan
- generasi
- mendapatkan
- gif
- Go
- akan
- baik
- grafik
- Jaringan Saraf Grafik
- membimbing
- memiliki
- Memiliki
- memiliki
- he
- membantu
- di sini
- Pahlawan
- High
- sangat
- -nya
- sejarah
- memegang
- Seterpercayaapakah Olymp Trade? Kesimpulan
- How To
- Namun
- HTTPS
- manusia
- i
- diidentifikasi
- penyakit
- gambar
- gambar
- mengimpor
- in
- Termasuk
- makin
- informasi
- memulai
- install
- contoh
- sebagai gantinya
- integrasi
- ke
- pengantar
- IT
- NYA
- jpg
- julia
- hanya
- KDnugget
- kunci
- pengetahuan
- bahasa
- terbesar
- BELAJAR
- belajar
- pengetahuan
- 'like'
- tak terbatas
- Daftar
- memuat
- lagi
- mencintai
- mesin
- Mesin belajar
- MEMBUAT
- pengelolaan
- banyak
- besar-besaran
- menguasai
- max
- me
- makna
- cara
- mental yang
- Penyakit kejiwaan
- Metrik
- mobil
- telepon genggam
- mode
- model
- model
- lebih
- paling
- beberapa
- nama
- nano
- NBA
- jaringan
- saraf
- saraf jaringan
- New
- berikutnya
- sekarang
- obyek
- of
- on
- ONE
- hanya
- OpenAI
- beroperasi
- or
- OS
- kami
- di luar
- Mengungguli
- keluaran
- Istana
- tertentu
- Lewat
- sempurna
- prestasi
- melakukan
- pribadi
- foto
- potongan-potongan
- plato
- Kecerdasan Data Plato
- Data Plato
- bermain
- silahkan
- Titik
- Populer
- kemungkinan
- mungkin
- Pos
- potensi
- sebelumnya
- per
- Masalah
- pemecahan masalah
- Produk
- profesional
- memberikan
- disediakan
- menyediakan
- Ular sanca
- kualitas
- query
- pertanyaan
- agak
- jarak
- RE
- referensi
- perwakilan
- diwakili
- penelitian
- tanggapan
- tanggapan
- mengakibatkan
- merevolusionerkan
- s
- sama
- penghematan
- Skalabilitas
- Skala
- skala ai
- Ilmu
- ilmuwan
- gulir
- Bagian
- melihat
- memilih
- Sidang
- set
- pengaturan
- beberapa
- Share
- Pendek
- harus
- mirip
- Sederhana
- tunggal
- So
- Memecahkan
- Space
- Secara khusus
- awal
- mulai
- state-of-the-art
- Langkah
- berhenti
- terhenti
- Cerita
- aliran
- Streaming
- Berjuang
- Siswa
- gaya
- cocok
- Permukaan
- sistem
- T
- tugas
- tim
- Teknis
- Teknologi
- Teknologi
- telekomunikasi
- uji
- tes
- teks
- pembuatan teks
- bahwa
- Grafik
- mereka
- Mereka
- kemudian
- ini
- tiga
- Melalui
- untuk
- Token
- perjalanan
- kesulitan
- tutorial
- jenis
- Ultra
- memahami
- pemahaman
- us
- dapat digunakan
- menggunakan
- Pengguna
- menggunakan
- variabel
- berbagai
- Video
- penglihatan
- visual
- adalah
- Cara..
- we
- Apa
- yang
- SIAPA
- lebar
- Rentang luas
- akan
- dengan
- Word
- kata
- Kerja
- dunia
- menulis
- penulisan
- kamu
- Anda
- zephyrnet.dll