Cara Mengakses Dan Menggunakan API Gemini Secara Gratis - KDnuggets

Diterbitkan Ulang Oleh Plato

Followers: 0

Cara Mengakses dan Menggunakan API Gemini Gratis
Gambar oleh Penulis

Gemini adalah model baru yang dikembangkan oleh Google, dan Bard dapat digunakan kembali. Dengan Gemini, sekarang Anda bisa mendapatkan jawaban yang hampir sempurna atas pertanyaan Anda dengan menyediakan gambar, audio, dan teks.

Dalam tutorial ini, kita akan belajar tentang Gemini API dan cara mengaturnya di mesin Anda. Kami juga akan mengeksplorasi berbagai fungsi Python API, termasuk pembuatan teks dan pemahaman gambar.

Gemini adalah model AI baru yang dikembangkan melalui kolaborasi antar tim di Google, termasuk Google Research dan Google DeepMind. Itu dibuat secara khusus untuk menjadi multimodal, artinya dapat memahami dan bekerja dengan berbagai jenis data seperti teks, kode, audio, gambar, dan video.

Gemini merupakan model AI tercanggih dan terbesar yang dikembangkan Google hingga saat ini. Ini telah dirancang agar sangat fleksibel sehingga dapat beroperasi secara efisien pada berbagai sistem, mulai dari pusat data hingga perangkat seluler. Artinya, hal ini berpotensi merevolusi cara bisnis dan pengembang membangun dan menskalakan aplikasi AI.

Berikut tiga versi model Gemini yang dirancang untuk kasus penggunaan berbeda:

Gemini Ultra: AI terbesar dan tercanggih yang mampu melakukan tugas kompleks.
GeminiPro: Model seimbang yang memiliki performa dan skalabilitas baik.
Gemini Nano: Paling efisien untuk perangkat seluler.

Cara Mengakses dan Menggunakan API Gemini Gratis
Gambar dari Memperkenalkan Gemini

Gemini Ultra memiliki performa canggih, melebihi performa GPT-4 dalam beberapa metrik. Ini adalah model pertama yang mengungguli pakar manusia dalam tolok ukur Pemahaman Bahasa Multitugas Masif, yang menguji pengetahuan dunia dan pemecahan masalah di 57 mata pelajaran yang berbeda. Ini menunjukkan pemahaman tingkat lanjut dan kemampuan pemecahan masalah.

Untuk menggunakan API ini, pertama-tama kita harus mendapatkan kunci API yang dapat Anda peroleh dari sini: https://ai.google.dev/tutorials/setup

Cara Mengakses dan Menggunakan API Gemini Gratis

Setelah itu klik tombol “Dapatkan kunci API” dan kemudian klik “Buat kunci API di proyek baru”.

Cara Mengakses dan Menggunakan API Gemini Gratis

Salin kunci API dan atur sebagai variabel lingkungan. Kami menggunakan Deepnote dan cukup mudah bagi kami untuk mengatur kunci dengan nama “GEMINI_API_KEY”. Buka saja integrasi, gulir ke bawah dan pilih variabel lingkungan.

Cara Mengakses dan Menggunakan API Gemini Gratis

Pada langkah selanjutnya, kita akan menginstal Python API menggunakan PIP:

pip install -q -U google-generativeai

Setelah itu, kami akan menyetel kunci API ke GenAI Google dan memulai instance.

import google.generativeai as genai
import os

gemini_api_key = os.environ["GEMINI_API_KEY"]
genai.configure(api_key = gemini_api_key)

Setelah menyiapkan kunci API, menggunakan model Gemini Pro untuk menghasilkan konten sangatlah mudah. Berikan perintah ke fungsi `generate_content` dan tampilkan output sebagai Markdown.

from IPython.display import Markdown

model = genai.GenerativeModel('gemini-pro')
response = model.generate_content("Who is the GOAT in the NBA?")

Markdown(response.text)

Ini luar biasa, tapi saya tidak setuju dengan daftarnya. Namun, saya memahami bahwa ini semua tentang preferensi pribadi.

Cara Mengakses dan Menggunakan API Gemini Gratis

Gemini dapat menghasilkan banyak tanggapan, yang disebut kandidat, untuk satu perintah. Anda dapat memilih yang paling sesuai. Dalam kasus kami, kami hanya mempunyai satu tanggapan.

response.candidates

Cara Mengakses dan Menggunakan API Gemini Gratis

Mari kita minta untuk menulis game sederhana dengan Python.

response = model.generate_content("Build a simple game in Python")

Markdown(response.text)

Hasilnya sederhana dan to the point. Kebanyakan LLM mulai menjelaskan kode Python alih-alih menulisnya.

Cara Mengakses dan Menggunakan API Gemini Gratis

Anda dapat menyesuaikan respons Anda menggunakan argumen `generasi_config`. Kami membatasi jumlah kandidat menjadi 1, menambahkan kata berhenti “spasi”, dan menyetel token dan suhu maksimal.

response = model.generate_content(
    'Write a short story about aliens.',
    generation_config=genai.types.GenerationConfig(
        candidate_count=1,
        stop_sequences=['space'],
        max_output_tokens=200,
        temperature=0.7)
)

Markdown(response.text)

Seperti yang Anda lihat, responsnya berhenti sebelum kata “spasi”. Luar biasa.

Cara Mengakses dan Menggunakan API Gemini Gratis

Anda juga dapat menggunakan argumen `stream` untuk mengalirkan respons. Ini mirip dengan API Anthropic dan OpenAI tetapi lebih cepat.

model = genai.GenerativeModel('gemini-pro')
response = model.generate_content("Write a Julia function for cleaning the data.", stream=True)

for chunk in response:
    print(chunk.text)

Cara Mengakses dan Menggunakan API Gemini Gratis

Di bagian ini, kita akan memuat milik Masood Aslami foto dan gunakan untuk menguji multimodalitas Gemini Pro Vision.

Muat gambar ke `PIL` dan tampilkan.

import PIL.Image

img = PIL.Image.open('images/photo-1.jpg')

img

Kami memiliki foto Rua Augusta Arch berkualitas tinggi.

Cara Mengakses dan Menggunakan API Gemini Gratis

Mari muat model Gemini Pro Vision dan berikan gambarnya.

model = genai.GenerativeModel('gemini-pro-vision')

response = model.generate_content(img)

Markdown(response.text)

Model tersebut secara akurat mengidentifikasi istana dan memberikan informasi tambahan tentang sejarah dan arsitekturnya.

Cara Mengakses dan Menggunakan API Gemini Gratis

Mari berikan gambar yang sama ke GPT-4 dan tanyakan tentang gambar tersebut. Kedua model memberikan jawaban yang hampir serupa. Tapi saya lebih menyukai respons GPT-4.

Cara Mengakses dan Menggunakan API Gemini Gratis

Kami sekarang akan menyediakan teks dan gambar ke API. Kami telah meminta model visi untuk menulis blog perjalanan menggunakan gambar sebagai referensi.

response = model.generate_content(["Write a travel blog post using the image as reference.", img])

Markdown(response.text)

Ini telah memberi saya sebuah blog singkat. Saya mengharapkan format yang lebih panjang.

Cara Mengakses dan Menggunakan API Gemini Gratis

Dibandingkan dengan GPT-4, model Gemini Pro Vision kesulitan menghasilkan blog berformat panjang.

Cara Mengakses dan Menggunakan API Gemini Gratis

Kita dapat mengatur model untuk melakukan sesi obrolan bolak-balik. Dengan cara ini, model mengingat konteks dan respons menggunakan percakapan sebelumnya.

Dalam kasus kami, kami telah memulai sesi obrolan dan meminta model untuk membantu saya memulai permainan Dota 2.

model = genai.GenerativeModel('gemini-pro')

chat = model.start_chat(history=[])

chat.send_message("Can you please guide me on how to start playing Dota 2?")

chat.history

Seperti yang Anda lihat, objek `obrolan` menyimpan riwayat pengguna dan mode obrolan.

Cara Mengakses dan Menggunakan API Gemini Gratis

Cara Mengakses dan Menggunakan API Gemini Gratis

Kami juga dapat menampilkannya dalam gaya Markdown.

for message in chat.history:
    display(Markdown(f'**{message.role}**: {message.parts[0].text}'))

Cara Mengakses dan Menggunakan API Gemini Gratis

Mari kita ajukan pertanyaan lanjutan.

chat.send_message("Which Dota 2 heroes should I start with?")

for message in chat.history:
    display(Markdown(f'**{message.role}**: {message.parts[0].text}'))

Kita dapat menggulir ke bawah dan melihat seluruh sesi dengan model tersebut.

Cara Mengakses dan Menggunakan API Gemini Gratis

Model penyematan menjadi semakin populer untuk aplikasi sadar konteks. Model Gemini embedding-001 memungkinkan kata, kalimat, atau seluruh dokumen direpresentasikan sebagai vektor padat yang menyandikan makna semantik. Representasi vektor ini memudahkan untuk membandingkan kesamaan antara berbagai bagian teks dengan membandingkan vektor penyematannya.

Kami dapat menyediakan konten ke `embed_content` dan mengonversi teks menjadi embeddings. Sesederhana itu.

output = genai.embed_content(
    model="models/embedding-001",
    content="Can you please guide me on how to start playing Dota 2?",
    task_type="retrieval_document",
    title="Embedding of Dota 2 question")

print(output['embedding'][0:10])

[0.060604308, -0.023885584, -0.007826327, -0.070592545, 0.021225851, 0.043229062, 0.06876691, 0.049298503, 0.039964676, 0.08291664]

Kita dapat mengonversi beberapa potongan teks menjadi embeddings dengan meneruskan daftar string ke argumen 'konten'.

output = genai.embed_content(
    model="models/embedding-001",
    content=[
        "Can you please guide me on how to start playing Dota 2?",
        "Which Dota 2 heroes should I start with?",
    ],
    task_type="retrieval_document",
    title="Embedding of Dota 2 question")

for emb in output['embedding']:
    print(emb[:10])

[0.060604308, -0.023885584, -0.007826327, -0.070592545, 0.021225851, 0.043229062, 0.06876691, 0.049298503, 0.039964676, 0.08291664]

[0.04775657, -0.044990525, -0.014886052, -0.08473655, 0.04060122, 0.035374347, 0.031866882, 0.071754575, 0.042207796, 0.04577447]

Jika Anda kesulitan mereproduksi hasil yang sama, lihat milik saya Ruang kerja catatan mendalam.

Ada begitu banyak fungsi lanjutan yang tidak kami bahas dalam tutorial pendahuluan ini. Anda dapat mempelajari lebih lanjut tentang Gemini API dengan mengunjungi Gemini API: Mulai cepat dengan Python.

Dalam tutorial ini, kita telah mempelajari tentang Gemini dan cara mengakses API Python untuk menghasilkan respons. Secara khusus, kita telah mempelajari tentang pembuatan teks, pemahaman visual, streaming, riwayat percakapan, keluaran khusus, dan penyematan. Namun, ini hanyalah permukaan dari apa yang bisa dilakukan Gemini.

Jangan ragu untuk berbagi dengan saya apa yang telah Anda buat menggunakan API Gemini gratis. Kemungkinannya tidak terbatas.

Abi Ali Awan (@1abidaliawan) adalah ilmuwan data profesional bersertifikat yang suka membuat model pembelajaran mesin. Saat ini, ia berfokus pada pembuatan konten dan penulisan blog teknis tentang pembelajaran mesin dan teknologi ilmu data. Abid memiliki gelar Magister Manajemen Teknologi dan gelar Sarjana Teknik Telekomunikasi. Visinya adalah untuk membangun produk AI menggunakan jaringan saraf grafik untuk siswa yang berjuang dengan penyakit mental.