How To Access And Use Gemini API For Free - KDnuggets

Ponovno objavil Platon

Spremljevalci: 0

Kako brezplačno dostopati in uporabljati Gemini API
Slika avtorja

Gemini je nov model, ki ga je razvil Google, Bard pa ponovno postaja uporaben. Z Gemini je zdaj mogoče dobiti skoraj popolne odgovore na vaša vprašanja, tako da jim zagotovite slike, zvok in besedilo.

V tej vadnici bomo spoznali Gemini API in kako ga nastaviti na vašem računalniku. Raziskali bomo tudi različne funkcije Python API, vključno z ustvarjanjem besedila in razumevanjem slik.

Gemini je nov model umetne inteligence, razvit s sodelovanjem med ekipami pri Googlu, vključno z Google Research in Google DeepMind. Zgrajen je bil posebej za večmodalnost, kar pomeni, da lahko razume in dela z različnimi vrstami podatkov, kot so besedilo, koda, zvok, slike in video.

Gemini je najnaprednejši in največji model umetne inteligence, ki ga je doslej razvil Google. Zasnovan je bil tako, da je zelo prilagodljiv, tako da lahko učinkovito deluje na številnih sistemih, od podatkovnih centrov do mobilnih naprav. To pomeni, da ima potencial, da spremeni način, kako lahko podjetja in razvijalci gradijo in širijo aplikacije AI.

Tukaj so tri različice modela Gemini, zasnovane za različne primere uporabe:

Gemini Ultra: Največji in najnaprednejši AI, ki je sposoben opravljati kompleksne naloge.
Gemini Pro: Uravnotežen model z dobro zmogljivostjo in razširljivostjo.
Gemini Nano: Najučinkovitejši za mobilne naprave.

Kako brezplačno dostopati in uporabljati Gemini API
Slika iz Predstavljamo Gemini

Gemini Ultra ima najsodobnejšo zmogljivost, ki presega zmogljivost GPT-4 na več meritvah. Je prvi model, ki prekaša človeške strokovnjake na merilu Massive Multitask Language Understanding, ki preizkuša svetovno znanje in reševanje problemov pri 57 različnih temah. To prikazuje njegove napredne sposobnosti razumevanja in reševanja problemov.

Za uporabo API-ja moramo najprej pridobiti ključ API-ja, ki ga lahko najdete tukaj: https://ai.google.dev/tutorials/setup

Kako brezplačno dostopati in uporabljati Gemini API

Nato kliknite gumb »Pridobite ključ API« in nato kliknite »Ustvari ključ API v novem projektu«.

Kako brezplačno dostopati in uporabljati Gemini API

Kopirajte ključ API in ga nastavite kot spremenljivko okolja. Uporabljamo Deepnote in nam je povsem enostavno nastaviti ključ z imenom “GEMINI_API_KEY”. Samo pojdite na integracijo, se pomaknite navzdol in izberite spremenljivke okolja.

Kako brezplačno dostopati in uporabljati Gemini API

V naslednjem koraku bomo namestili Python API z uporabo PIP:

pip install -q -U google-generativeai

Po tem bomo nastavili ključ API na Googlov GenAI in sprožili primerek.

import google.generativeai as genai
import os

gemini_api_key = os.environ["GEMINI_API_KEY"]
genai.configure(api_key = gemini_api_key)

Po nastavitvi ključa API je uporaba modela Gemini Pro za ustvarjanje vsebine preprosta. Zagotovite poziv funkciji `generate_content` in prikažite izhod kot Markdown.

from IPython.display import Markdown

model = genai.GenerativeModel('gemini-pro')
response = model.generate_content("Who is the GOAT in the NBA?")

Markdown(response.text)

To je neverjetno, vendar se ne strinjam s seznamom. Vendar razumem, da je vse odvisno od osebnih preferenc.

Kako brezplačno dostopati in uporabljati Gemini API

Gemini lahko ustvari več odgovorov, imenovanih kandidati, za en sam poziv. Izberete lahko najprimernejšega. V našem primeru smo imeli samo en odgovor.

response.candidates

Kako brezplačno dostopati in uporabljati Gemini API

Prosimo ga, naj napiše preprosto igro v Pythonu.

response = model.generate_content("Build a simple game in Python")

Markdown(response.text)

Rezultat je preprost in bistven. Večina LLM začne razlagati kodo Python, namesto da bi jo napisala.

Kako brezplačno dostopati in uporabljati Gemini API

Svoj odgovor lahko prilagodite z uporabo argumenta `generation_config`. Omejili smo število kandidatov na 1, dodali zaustavitveno besedo »presledek« in nastavili največje število žetonov in temperaturo.

response = model.generate_content(
    'Write a short story about aliens.',
    generation_config=genai.types.GenerationConfig(
        candidate_count=1,
        stop_sequences=['space'],
        max_output_tokens=200,
        temperature=0.7)
)

Markdown(response.text)

Kot lahko vidite, se je odgovor ustavil pred besedo "prostor". Neverjetno.

Kako brezplačno dostopati in uporabljati Gemini API

Za pretakanje odgovora lahko uporabite tudi argument `tok`. Podoben je API-jem Anthropic in OpenAI, vendar hitrejši.

model = genai.GenerativeModel('gemini-pro')
response = model.generate_content("Write a Julia function for cleaning the data.", stream=True)

for chunk in response:
    print(chunk.text)

Kako brezplačno dostopati in uporabljati Gemini API

V tem razdelku bomo naložili Masooda Aslamija fotografijo in jo uporabite za preizkus multimodalnosti Gemini Pro Vision.

Naložite slike v `PIL` in jih prikažite.

import PIL.Image

img = PIL.Image.open('images/photo-1.jpg')

img

Imamo visoko kakovostno fotografijo Rua Augusta Arch.

Kako brezplačno dostopati in uporabljati Gemini API

Naložimo model Gemini Pro Vision in mu priskrbimo sliko.

model = genai.GenerativeModel('gemini-pro-vision')

response = model.generate_content(img)

Markdown(response.text)

Model je natančno identificiral palačo in zagotovil dodatne informacije o njeni zgodovini in arhitekturi.

Kako brezplačno dostopati in uporabljati Gemini API

Posredujmo isto sliko GPT-4 in ga vprašajmo o sliki. Oba modela sta dala skoraj podobne odgovore. Vendar mi je bolj všeč odgovor GPT-4.

Kako brezplačno dostopati in uporabljati Gemini API

Zdaj bomo API-ju zagotovili besedilo in sliko. Model vizije smo prosili, naj napiše popotniški blog, pri čemer uporabi sliko kot referenco.

response = model.generate_content(["Write a travel blog post using the image as reference.", img])

Markdown(response.text)

Zagotovil mi je kratek blog. Pričakoval sem daljši format.

Kako brezplačno dostopati in uporabljati Gemini API

V primerjavi z GPT-4 se model Gemini Pro Vision trudi ustvariti blog dolgega formata.

Kako brezplačno dostopati in uporabljati Gemini API

Model lahko nastavimo tako, da ima klepet naprej in nazaj. Na ta način si model zapomni kontekst in odziv na podlagi prejšnjih pogovorov.

V našem primeru smo začeli klepet in prosili modela, da mi pomaga začeti z igro Dota 2.

model = genai.GenerativeModel('gemini-pro')

chat = model.start_chat(history=[])

chat.send_message("Can you please guide me on how to start playing Dota 2?")

chat.history

Kot lahko vidite, objekt `chat` shranjuje zgodovino uporabnika in načina klepeta.

Kako brezplačno dostopati in uporabljati Gemini API

Kako brezplačno dostopati in uporabljati Gemini API

Lahko jih prikažemo tudi v slogu Markdown.

for message in chat.history:
    display(Markdown(f'**{message.role}**: {message.parts[0].text}'))

Kako brezplačno dostopati in uporabljati Gemini API

Postavimo nadaljnje vprašanje.

chat.send_message("Which Dota 2 heroes should I start with?")

for message in chat.history:
    display(Markdown(f'**{message.role}**: {message.parts[0].text}'))

Lahko se pomaknemo navzdol in si ogledamo celotno sejo z modelom.

Kako brezplačno dostopati in uporabljati Gemini API

Modeli vdelave postajajo vse bolj priljubljeni za aplikacije, ki se zavedajo konteksta. Model Gemini embedding-001 omogoča, da so besede, stavke ali celotni dokumenti predstavljeni kot zgoščeni vektorji, ki kodirajo semantični pomen. Ta vektorska predstavitev omogoča preprosto primerjavo podobnosti med različnimi deli besedila s primerjavo njihovih ustreznih vdelanih vektorjev.

Vsebino lahko zagotovimo v `embed_content` in besedilo pretvorimo v vdelave. Tako preprosto je.

output = genai.embed_content(
    model="models/embedding-001",
    content="Can you please guide me on how to start playing Dota 2?",
    task_type="retrieval_document",
    title="Embedding of Dota 2 question")

print(output['embedding'][0:10])

[0.060604308, -0.023885584, -0.007826327, -0.070592545, 0.021225851, 0.043229062, 0.06876691, 0.049298503, 0.039964676, 0.08291664]

Več delov besedila lahko pretvorimo v vdelane tako, da argumentu »vsebina« posredujemo seznam nizov.

output = genai.embed_content(
    model="models/embedding-001",
    content=[
        "Can you please guide me on how to start playing Dota 2?",
        "Which Dota 2 heroes should I start with?",
    ],
    task_type="retrieval_document",
    title="Embedding of Dota 2 question")

for emb in output['embedding']:
    print(emb[:10])

[0.060604308, -0.023885584, -0.007826327, -0.070592545, 0.021225851, 0.043229062, 0.06876691, 0.049298503, 0.039964676, 0.08291664]

[0.04775657, -0.044990525, -0.014886052, -0.08473655, 0.04060122, 0.035374347, 0.031866882, 0.071754575, 0.042207796, 0.04577447]

Če imate težave z reprodukcijo istega rezultata, si oglejte mojo Delovni prostor Deepnote.

Obstaja toliko naprednih funkcij, ki jih nismo obravnavali v tej uvodni vadnici. Več o API-ju Gemini lahko izveste na Gemini API: hiter začetek s Pythonom.

V tej vadnici smo se naučili o Gemini in kako dostopati do API-ja Python za ustvarjanje odgovorov. Zlasti smo se naučili ustvarjanja besedila, vizualnega razumevanja, pretakanja, zgodovine pogovorov, izpisa po meri in vdelav. Vendar pa je to samo praska po površini tega, kar Dvojčka lahko naredita.

Z mano lahko delite, kaj ste zgradili z brezplačnim API-jem Gemini. Možnosti so neomejene.

Abid Ali Awan (@1abidaliawan) je certificiran strokovnjak za podatkovne znanstvenike, ki rad gradi modele strojnega učenja. Trenutno se osredotoča na ustvarjanje vsebin in pisanje tehničnih blogov o strojnem učenju in tehnologijah podatkovne znanosti. Abid ima magisterij iz tehnološkega managementa in diplomo iz telekomunikacijskega inženiringa. Njegova vizija je zgraditi izdelek AI z uporabo grafične nevronske mreže za študente, ki se borijo z duševnimi boleznimi.