Kuidas Gemini API-le tasuta juurde pääseda ja seda kasutada – KDnuggets

Kuidas Gemini API-le tasuta juurde pääseda ja seda kasutada – KDnuggets

Allikasõlm: 3033824

Kuidas Gemini API-le tasuta juurde pääseda ja seda kasutada
Pilt autorilt 

Gemini on Google'i välja töötatud uus mudel ja Bard on taas kasutuskõlblikuks muutumas. Kaksikute abil on nüüd võimalik saada peaaegu täiuslikke vastuseid oma päringutele, pakkudes neile pilte, heli ja teksti.

Selles õpetuses õpime tundma Gemini API-t ja seda, kuidas seda oma masinas seadistada. Samuti uurime erinevaid Pythoni API funktsioone, sealhulgas teksti genereerimist ja piltide mõistmist.

Kaksikud on uus tehisintellekti mudel, mis on välja töötatud Google'i meeskondade, sealhulgas Google Researchi ja Google DeepMindi koostöös. See loodi spetsiaalselt multimodaalseks, mis tähendab, et see suudab mõista ja töötada erinevat tüüpi andmetega, nagu tekst, kood, heli, pildid ja video.

Gemini on Google'i seni kõige arenenum ja suurim tehisintellekti mudel. See on loodud väga paindlikuks, et see saaks tõhusalt töötada paljudes süsteemides andmekeskustest mobiilseadmeteni. See tähendab, et see võib muuta viisi, kuidas ettevõtted ja arendajad saavad AI-rakendusi luua ja skaleerida.

Siin on Gemini mudeli kolm versiooni, mis on mõeldud erinevateks kasutusjuhtudeks:

  • Gemini Ultra: Suurim ja arenenum AI, mis suudab täita keerulisi ülesandeid.
  • Gemini Pro: Tasakaalustatud mudel, millel on hea jõudlus ja mastaapsus.
  • Gemini Nano: Kõige tõhusam mobiilseadmete jaoks.

 

Kuidas Gemini API-le tasuta juurde pääseda ja seda kasutada
Pilt Tutvustame Kaksikud
 

Gemini Ultra on tipptasemel jõudlusega, ületades GPT-4 jõudlust mitmete näitajate poolest. See on esimene mudel, mis ületab inimeste eksperte massilise multitegumkeele mõistmise etalonil, mis testib maailmateadmisi ja probleemide lahendamist 57 erineval teemal. See näitab selle täiustatud mõistmist ja probleemide lahendamise võimeid.

API kasutamiseks peame esmalt hankima API võtme, mille saate siit: https://ai.google.dev/tutorials/setup

 
Kuidas Gemini API-le tasuta juurde pääseda ja seda kasutada

Kuidas Gemini API-le tasuta juurde pääseda ja seda kasutada
 

Pärast seda klõpsake nuppu "Hangi API võti" ja seejärel "Loo uues projektis API võti".

 
Kuidas Gemini API-le tasuta juurde pääseda ja seda kasutada

Kuidas Gemini API-le tasuta juurde pääseda ja seda kasutada
 

Kopeerige API võti ja määrake see keskkonnamuutujaks. Me kasutame Deepnote'i ja meil on üsna lihtne määrata võtit nimega “GEMINI_API_KEY”. Minge lihtsalt integratsiooni juurde, kerige alla ja valige keskkonnamuutujad.

 
Kuidas Gemini API-le tasuta juurde pääseda ja seda kasutada

Kuidas Gemini API-le tasuta juurde pääseda ja seda kasutada
 

Järgmises etapis installime Pythoni API, kasutades PIP-i:

pip install -q -U google-generativeai

Pärast seda seame API võtme Google'i GenAI-le ja käivitame eksemplari.

import google.generativeai as genai
import os

gemini_api_key = os.environ["GEMINI_API_KEY"]
genai.configure(api_key = gemini_api_key)

Pärast API võtme seadistamist on Gemini Pro mudeli kasutamine sisu loomiseks lihtne. Esitage viip funktsioonile "generate_content" ja kuvage väljund märgistusena.

from IPython.display import Markdown

model = genai.GenerativeModel('gemini-pro')
response = model.generate_content("Who is the GOAT in the NBA?")

Markdown(response.text)

See on hämmastav, kuid ma ei nõustu nimekirjaga. Samas saan aru, et kõik sõltub isiklikest eelistustest.

 
Kuidas Gemini API-le tasuta juurde pääseda ja seda kasutada

Kuidas Gemini API-le tasuta juurde pääseda ja seda kasutada
 

Kaksikud võivad ühe viipa jaoks genereerida mitu vastust, mida nimetatakse kandidaatideks. Saate valida sobivaima. Meie puhul oli meil ainult üks vastus.

response.candidates

Kuidas Gemini API-le tasuta juurde pääseda ja seda kasutada

Kuidas Gemini API-le tasuta juurde pääseda ja seda kasutada
 

Paluge tal kirjutada Pythonis lihtne mäng.

response = model.generate_content("Build a simple game in Python")

Markdown(response.text)

Tulemus on lihtne ja asjakohane. Enamik LLM-e hakkab Pythoni koodi kirjutamise asemel seletama.

Kuidas Gemini API-le tasuta juurde pääseda ja seda kasutada

Kuidas Gemini API-le tasuta juurde pääseda ja seda kasutada

Saate kohandada oma vastust argumendi generation_config abil. Piirame kandidaatide arvu 1-ni, lisame stoppsõna „ruum” ning määrame maksimaalsed märgid ja temperatuuri.

response = model.generate_content(
    'Write a short story about aliens.',
    generation_config=genai.types.GenerationConfig(
        candidate_count=1,
        stop_sequences=['space'],
        max_output_tokens=200,
        temperature=0.7)
)

Markdown(response.text)

Nagu näete, peatus vastus sõna "ruum" ees. Hämmastav.

 
Kuidas Gemini API-le tasuta juurde pääseda ja seda kasutada

Kuidas Gemini API-le tasuta juurde pääseda ja seda kasutada

Vastuse voogesitamiseks võite kasutada ka argumenti "voog". See sarnaneb Anthropic ja OpenAI API-dele, kuid kiirem.

model = genai.GenerativeModel('gemini-pro')
response = model.generate_content("Write a Julia function for cleaning the data.", stream=True)

for chunk in response:
    print(chunk.text)

Kuidas Gemini API-le tasuta juurde pääseda ja seda kasutada

Kuidas Gemini API-le tasuta juurde pääseda ja seda kasutada

Selles jaotises laadime Masood Aslami oma foto ja kasutage seda Gemini Pro Visioni multimodaalsuse testimiseks.

Laadige pildid "PIL-i" ja kuvage see.

import PIL.Image

img = PIL.Image.open('images/photo-1.jpg')

img

Meil on kvaliteetne foto Rua Augusta Archist.

 
Kuidas Gemini API-le tasuta juurde pääseda ja seda kasutada

Kuidas Gemini API-le tasuta juurde pääseda ja seda kasutada
 

Laadime Gemini Pro Visioni mudeli ja varustame selle pildiga.

model = genai.GenerativeModel('gemini-pro-vision')

response = model.generate_content(img)

Markdown(response.text)

Mudel tuvastas palee täpselt ja andis lisateavet selle ajaloo ja arhitektuuri kohta.

 
Kuidas Gemini API-le tasuta juurde pääseda ja seda kasutada

Kuidas Gemini API-le tasuta juurde pääseda ja seda kasutada
 

Esitame sama pildi GPT-4-le ja küsime selle pildi kohta. Mõlemad mudelid on andnud peaaegu sarnase vastuse. Kuid mulle meeldib GPT-4 vastus rohkem.

 
Kuidas Gemini API-le tasuta juurde pääseda ja seda kasutada

Kuidas Gemini API-le tasuta juurde pääseda ja seda kasutada
 

Nüüd anname API-le teksti ja pildi. Oleme palunud visioonimudelil kirjutada reisiblogi, kasutades pilti viitena.

response = model.generate_content(["Write a travel blog post using the image as reference.", img])

Markdown(response.text)

See on andnud mulle lühikese ajaveebi. Ootasin pikemat formaati.

 
Kuidas Gemini API-le tasuta juurde pääseda ja seda kasutada

Kuidas Gemini API-le tasuta juurde pääseda ja seda kasutada
 

Võrreldes GPT-4-ga on Gemini Pro Visioni mudelil pika vorminguga ajaveebi loomisel olnud raskusi.

 
Kuidas Gemini API-le tasuta juurde pääseda ja seda kasutada

Kuidas Gemini API-le tasuta juurde pääseda ja seda kasutada

Saame seadistada mudeli edasi-tagasi vestlusseansi jaoks. Nii jätab mudel eelmiste vestluste põhjal konteksti ja vastuse meelde.

Meie puhul oleme alustanud vestlusseanssi ja palunud modellil aidata mul Dota 2 mänguga alustada.

model = genai.GenerativeModel('gemini-pro')

chat = model.start_chat(history=[])

chat.send_message("Can you please guide me on how to start playing Dota 2?")

chat.history

Nagu näete, salvestab vestlusobjekt kasutaja ja vestlusrežiimi ajalugu.

 
Kuidas Gemini API-le tasuta juurde pääseda ja seda kasutada

Kuidas Gemini API-le tasuta juurde pääseda ja seda kasutada
 
Saame neid kuvada ka Markdowni stiilis.

for message in chat.history:
    display(Markdown(f'**{message.role}**: {message.parts[0].text}'))

Kuidas Gemini API-le tasuta juurde pääseda ja seda kasutada

Kuidas Gemini API-le tasuta juurde pääseda ja seda kasutada
 

Esitagem järelküsimus.

chat.send_message("Which Dota 2 heroes should I start with?")

for message in chat.history:
    display(Markdown(f'**{message.role}**: {message.parts[0].text}'))

Saame kerida alla ja näha kogu mudeli seanssi.

 
Kuidas Gemini API-le tasuta juurde pääseda ja seda kasutada

Kuidas Gemini API-le tasuta juurde pääseda ja seda kasutada

Manusmudelid muutuvad kontekstiteadlike rakenduste jaoks üha populaarsemaks. Gemini embedding-001 mudel võimaldab sõnu, lauseid või terveid dokumente esitada tihedate vektoritena, mis kodeerivad semantilist tähendust. See vektoresitus võimaldab hõlpsasti võrrelda erinevate tekstiosade sarnasust, võrreldes nende vastavaid manustamisvektoreid.

Saame anda sisu 'embed_content' ja teisendada teksti manusteks. Nii lihtne see ongi.

output = genai.embed_content(
    model="models/embedding-001",
    content="Can you please guide me on how to start playing Dota 2?",
    task_type="retrieval_document",
    title="Embedding of Dota 2 question")

print(output['embedding'][0:10])
[0.060604308, -0.023885584, -0.007826327, -0.070592545, 0.021225851, 0.043229062, 0.06876691, 0.049298503, 0.039964676, 0.08291664]

Saame teisendada mitu tekstijuppi manusteks, edastades stringide loendi argumendile "sisu".

output = genai.embed_content(
    model="models/embedding-001",
    content=[
        "Can you please guide me on how to start playing Dota 2?",
        "Which Dota 2 heroes should I start with?",
    ],
    task_type="retrieval_document",
    title="Embedding of Dota 2 question")

for emb in output['embedding']:
    print(emb[:10])
[0.060604308, -0.023885584, -0.007826327, -0.070592545, 0.021225851, 0.043229062, 0.06876691, 0.049298503, 0.039964676, 0.08291664]

[0.04775657, -0.044990525, -0.014886052, -0.08473655, 0.04060122, 0.035374347, 0.031866882, 0.071754575, 0.042207796, 0.04577447]

Kui teil on sama tulemuse taasesitamisel probleeme, vaadake minu lehte Deepnote tööruum.

Seal on nii palju täiustatud funktsioone, mida me selles sissejuhatavas õpetuses ei käsitlenud. Gemini API kohta saate lisateavet, kui külastate Gemini API: Pythoni kiirkäivitus.

Selles õpetuses oleme õppinud tundma Gemini ja kuidas pääseda ligi Pythoni API-le vastuste genereerimiseks. Eelkõige oleme õppinud tundma teksti genereerimist, visuaalset mõistmist, voogesitust, vestluste ajalugu, kohandatud väljundit ja manustamist. See aga kriibib vaid pinda, mida Kaksikud suudavad.

Jagage minuga, mida olete tasuta Gemini API abil loonud. Võimalused on piiramatud.

 
 

Abid Ali Awan (@1abidaliawan) on sertifitseeritud andmeteadlase professionaal, kes armastab masinõppemudelite loomist. Praegu keskendub ta sisu loomisele ning tehniliste ajaveebide kirjutamisele masinõppe ja andmeteaduse tehnoloogiate kohta. Abid on omandanud magistrikraadi tehnoloogiajuhtimises ja bakalaureusekraadi telekommunikatsioonitehnikas. Tema visioon on luua graafilise närvivõrgu abil tehisintellekti toode vaimuhaigustega võitlevatele õpilastele.

Ajatempel:

Veel alates KDnuggets