Slika avtorja
Gemini je nov model, ki ga je razvil Google, Bard pa ponovno postaja uporaben. Z Gemini je zdaj mogoče dobiti skoraj popolne odgovore na vaša vprašanja, tako da jim zagotovite slike, zvok in besedilo.
V tej vadnici bomo spoznali Gemini API in kako ga nastaviti na vašem računalniku. Raziskali bomo tudi različne funkcije Python API, vključno z ustvarjanjem besedila in razumevanjem slik.
Gemini je nov model umetne inteligence, razvit s sodelovanjem med ekipami pri Googlu, vključno z Google Research in Google DeepMind. Zgrajen je bil posebej za večmodalnost, kar pomeni, da lahko razume in dela z različnimi vrstami podatkov, kot so besedilo, koda, zvok, slike in video.
Gemini je najnaprednejši in največji model umetne inteligence, ki ga je doslej razvil Google. Zasnovan je bil tako, da je zelo prilagodljiv, tako da lahko učinkovito deluje na številnih sistemih, od podatkovnih centrov do mobilnih naprav. To pomeni, da ima potencial, da spremeni način, kako lahko podjetja in razvijalci gradijo in širijo aplikacije AI.
Tukaj so tri različice modela Gemini, zasnovane za različne primere uporabe:
- Gemini Ultra: Največji in najnaprednejši AI, ki je sposoben opravljati kompleksne naloge.
- Gemini Pro: Uravnotežen model z dobro zmogljivostjo in razširljivostjo.
- Gemini Nano: Najučinkovitejši za mobilne naprave.
Slika iz Predstavljamo Gemini
Gemini Ultra ima najsodobnejšo zmogljivost, ki presega zmogljivost GPT-4 na več meritvah. Je prvi model, ki prekaša človeške strokovnjake na merilu Massive Multitask Language Understanding, ki preizkuša svetovno znanje in reševanje problemov pri 57 različnih temah. To prikazuje njegove napredne sposobnosti razumevanja in reševanja problemov.
Za uporabo API-ja moramo najprej pridobiti ključ API-ja, ki ga lahko najdete tukaj: https://ai.google.dev/tutorials/setup
Nato kliknite gumb »Pridobite ključ API« in nato kliknite »Ustvari ključ API v novem projektu«.
Kopirajte ključ API in ga nastavite kot spremenljivko okolja. Uporabljamo Deepnote in nam je povsem enostavno nastaviti ključ z imenom “GEMINI_API_KEY”. Samo pojdite na integracijo, se pomaknite navzdol in izberite spremenljivke okolja.
V naslednjem koraku bomo namestili Python API z uporabo PIP:
pip install -q -U google-generativeai
Po tem bomo nastavili ključ API na Googlov GenAI in sprožili primerek.
import google.generativeai as genai
import os
gemini_api_key = os.environ["GEMINI_API_KEY"]
genai.configure(api_key = gemini_api_key)
Po nastavitvi ključa API je uporaba modela Gemini Pro za ustvarjanje vsebine preprosta. Zagotovite poziv funkciji `generate_content` in prikažite izhod kot Markdown.
from IPython.display import Markdown
model = genai.GenerativeModel('gemini-pro')
response = model.generate_content("Who is the GOAT in the NBA?")
Markdown(response.text)
To je neverjetno, vendar se ne strinjam s seznamom. Vendar razumem, da je vse odvisno od osebnih preferenc.
Gemini lahko ustvari več odgovorov, imenovanih kandidati, za en sam poziv. Izberete lahko najprimernejšega. V našem primeru smo imeli samo en odgovor.
response.candidates
Prosimo ga, naj napiše preprosto igro v Pythonu.
response = model.generate_content("Build a simple game in Python")
Markdown(response.text)
Rezultat je preprost in bistven. Večina LLM začne razlagati kodo Python, namesto da bi jo napisala.
Svoj odgovor lahko prilagodite z uporabo argumenta `generation_config`. Omejili smo število kandidatov na 1, dodali zaustavitveno besedo »presledek« in nastavili največje število žetonov in temperaturo.
response = model.generate_content(
'Write a short story about aliens.',
generation_config=genai.types.GenerationConfig(
candidate_count=1,
stop_sequences=['space'],
max_output_tokens=200,
temperature=0.7)
)
Markdown(response.text)
Kot lahko vidite, se je odgovor ustavil pred besedo "prostor". Neverjetno.
Za pretakanje odgovora lahko uporabite tudi argument `tok`. Podoben je API-jem Anthropic in OpenAI, vendar hitrejši.
model = genai.GenerativeModel('gemini-pro')
response = model.generate_content("Write a Julia function for cleaning the data.", stream=True)
for chunk in response:
print(chunk.text)
V tem razdelku bomo naložili Masooda Aslamija fotografijo in jo uporabite za preizkus multimodalnosti Gemini Pro Vision.
Naložite slike v `PIL` in jih prikažite.
import PIL.Image
img = PIL.Image.open('images/photo-1.jpg')
img
Imamo visoko kakovostno fotografijo Rua Augusta Arch.
Naložimo model Gemini Pro Vision in mu priskrbimo sliko.
model = genai.GenerativeModel('gemini-pro-vision')
response = model.generate_content(img)
Markdown(response.text)
Model je natančno identificiral palačo in zagotovil dodatne informacije o njeni zgodovini in arhitekturi.
Posredujmo isto sliko GPT-4 in ga vprašajmo o sliki. Oba modela sta dala skoraj podobne odgovore. Vendar mi je bolj všeč odgovor GPT-4.
Zdaj bomo API-ju zagotovili besedilo in sliko. Model vizije smo prosili, naj napiše popotniški blog, pri čemer uporabi sliko kot referenco.
response = model.generate_content(["Write a travel blog post using the image as reference.", img])
Markdown(response.text)
Zagotovil mi je kratek blog. Pričakoval sem daljši format.
V primerjavi z GPT-4 se model Gemini Pro Vision trudi ustvariti blog dolgega formata.
Model lahko nastavimo tako, da ima klepet naprej in nazaj. Na ta način si model zapomni kontekst in odziv na podlagi prejšnjih pogovorov.
V našem primeru smo začeli klepet in prosili modela, da mi pomaga začeti z igro Dota 2.
model = genai.GenerativeModel('gemini-pro')
chat = model.start_chat(history=[])
chat.send_message("Can you please guide me on how to start playing Dota 2?")
chat.history
Kot lahko vidite, objekt `chat` shranjuje zgodovino uporabnika in načina klepeta.
Lahko jih prikažemo tudi v slogu Markdown.
for message in chat.history:
display(Markdown(f'**{message.role}**: {message.parts[0].text}'))
Postavimo nadaljnje vprašanje.
chat.send_message("Which Dota 2 heroes should I start with?")
for message in chat.history:
display(Markdown(f'**{message.role}**: {message.parts[0].text}'))
Lahko se pomaknemo navzdol in si ogledamo celotno sejo z modelom.
Modeli vdelave postajajo vse bolj priljubljeni za aplikacije, ki se zavedajo konteksta. Model Gemini embedding-001 omogoča, da so besede, stavke ali celotni dokumenti predstavljeni kot zgoščeni vektorji, ki kodirajo semantični pomen. Ta vektorska predstavitev omogoča preprosto primerjavo podobnosti med različnimi deli besedila s primerjavo njihovih ustreznih vdelanih vektorjev.
Vsebino lahko zagotovimo v `embed_content` in besedilo pretvorimo v vdelave. Tako preprosto je.
output = genai.embed_content(
model="models/embedding-001",
content="Can you please guide me on how to start playing Dota 2?",
task_type="retrieval_document",
title="Embedding of Dota 2 question")
print(output['embedding'][0:10])
[0.060604308, -0.023885584, -0.007826327, -0.070592545, 0.021225851, 0.043229062, 0.06876691, 0.049298503, 0.039964676, 0.08291664]
Več delov besedila lahko pretvorimo v vdelane tako, da argumentu »vsebina« posredujemo seznam nizov.
output = genai.embed_content(
model="models/embedding-001",
content=[
"Can you please guide me on how to start playing Dota 2?",
"Which Dota 2 heroes should I start with?",
],
task_type="retrieval_document",
title="Embedding of Dota 2 question")
for emb in output['embedding']:
print(emb[:10])
[0.060604308, -0.023885584, -0.007826327, -0.070592545, 0.021225851, 0.043229062, 0.06876691, 0.049298503, 0.039964676, 0.08291664]
[0.04775657, -0.044990525, -0.014886052, -0.08473655, 0.04060122, 0.035374347, 0.031866882, 0.071754575, 0.042207796, 0.04577447]
Če imate težave z reprodukcijo istega rezultata, si oglejte mojo Delovni prostor Deepnote.
Obstaja toliko naprednih funkcij, ki jih nismo obravnavali v tej uvodni vadnici. Več o API-ju Gemini lahko izveste na Gemini API: hiter začetek s Pythonom.
V tej vadnici smo se naučili o Gemini in kako dostopati do API-ja Python za ustvarjanje odgovorov. Zlasti smo se naučili ustvarjanja besedila, vizualnega razumevanja, pretakanja, zgodovine pogovorov, izpisa po meri in vdelav. Vendar pa je to samo praska po površini tega, kar Dvojčka lahko naredita.
Z mano lahko delite, kaj ste zgradili z brezplačnim API-jem Gemini. Možnosti so neomejene.
Abid Ali Awan (@1abidaliawan) je certificiran strokovnjak za podatkovne znanstvenike, ki rad gradi modele strojnega učenja. Trenutno se osredotoča na ustvarjanje vsebin in pisanje tehničnih blogov o strojnem učenju in tehnologijah podatkovne znanosti. Abid ima magisterij iz tehnološkega managementa in diplomo iz telekomunikacijskega inženiringa. Njegova vizija je zgraditi izdelek AI z uporabo grafične nevronske mreže za študente, ki se borijo z duševnimi boleznimi.
- Distribucija vsebine in PR s pomočjo SEO. Okrepite se še danes.
- PlatoData.Network Vertical Generative Ai. Opolnomočite se. Dostopite tukaj.
- PlatoAiStream. Web3 Intelligence. Razširjeno znanje. Dostopite tukaj.
- PlatoESG. Ogljik, CleanTech, Energija, Okolje, sončna energija, Ravnanje z odpadki. Dostopite tukaj.
- PlatoHealth. Obveščanje o biotehnologiji in kliničnih preskušanjih. Dostopite tukaj.
- vir: https://www.kdnuggets.com/how-to-access-and-use-gemini-api-for-free?utm_source=rss&utm_medium=rss&utm_campaign=how-to-access-and-use-gemini-api-for-free
- :ima
- : je
- $GOR
- 1
- 10
- 12
- 13
- 14
- 17
- 27
- 7
- 8
- 9
- a
- O meni
- dostop
- natančno
- čez
- dodajanje
- Dodatne
- Dodatne informacije
- napredno
- spet
- AI
- tujci
- vsi
- omogoča
- skoraj
- Prav tako
- Neverjetno
- an
- in
- odgovori
- Antropično
- API
- API-ji
- aplikacije
- Arhitektura
- SE
- Argument
- AS
- vprašati
- At
- audio
- Uravnotežen
- BE
- postajajo
- bilo
- pred
- merilo
- med
- Blog
- blogi
- tako
- izgradnjo
- Building
- zgrajena
- podjetja
- vendar
- Gumb
- by
- se imenuje
- CAN
- Kandidat
- kandidati
- Zmogljivosti
- lahko
- primeru
- primeri
- centri
- Certified
- klepet
- preveriti
- čiščenje
- klik
- Koda
- sodelovanje
- primerjate
- primerjavo
- kompleksna
- vsebina
- ustvarjanje vsebine
- ozadje
- Pogovor
- pogovorov
- pretvorbo
- Ustrezno
- pokrov
- Oblikovanje
- Trenutno
- po meri
- prilagodite
- datum
- Centri podatki
- znanost o podatkih
- podatkovni znanstvenik
- Datum
- Deepmind
- Stopnja
- gosto
- zasnovan
- razvili
- Razvijalci
- naprave
- ni
- drugačen
- zaslon
- razne
- do
- Dokumenti
- don
- Dota
- Dota 2
- navzdol
- enostavno
- lahka
- učinkovite
- učinkovito
- vdelava
- Inženiring
- Celotna
- okolje
- Eter (ETH)
- pričakovati
- Strokovnjaki
- Pojasnite
- raziskuje
- hitreje
- prva
- prilagodljiv
- osredotoča
- sledi
- za
- format
- brezplačno
- iz
- funkcija
- funkcije
- igra
- Gemini
- ustvarjajo
- generacija
- dobili
- gif
- Go
- dogaja
- dobro
- Googlova
- graf
- Grafična nevronska mreža
- vodi
- imel
- Imajo
- ob
- he
- pomoč
- tukaj
- Heroes
- visoka
- zelo
- njegov
- zgodovina
- drži
- Kako
- Kako
- Vendar
- HTTPS
- človeškega
- i
- identificirati
- bolezen
- slika
- slike
- uvoz
- in
- Vključno
- vedno
- Podatki
- sproži
- namestitev
- primer
- Namesto
- integracija
- v
- uvodno
- IT
- ITS
- jpg
- julia
- samo
- KDnuggets
- Ključne
- znanje
- jezik
- Največji
- UČITE
- naučili
- učenje
- kot
- neomejen
- Seznam
- obremenitev
- več
- ljubi
- stroj
- strojno učenje
- IZDELA
- upravljanje
- več
- ogromen
- mojster
- max
- me
- kar pomeni,
- pomeni
- duševne
- Mentalna bolezen
- Meritve
- Mobilni
- mobilne naprave
- način
- Model
- modeli
- več
- Najbolj
- več
- Ime
- nano
- NBA
- mreža
- Nevronski
- nevronska mreža
- Novo
- Naslednja
- zdaj
- predmet
- of
- on
- ONE
- samo
- OpenAI
- deluje
- or
- OS
- naši
- ven
- Izboljšati
- izhod
- Palace
- zlasti
- Podaje
- popolna
- performance
- izvajati
- Osebni
- fotografija
- kosov
- platon
- Platonova podatkovna inteligenca
- PlatoData
- igranje
- prosim
- Točka
- Popular
- možnosti
- mogoče
- Prispevek
- potencial
- prejšnja
- za
- problem
- reševanje problema
- Izdelek
- strokovni
- zagotavljajo
- če
- zagotavljanje
- Python
- kakovost
- poizvedbe
- vprašanje
- precej
- območje
- RE
- reference
- zastopanje
- zastopan
- Raziskave
- Odgovor
- odgovorov
- povzroči
- revolucijo
- s
- Enako
- shranjevanje
- Prilagodljivost
- Lestvica
- lestvica ai
- Znanost
- Znanstvenik
- pomaknite
- Oddelek
- glej
- izberite
- Zasedanje
- nastavite
- nastavitev
- več
- Delite s prijatelji, znanci, družino in partnerji :-)
- Kratke Hlače
- shouldnt
- Podoben
- Enostavno
- sam
- So
- Reševanje
- Vesolje
- posebej
- Začetek
- začel
- state-of-the-art
- Korak
- stop
- ustavil
- Zgodba
- tok
- pretakanje
- Boriti se
- Študenti
- slog
- primerna
- Površina
- sistemi
- T
- Naloge
- Skupine
- tehnični
- Tehnologije
- Tehnologija
- telekomunikacije
- Test
- testi
- besedilo
- tvorjenje besedila
- da
- O
- njihove
- Njih
- POTEM
- ta
- 3
- skozi
- do
- Boni
- potovanja
- Težava
- Navodila
- Vrste
- Ultra
- razumeli
- razumevanje
- us
- uporabno
- uporaba
- uporabnik
- uporabo
- spremenljivka
- različnih
- Video
- Vizija
- vizualna
- je
- način..
- we
- Kaj
- ki
- WHO
- široka
- Širok spekter
- bo
- z
- beseda
- besede
- delo
- svet
- pisati
- pisanje
- jo
- Vaša rutina za
- zefirnet