Novi tekmec ChatGPT: Googlov Gemini - KDnuggets

Ponovno objavil Platon

Spremljevalci: 0

Novi tekmec ChatGPT: Googlov Gemini
Slika avtorja

Že nekaj časa je ChatGPT v središču pozornosti. Vsi govorijo o tem in veliko ljudi ga uporablja, kaj bi lahko šlo narobe?

Google si je vedno prizadeval ohraniti svoj sloves podjetja, ki je na prvem mestu AI, in do zdaj jim je šlo dobro. Vendar je v zadnjem letu jasno reči, da je OpenAI prevzel vodilno vlogo s ChatGPT, in samo vprašanje časa je bilo, kdaj bo Google prišel in poskušal znova prevzeti vodstvo.

Generalni direktor Sundar Pichai je izjavil:

Eden od razlogov, zakaj nas je umetna inteligenca začela zanimati že od samega začetka, je ta, da smo na svoje poslanstvo vedno gledali kot na brezčasno poslanstvo.

Predstavljamo Gemini iz Googla.

Če še niste imeli priložnosti pogledati napovednika, vas pozivam, da si ga ogledate tukaj.

Gemini is Google’s largest language model, which CEO Pichai initially first tested at a conference in June, and is now officially launching to the javnega. Kaj je torej tako dobrega pri Geminiju in zakaj se ChatGPT trese v njegovih škornjih?

Gemini ni samo en model AI. Na voljo je v različnih različicah, ki ustrezajo različnim zahtevam. Na primer, imate lažjo različico, imenovano Gemini Nano ki je združljiv za delovanje v napravah Android. Imate tudi Gemini Pro, ki uporablja hrbtenico Barb in bo uporabljen za napajanje številnih Googlovih storitev AI.

Vendar se tu ne konča. Imate tudi Gemini Ultra, ki je Googlov najzmogljivejši model in najmočnejši LLM doslej. Zdi se, da je Gemini Ultra zasnovan posebej za podatkovne centre in zlasti poslovne aplikacije.

Hitra razčlenitev:

Gemini Ultra – largest and most capable model for highly complex tasks.
GeminiPro – best model for scaling across a wide range of tasks.
Gemini Nano – most efficient model for on-device tasks.

Ta 3 različica družine velikih jezikovnih modelov je bila zgrajena za razumevanje in delovanje v različnih vrstah informacij. LLM lahko obravnava različne vrste informacij, kot so besedilo, koda, slike, zvok in videoposnetki. Multimodalnost v najboljši luči.

Kako dobro je torej?

Google je vložil veliko dela pri testiranju modelov Gemini, da bi zagotovil, da ustrezajo zahtevam in so bili strogo ocenjeni pri različnih nalogah. Rečeno je, da je Googlov Gemini Ultra presegel trenutne najsodobnejše rezultate pri 30 od 32 široko uporabljenih akademskih meril uspešnosti, ki se uporabljajo v raziskavah LLM, z neverjetnimi 90.0 %.

Novi tekmec ChatGPT: Googlov Gemini
Slika iz Google Gemini

Izkazalo se je, da je Gemini Ultra prvi model, ki prekaša človeške strokovnjake MMLU (ogromno večopravilno razumevanje jezika). MMLU združuje 57 predmetov, ki vključujejo matematiko, zgodovino, pravo, medicino, fiziko in več za preverjanje svetovnega znanja in sposobnosti reševanja problemov.

Če pogledamo ta merila uspešnosti, lahko vidimo, da je največja prednost, ki jo ima Gemini, njegova sposobnost razumevanja in interakcije z videoposnetki in zvokom.

Videli smo, da želi OpenAI to doseči z ustvarjanjem DALL-E in Šepetanje. Vendar pa je Google šel še korak dlje z veččutnim modelom že na začetku. Google je omenil tudi izboljšave pri kodiranju, saj uporablja nov sistem za ustvarjanje kode, imenovan AlphaCode 2, ki naj bi deloval 85% bolje kot drugi udeleženci tekmovanja v kodiranju.

With this being said, benchmarks are just benchmarks. We will be able to fully understand Gemini’s full capabilities when everyday users interact with it.

Če želite izvedeti več o zmožnostih Geminija, si oglejte ta video:

[Vgrajeni vsebina]

Za uporabnike Pixel 8 Pro ste morda že videli nekaj novih funkcij, kot sta funkcija samodejnega povzemanja v aplikaciji Snemalnik in del pametnega odgovora tipkovnice Gboard, zahvaljujoč Gemini Nano.

Če želite preizkusiti Gemini Pro, lahko to storite zdaj z Bard. Razvijalci in poslovne stranke bodo od 13. decembra dalje lahko dostopale do Gemini Pro prek Google Generative AI Studio ali Vertex AI v Google Cloudu.

Če vas zanima Gemini Nano, boste morda morali še malo počakati, saj bo na voljo naslednje leto.

Dobro je omeniti, da je Gemini trenutno na voljo samo v angleščini. Na voljo bo več jezikov, saj je izvršni direktor Pichai izjavil, da namerava podjetje integrirati model v Googlov iskalnik, oglaševalske izdelke, brskalnik Chrome in drugo.

Zdi se, da je zdaj čas, da Google prevzame nazaj krono in nam pokaže, zakaj so bili v ospredju inovacij AI. Kaj misliš, da se bo naslednje pojavilo?

Nisha Arya je podatkovni znanstvenik in samostojni tehnični pisec. Še posebej jo zanima zagotavljanje kariernih nasvetov ali vadnic o podatkovni znanosti in na teoriji temelječega znanja o podatkovni znanosti. Prav tako želi raziskati različne načine, na katere umetna inteligenca koristi/lahko prispeva k dolgoživosti človeškega življenja. Zavzeta učenka, ki želi razširiti svoje tehnično znanje in pisne sposobnosti, hkrati pa pomaga usmerjati druge.