A mesterséges intelligencia birodalma tovább fejlődik az új OpenAI beágyazási modellekkel. Arra lettek állítva, hogy újradefiniálják, hogyan viszonyulnak a fejlesztők a természetes nyelvi feldolgozáshoz. Mielőtt megvizsgálná a két úttörő modellt, amelyek mindegyike az AI-alkalmazások képességeinek fejlesztését szolgálja, íme, beágyazások átlagos:
Az OpenAI szövegbeágyazásai mérőszámként szolgálnak a szöveges karakterláncok közötti korreláció mérésére, és különféle tartományokban keresnek alkalmazásokat, többek között:
- Keresés: A találatok egy adott lekérdezési karakterlánchoz való relevanciája alapján történő rangsorolására szolgál, javítva a keresési eredmények pontosságát.
- Klaszterezés: Szöveges karakterláncok hasonlóságuk alapján történő csoportosítására szolgál, megkönnyítve a kapcsolódó információk rendszerezését.
- ajánlások: Ajánlórendszerekben alkalmazzák olyan elemek javaslatára, amelyek szövegében közösek, javítva a javaslatok személyre szabását.
- Anomáliák felderítése: A minimális rokonsággal bíró kiugró értékek azonosítására szolgál, segítve a szabálytalan minták vagy adatpontok észlelését.
- Diverzitás mérése: Hasonlósági eloszlások elemzésére használható, lehetővé téve az adathalmazokon vagy szövegkorpusokon belüli diverzitás értékelését.
- Osztályozás: Osztályozási feladatokban alkalmazzák, ahol a szöveges karakterláncok a leginkább hasonló címkéjük szerint vannak kategorizálva, így leegyszerűsítve a címkézési folyamatot a gépi tanulási alkalmazásokban.
Most már készen áll az új OpenAI beágyazási modellek felfedezésére!
Új OpenAI beágyazó modellek érkeztek
Az új OpenAI beágyazási modellek bevezetése jelentős ugrást jelent a természetes nyelvi feldolgozásban, lehetővé téve a fejlesztők számára a szöveges tartalom jobb megjelenítését és megértését. Nézzük meg ezen innovatív modellek részleteit: szöveg-beágyazás-3-kicsi és a szöveg-beágyazás-3-nagy.
szöveg-beágyazás-3-kicsi
Ez a kompakt, de erőteljes modell jelentős teljesítménynövekedést mutat elődjéhez, a text-embedding-ada-002-höz képest. A többnyelvű lekérdezési benchmarkon (MIRACL) az átlagos pontszám 31.4%-ról lenyűgöző 44.0%-ra emelkedett. Hasonlóképpen, az angol feladatok benchmark (MTEB) átlagpontszáma dicséretesen emelkedett, 61.0%-ról 62.3%-ra. A text-embedding-3-small-t azonban nem csak a megnövelt teljesítménye, hanem a megfizethetősége is megkülönbözteti.
Eval benchmark | ada v2 | szöveg-beágyazás-3-kicsi | szöveg-beágyazás-3-nagy |
MIRACL átlag | 31.4 | 44.0 | 54.9 |
MTEB átlag | 61.0 | 62.3 | 64.6 |
Az OpenAI jelentősen csökkentette az árat, így ötször költséghatékonyabb lett a text-embedding-ada-5-hez képest, az 002k tokenek ára pedig 1 dollárról 0.0001 dollárra csökkent. Ez a text-beágyazás-0.00002-small-t nemcsak hatékonyabb választássá teszi, hanem elérhetőbbé is teszi a fejlesztők számára.
szöveg-beágyazás-3-nagy
A beágyazási modellek következő generációját képviselő text-embedding-3-large jelentősen megnöveli a méreteket, és akár 3072 méretű beágyazást is támogat. Ez a nagyobb modell a szöveges tartalom részletesebb és árnyaltabb megjelenítését biztosítja. A teljesítmény tekintetében a text-embedding-3-large felülmúlja elődjét a benchmarkok között. A MIRACL-en az átlagos pontszám 31.4%-ról lenyűgöző 54.9%-ra nőtt, ami kiemeli a többnyelvű lekérdezés terén nyújtott teljesítményét.
ada v2 | szöveg-beágyazás-3-kicsi | szöveg-beágyazás-3-nagy | ||||
Beágyazás mérete | 1536 | 512 | 1536 | 256 | 1024 | 3072 |
Átlagos MTEB pontszám | 61.0 | 61.6 | 62.3 | 62.0 | 64.1 | 64.6 |
Hasonlóképpen, az MTEB átlagpontszáma 61.0%-ról 64.6%-ra emelkedett, ami az angol feladatok terén mutatott fölényét mutatja. Az 0.00013k tokenenként 1 dollárba kerülő text-embedding-3-large egyensúlyt teremt a kiváló teljesítmény és a költséghatékonyság között, és robusztus megoldást kínál a fejlesztőknek a nagy dimenziós beágyazást igénylő alkalmazásokhoz.
Találkozik Google Lumiere AI, Bard videókészítő unokatestvére
Natív támogatás a beágyazások lerövidítéséhez
Felismerve a fejlesztők változatos igényeit, az OpenAI natív támogatást vezet be a beágyazások lerövidítésére. Ez az innovatív technika lehetővé teszi a fejlesztők számára, hogy testreszabják a beágyazás méretét a dimensions API paraméter beállításával. Ezzel a fejlesztők bizonyos teljesítményt kisebb vektorméretre cserélhetnek anélkül, hogy a beágyazás alapvető tulajdonságait veszélyeztetnék. Ez a rugalmasság különösen értékes azokban a forgatókönyvekben, ahol a rendszerek csak egy bizonyos méretű beágyazást támogatnak, így a fejlesztők sokoldalú eszközt biztosítanak a különféle használati forgatókönyvekhez.
Összefoglalva, az OpenAI új beágyazási modelljei jelentős előrelépést jelentenek a hatékonyság, a megfizethetőség és a teljesítmény terén. Függetlenül attól, hogy a fejlesztők a text-embedding-3-small kompakt, mégis hatékony megjelenítését, vagy a szöveg-beágyazás-3-nagy kiterjedtebb és részletesebb beágyazását választják, ezek a modellek sokoldalú eszközökkel ruházzák fel a fejlesztőket, hogy mélyebb betekintést nyerjenek a mesterséges intelligencia szöveges adataiból. alkalmazások.
Az új OpenAI beágyazási modellekkel kapcsolatos részletesebb információkért kattintson a gombra itt és megkapja a hivatalos bejelentést.
Kiemelt képi jóváírás: Levart_Photographer/Unsplash
- SEO által támogatott tartalom és PR terjesztés. Erősödjön még ma.
- PlatoData.Network Vertical Generative Ai. Erősítse meg magát. Hozzáférés itt.
- PlatoAiStream. Web3 Intelligence. Felerősített tudás. Hozzáférés itt.
- PlatoESG. Carbon, CleanTech, Energia, Környezet, Nap, Hulladékgazdálkodás. Hozzáférés itt.
- PlatoHealth. Biotechnológiai és klinikai vizsgálatok intelligencia. Hozzáférés itt.
- Forrás: https://dataconomy.com/2024/01/26/new-openai-embedding-models/
- :van
- :is
- :nem
- :ahol
- $ UP
- 1
- 31
- 54
- a
- Rólunk
- hozzáférhető
- Szerint
- át
- szabályozó
- fejlesztések
- AI
- lehetővé teszi, hogy
- Is
- an
- elemzése
- és a
- Közlemény
- külön
- api
- alkalmazások
- alkalmazott
- megközelítés
- VANNAK
- mesterséges
- mesterséges intelligencia
- AS
- értékelés
- At
- átlagos
- Egyenleg
- alapján
- előtt
- benchmark
- referenciaértékek
- Jobb
- között
- Blokk
- fellendítésére
- de
- by
- TUD
- képességek
- ellátás
- bizonyos
- választás
- besorolás
- kettyenés
- felmászott
- dicséretes
- kompakt
- képest
- veszélyeztetése
- tartalom
- tovább
- Összefüggés
- költséghatékony
- hitel
- testre
- dátum
- adat pontok
- adatkészletek
- mélyebb
- ás
- igényes
- telepített
- tervezett
- részletes
- részletek
- Érzékelés
- Fejlesztő
- fejlesztők
- méretek
- felfedez
- disztribúció
- számos
- Sokféleség
- nem
- Ennek
- domainek
- minden
- hatékonyság
- hatékony
- ELEMELNI
- beágyazás
- munkavállaló
- képessé
- lehetővé téve
- Angol
- fokozott
- fokozása
- fejlődik
- Kiváló
- kiállítási
- feltárása
- Feltárása
- kiterjedt
- kivonat
- megkönnyítését
- megtalálása
- Rugalmasság
- A
- Előre
- ból ből
- alapvető
- nyomtáv
- generáció
- kap
- adott
- úttörő
- Legyen
- itt
- Magas
- kiemelve
- Hogyan
- azonban
- HTTPS
- azonosítani
- kép
- hatásos
- in
- Beleértve
- Növelje
- információ
- újító
- meglátások
- Intelligencia
- bele
- Bemutatja
- Bevezetés
- IT
- tételek
- ITS
- jpg
- éppen
- Címke
- címkézés
- nyelv
- nagyobb
- Ugrás
- tanulás
- leeresztett
- gép
- gépi tanulás
- készítő
- KÉSZÍT
- Gyártás
- max-width
- jelent
- metrikus
- minimális
- modell
- modellek
- több
- hatékonyabb
- a legtöbb
- bennszülött
- Természetes
- Természetes nyelv
- Természetes nyelvi feldolgozás
- igények
- Új
- következő
- figyelemre méltó
- árnyalt
- of
- ajánlat
- felajánlás
- hivatalos
- on
- ONE
- csak
- OpenAI
- or
- szervezet
- eredmények
- felett
- paraméter
- különösen
- minták
- mert
- teljesítmény
- Testreszabás
- Plató
- Platón adatintelligencia
- PlatoData
- pont
- erős
- Pontosság
- előző
- ár
- árazás
- folyamat
- feldolgozás
- ingatlanait
- biztosít
- amely
- bátorság
- rangsorban
- kész
- birodalom
- Ajánlást
- újradefiniál
- Csökkent
- csökkentés
- összefüggő
- relevancia
- képvisel
- képviselet
- Eredmények
- visszakeresés
- erős
- forgatókönyvek
- pontszám
- Keresés
- látott
- szolgál
- készlet
- Szettek
- Megosztás
- kirakat
- kirakatba
- jelentős
- jelentősen
- hasonló
- hasonlóságok
- Hasonlóképpen
- Méret
- kisebb
- So
- ugrott
- megoldások
- néhány
- Lépés
- ésszerűsítése
- Strikes
- Húr
- lényeges
- javasol
- ÖSSZEFOGLALÓ
- támogatás
- Támogató
- ugrott
- Systems
- táblázat
- feladatok
- technika
- feltételek
- szöveg
- szövegi
- hogy
- A
- azok
- Ezek
- ők
- ezt
- alkalommal
- nak nek
- tokenek
- szerszám
- szerszámok
- kettő
- megért
- Használat
- hasznosított
- Értékes
- különféle
- sokoldalú
- videó
- Mit
- vajon
- val vel
- belül
- nélkül
- még
- te
- zephyrnet