Mit kínálnak az új OpenAI beágyazási modellek?

Mit kínálnak az új OpenAI beágyazási modellek?

Forrás csomópont: 3084949

A mesterséges intelligencia birodalma tovább fejlődik az új OpenAI beágyazási modellekkel. Arra lettek állítva, hogy újradefiniálják, hogyan viszonyulnak a fejlesztők a természetes nyelvi feldolgozáshoz. Mielőtt megvizsgálná a két úttörő modellt, amelyek mindegyike az AI-alkalmazások képességeinek fejlesztését szolgálja, íme, beágyazások átlagos:

Az OpenAI szövegbeágyazásai mérőszámként szolgálnak a szöveges karakterláncok közötti korreláció mérésére, és különféle tartományokban keresnek alkalmazásokat, többek között:

  • Keresés: A találatok egy adott lekérdezési karakterlánchoz való relevanciája alapján történő rangsorolására szolgál, javítva a keresési eredmények pontosságát.
  • Klaszterezés: Szöveges karakterláncok hasonlóságuk alapján történő csoportosítására szolgál, megkönnyítve a kapcsolódó információk rendszerezését.
  • ajánlások: Ajánlórendszerekben alkalmazzák olyan elemek javaslatára, amelyek szövegében közösek, javítva a javaslatok személyre szabását.
  • Anomáliák felderítése: A minimális rokonsággal bíró kiugró értékek azonosítására szolgál, segítve a szabálytalan minták vagy adatpontok észlelését.
  • Diverzitás mérése: Hasonlósági eloszlások elemzésére használható, lehetővé téve az adathalmazokon vagy szövegkorpusokon belüli diverzitás értékelését.
  • Osztályozás: Osztályozási feladatokban alkalmazzák, ahol a szöveges karakterláncok a leginkább hasonló címkéjük szerint vannak kategorizálva, így leegyszerűsítve a címkézési folyamatot a gépi tanulási alkalmazásokban.

Most már készen áll az új OpenAI beágyazási modellek felfedezésére!

Új OpenAI beágyazó modellek érkeztek

Az új OpenAI beágyazási modellek bevezetése jelentős ugrást jelent a természetes nyelvi feldolgozásban, lehetővé téve a fejlesztők számára a szöveges tartalom jobb megjelenítését és megértését. Nézzük meg ezen innovatív modellek részleteit: szöveg-beágyazás-3-kicsi és a szöveg-beágyazás-3-nagy.

Fedezze fel az új OpenAI beágyazási modelleket – szövegbeágyazás – 3 kicsi és szövegbeágyazás – 3 nagy – jobb megfizethetőség, teljesítmény és még sok más!
Az új OpenAI beágyazási modellek, a text-beágyazás-3-kis és a szöveg-beágyazás-3-nagy, jelentős előrelépéseket mutatnak be a természetes nyelvi feldolgozás terén, kielégítve a különféle fejlesztői igényeket (Kép hitel)

szöveg-beágyazás-3-kicsi

Ez a kompakt, de erőteljes modell jelentős teljesítménynövekedést mutat elődjéhez, a text-embedding-ada-002-höz képest. A többnyelvű lekérdezési benchmarkon (MIRACL) az átlagos pontszám 31.4%-ról lenyűgöző 44.0%-ra emelkedett. Hasonlóképpen, az angol feladatok benchmark (MTEB) átlagpontszáma dicséretesen emelkedett, 61.0%-ról 62.3%-ra. A text-embedding-3-small-t azonban nem csak a megnövelt teljesítménye, hanem a megfizethetősége is megkülönbözteti.

Eval benchmark ada v2 szöveg-beágyazás-3-kicsi szöveg-beágyazás-3-nagy
MIRACL átlag 31.4 44.0 54.9
MTEB átlag 61.0 62.3 64.6

Az OpenAI jelentősen csökkentette az árat, így ötször költséghatékonyabb lett a text-embedding-ada-5-hez képest, az 002k tokenek ára pedig 1 dollárról 0.0001 dollárra csökkent. Ez a text-beágyazás-0.00002-small-t nemcsak hatékonyabb választássá teszi, hanem elérhetőbbé is teszi a fejlesztők számára.

szöveg-beágyazás-3-nagy

A beágyazási modellek következő generációját képviselő text-embedding-3-large jelentősen megnöveli a méreteket, és akár 3072 méretű beágyazást is támogat. Ez a nagyobb modell a szöveges tartalom részletesebb és árnyaltabb megjelenítését biztosítja. A teljesítmény tekintetében a text-embedding-3-large felülmúlja elődjét a benchmarkok között. A MIRACL-en az átlagos pontszám 31.4%-ról lenyűgöző 54.9%-ra nőtt, ami kiemeli a többnyelvű lekérdezés terén nyújtott teljesítményét.

ada v2 szöveg-beágyazás-3-kicsi szöveg-beágyazás-3-nagy
Beágyazás mérete 1536 512 1536 256 1024 3072
Átlagos MTEB pontszám 61.0 61.6 62.3 62.0 64.1 64.6

Hasonlóképpen, az MTEB átlagpontszáma 61.0%-ról 64.6%-ra emelkedett, ami az angol feladatok terén mutatott fölényét mutatja. Az 0.00013k tokenenként 1 dollárba kerülő text-embedding-3-large egyensúlyt teremt a kiváló teljesítmény és a költséghatékonyság között, és robusztus megoldást kínál a fejlesztőknek a nagy dimenziós beágyazást igénylő alkalmazásokhoz.


Találkozik Google Lumiere AI, Bard videókészítő unokatestvére


Natív támogatás a beágyazások lerövidítéséhez

Felismerve a fejlesztők változatos igényeit, az OpenAI natív támogatást vezet be a beágyazások lerövidítésére. Ez az innovatív technika lehetővé teszi a fejlesztők számára, hogy testreszabják a beágyazás méretét a dimensions API paraméter beállításával. Ezzel a fejlesztők bizonyos teljesítményt kisebb vektorméretre cserélhetnek anélkül, hogy a beágyazás alapvető tulajdonságait veszélyeztetnék. Ez a rugalmasság különösen értékes azokban a forgatókönyvekben, ahol a rendszerek csak egy bizonyos méretű beágyazást támogatnak, így a fejlesztők sokoldalú eszközt biztosítanak a különféle használati forgatókönyvekhez.

Fedezze fel az új OpenAI beágyazási modelleket – szövegbeágyazás – 3 kicsi és szövegbeágyazás – 3 nagy – jobb megfizethetőség, teljesítmény és még sok más!
A text-embedding-3-small megfizethetőségét az elődjéhez, a text-embedding-ada-5-höz képest 002-szörös árcsökkenés hangsúlyozza, így költséghatékony választás a fejlesztők számára (Kép hitel)

Összefoglalva, az OpenAI új beágyazási modelljei jelentős előrelépést jelentenek a hatékonyság, a megfizethetőség és a teljesítmény terén. Függetlenül attól, hogy a fejlesztők a text-embedding-3-small kompakt, mégis hatékony megjelenítését, vagy a szöveg-beágyazás-3-nagy kiterjedtebb és részletesebb beágyazását választják, ezek a modellek sokoldalú eszközökkel ruházzák fel a fejlesztőket, hogy mélyebb betekintést nyerjenek a mesterséges intelligencia szöveges adataiból. alkalmazások.

Az új OpenAI beágyazási modellekkel kapcsolatos részletesebb információkért kattintson a gombra itt és megkapja a hivatalos bejelentést.

Kiemelt képi jóváírás: Levart_Photographer/Unsplash

Időbélyeg:

Még több Adatgazdaság