What Does The New OpenAI Embedding Models Offer?

Újra kiadta Platón

Követő: 0

A mesterséges intelligencia birodalma tovább fejlődik az új OpenAI beágyazási modellekkel. Arra lettek állítva, hogy újradefiniálják, hogyan viszonyulnak a fejlesztők a természetes nyelvi feldolgozáshoz. Mielőtt megvizsgálná a két úttörő modellt, amelyek mindegyike az AI-alkalmazások képességeinek fejlesztését szolgálja, íme, beágyazások átlagos:

Az OpenAI szövegbeágyazásai mérőszámként szolgálnak a szöveges karakterláncok közötti korreláció mérésére, és különféle tartományokban keresnek alkalmazásokat, többek között:

Keresés: A találatok egy adott lekérdezési karakterlánchoz való relevanciája alapján történő rangsorolására szolgál, javítva a keresési eredmények pontosságát.
Klaszterezés: Szöveges karakterláncok hasonlóságuk alapján történő csoportosítására szolgál, megkönnyítve a kapcsolódó információk rendszerezését.
ajánlások: Ajánlórendszerekben alkalmazzák olyan elemek javaslatára, amelyek szövegében közösek, javítva a javaslatok személyre szabását.
Anomáliák felderítése: A minimális rokonsággal bíró kiugró értékek azonosítására szolgál, segítve a szabálytalan minták vagy adatpontok észlelését.
Diverzitás mérése: Hasonlósági eloszlások elemzésére használható, lehetővé téve az adathalmazokon vagy szövegkorpusokon belüli diverzitás értékelését.
Osztályozás: Osztályozási feladatokban alkalmazzák, ahol a szöveges karakterláncok a leginkább hasonló címkéjük szerint vannak kategorizálva, így leegyszerűsítve a címkézési folyamatot a gépi tanulási alkalmazásokban.

Most már készen áll az új OpenAI beágyazási modellek felfedezésére!

Új OpenAI beágyazó modellek érkeztek

Az új OpenAI beágyazási modellek bevezetése jelentős ugrást jelent a természetes nyelvi feldolgozásban, lehetővé téve a fejlesztők számára a szöveges tartalom jobb megjelenítését és megértését. Nézzük meg ezen innovatív modellek részleteit: szöveg-beágyazás-3-kicsi és a szöveg-beágyazás-3-nagy.

szöveg-beágyazás-3-kicsi

Ez a kompakt, de erőteljes modell jelentős teljesítménynövekedést mutat elődjéhez, a text-embedding-ada-002-höz képest. A többnyelvű lekérdezési benchmarkon (MIRACL) az átlagos pontszám 31.4%-ról lenyűgöző 44.0%-ra emelkedett. Hasonlóképpen, az angol feladatok benchmark (MTEB) átlagpontszáma dicséretesen emelkedett, 61.0%-ról 62.3%-ra. A text-embedding-3-small-t azonban nem csak a megnövelt teljesítménye, hanem a megfizethetősége is megkülönbözteti.

Eval benchmark	ada v2	szöveg-beágyazás-3-kicsi	szöveg-beágyazás-3-nagy
MIRACL átlag	31.4	44.0	54.9
MTEB átlag	61.0	62.3	64.6

Az OpenAI jelentősen csökkentette az árat, így ötször költséghatékonyabb lett a text-embedding-ada-5-hez képest, az 002k tokenek ára pedig 1 dollárról 0.0001 dollárra csökkent. Ez a text-beágyazás-0.00002-small-t nemcsak hatékonyabb választássá teszi, hanem elérhetőbbé is teszi a fejlesztők számára.

szöveg-beágyazás-3-nagy

A beágyazási modellek következő generációját képviselő text-embedding-3-large jelentősen megnöveli a méreteket, és akár 3072 méretű beágyazást is támogat. Ez a nagyobb modell a szöveges tartalom részletesebb és árnyaltabb megjelenítését biztosítja. A teljesítmény tekintetében a text-embedding-3-large felülmúlja elődjét a benchmarkok között. A MIRACL-en az átlagos pontszám 31.4%-ról lenyűgöző 54.9%-ra nőtt, ami kiemeli a többnyelvű lekérdezés terén nyújtott teljesítményét.

	ada v2	szöveg-beágyazás-3-kicsi		szöveg-beágyazás-3-nagy
Beágyazás mérete	1536	512	1536	256	1024	3072
Átlagos MTEB pontszám	61.0	61.6	62.3	62.0	64.1	64.6

Hasonlóképpen, az MTEB átlagpontszáma 61.0%-ról 64.6%-ra emelkedett, ami az angol feladatok terén mutatott fölényét mutatja. Az 0.00013k tokenenként 1 dollárba kerülő text-embedding-3-large egyensúlyt teremt a kiváló teljesítmény és a költséghatékonyság között, és robusztus megoldást kínál a fejlesztőknek a nagy dimenziós beágyazást igénylő alkalmazásokhoz.

Találkozik Google Lumiere AI, Bard videókészítő unokatestvére

Natív támogatás a beágyazások lerövidítéséhez

Felismerve a fejlesztők változatos igényeit, az OpenAI natív támogatást vezet be a beágyazások lerövidítésére. Ez az innovatív technika lehetővé teszi a fejlesztők számára, hogy testreszabják a beágyazás méretét a dimensions API paraméter beállításával. Ezzel a fejlesztők bizonyos teljesítményt kisebb vektorméretre cserélhetnek anélkül, hogy a beágyazás alapvető tulajdonságait veszélyeztetnék. Ez a rugalmasság különösen értékes azokban a forgatókönyvekben, ahol a rendszerek csak egy bizonyos méretű beágyazást támogatnak, így a fejlesztők sokoldalú eszközt biztosítanak a különféle használati forgatókönyvekhez.

Összefoglalva, az OpenAI új beágyazási modelljei jelentős előrelépést jelentenek a hatékonyság, a megfizethetőség és a teljesítmény terén. Függetlenül attól, hogy a fejlesztők a text-embedding-3-small kompakt, mégis hatékony megjelenítését, vagy a szöveg-beágyazás-3-nagy kiterjedtebb és részletesebb beágyazását választják, ezek a modellek sokoldalú eszközökkel ruházzák fel a fejlesztőket, hogy mélyebb betekintést nyerjenek a mesterséges intelligencia szöveges adataiból. alkalmazások.

Az új OpenAI beágyazási modellekkel kapcsolatos részletesebb információkért kattintson a gombra itt és megkapja a hivatalos bejelentést.

Kiemelt képi jóváírás: Levart_Photographer/Unsplash

SEO által támogatott tartalom és PR terjesztés. Erősödjön még ma.
PlatoData.Network Vertical Generative Ai. Erősítse meg magát. Hozzáférés itt.
PlatoAiStream. Web3 Intelligence. Felerősített tudás. Hozzáférés itt.
PlatoESG. Carbon, CleanTech, Energia, Környezet, Nap, Hulladékgazdálkodás. Hozzáférés itt.
PlatoHealth. Biotechnológiai és klinikai vizsgálatok intelligencia. Hozzáférés itt.
Forrás: https://dataconomy.com/2024/01/26/new-openai-embedding-models/

Időbélyeg: Január 26, 2024

Időbélyeg: 1. február 2024.

Újra kiadta Platón

Az Amazon Titan Image Generator itt van, hogy megváltoztassa a játékot

A Terminátor igazgatója attól tart, hogy a mesterséges intelligencia Skynetté válhat

Az FTC beperli az Amazont, és a cég bízik az Amazon-perben

Vizsgálat alatt az NFT hírverés vonatszerencsétlensége

Football Australia adatszivárgás – Szerencsétlen öngól

Rólunk

Vertical Search & Ai

Emelvény

Maradjon kapcsolatban

Fiók