Az OpenAI Codex mögött: 5 lenyűgöző kihívás a Building Codexszel kapcsolatban, amelyekről nem tudtál
Néhány ML mérnöki és modellezési kihívás, amelyek a Codex felépítése során szembesülnek.
Forrás: https://bdtechtalks.com/2021/07/15/openai-codex-ai-programming/
Néhány héttel ezelőtt az OpenAI lenyűgözte a mesterséges intelligencia (AI) világát a Codex megjelenésével, egy hatalmas modellel, amely képes a természetes nyelvet kódra fordítani. A Codex hatékonyan képes végpontokig generálni az alapvető nyelvi utasításokból. Ha nem hiszed, nézd meg ezt a videót, ami minden idők egyik legjobb mesterséges intelligencia demójának tekinthető 😉
Videó forrása: OpenAI
Sokat írtak a Codex képességeiről a kezdeti indulás óta.
Engem azonban jobban érdekeltek azok az apró követelmények, amelyek hihetetlenül fontosakká válnak egy ilyen nagyságrendű modell elkészítéséhez. Mélyen belemerülve a Codexbe, néhány érdekes dolgot találtam, amelyeket jó lenne kiemelni:
1. A Codex körülbelül egy tucat nyelvben jártas, de Pythonra képezték ki
Ezt hihetetlenül éleslátónak találtam. Az OpenAI eredeti célja az volt, hogy a Codexet járatossá tegye a Python nyelvben, de kiderült, hogy a modell más nyelveket is felvett az előképzés során. Ez a nyelvi előképzett modellek egyedi képességeiről beszél.
2. A Codex tesztelése több mint trükkös volt
Az AI közösséget lenyűgözte a Codex mögötti kutatás, de úgy gondolom, hogy a mérnöki oldal is ugyanolyan lenyűgöző volt. Az egyik szempont, amely különösen érdekelt, a tesztelési rész volt. Hogy a fenébe tesztelhetsz élő kódot anélkül, hogy komoly kockázatokat vállalnál. Kiderült, hogy az OpenAI csapata rengeteg munkát végzett nagyon kifinomult homokozók felépítésével, hogy a Codex kimeneteit elkülönítve tesztelje.
3. A szemantika és a kód egyeztetése korántsem triviális
A modell betanítása a világ összes forráskódjára jól hangzik, de korántsem triviális. Végül is nem minden kód egyenlő. A Githubban található kód rosszul dokumentálható, míg a notebookok gazdag szemantikai információkkal rendelkezhetnek. Hasonlóképpen, a Stack Overflow kódrészletei gazdagabb szemantikai információval rendelkeznek. A kódrészletek nyelvi szemantikához való hozzárendelése a Codex felépítésének egyik kihívása volt.
4. A Codex továbbra is a feladatfelbontással küszködik
Ha arra gondol, hogyan dolgoznak a programozók, hajlamosak vagyunk egy problémát kisebb feladatokra bontani, és kódot készíteni ezekhez. Kiderült, hogy a Codex ez utóbbiban nagyszerű, de még mindig küzd a problémabontási feladatokban. Ez nem lehet meglepő, ha azt gondoljuk, hogy a probléma lebontásához nagyon összetett kognitív készségekre van szükség.
5. A felügyelt finomhangolás nagy része volt a Codex felépítésének
Az interneten található kódok a teljesség, a dokumentáció, a szintaktikai gazdagság stb. minden szintjén megjelennek. Egy modell ilyen változatos kódkészletére való betanítása megbízhatatlan eredményeket hozhat. Ebben az értelemben az OpenAI-nak hatalmas, felügyelt finomhangolási erőfeszítésen kellett keresztülmennie.
Ezek a Codex néhány olyan vonatkozásai, amelyek nem túl jól ismertek, de jelentős mértékben hozzájárultak a modell első verziójának sikeréhez. A Codex sikere egyrészt a fejlett ML-kutatásnak köszönhető, mint hatalmas ML-mérnöki és infrastrukturális erőfeszítéseknek.
Bio: Jézus Rodriguez jelenleg az Intotheblock műszaki igazgatója. Technológiai szakértő, vezető befektető és startup tanácsadó. Jézus megalapította a Tellagót, egy díjnyertes szoftverfejlesztő céget, amelynek célja, hogy az új vállalati szoftvertrendek kiaknázásával segítse a vállalatokat abban, hogy nagyszerű szoftverszervezetekké váljanak.
eredeti. Engedéllyel újra közzétéve.
Kapcsolódó:
- "
- &
- tanácsadó
- AI
- Minden termék
- Alkalmazás
- BEST
- épít
- Épület
- kód
- kognitív
- Közös
- közösség
- Companies
- építés
- Pár
- hitel
- CTO
- dátum
- adat-tudomány
- mély tanulás
- Fejlesztés
- Igazgató
- tucat
- Mérnöki
- Vállalkozás
- vállalati szoftver
- stb.
- végrehajtó
- Cég
- vezetéknév
- GitHub
- jó
- GPU
- nagy
- Kiemel
- Hogyan
- HTTPS
- hatalmas
- információ
- Infrastruktúra
- Internet
- Interjú
- blokkban
- befektető
- szigetelés
- IT
- nyelv
- Nyelvek
- indít
- TANUL
- tanulás
- fontos
- közepes
- ML
- modell
- modellezés
- Természetes nyelv
- ideg-
- laptopok
- nyitva
- nyílt forráskódú
- OpenAI
- Más
- játékos
- Hozzászólások
- Piton
- miatt
- regresszió
- követelmények
- kutatás
- Eredmények
- Tudomány
- tudósok
- szemantika
- értelemben
- készségek
- kicsi
- szoftver
- szoftverfejlesztés
- indítás
- TÖRTÉNETEK
- siker
- Technológia
- teszt
- Tesztelés
- The Source
- idő
- tonna
- felső
- Képzések
- Trends
- videó
- Nézz
- Munka
- világ
- X
- youtube