Az OpenAI Codex mögött: 5 lenyűgöző kihívás a Building Codexszel kapcsolatban, amelyekről nem tudtál

Forrás csomópont: 1068192

Az OpenAI Codex mögött: 5 lenyűgöző kihívás a Building Codexszel kapcsolatban, amelyekről nem tudtál

Címkék: , ,

Néhány ML mérnöki és modellezési kihívás, amelyek a Codex felépítése során szembesülnek.




OpenAI Codex
Forrás: https://bdtechtalks.com/2021/07/15/openai-codex-ai-programming/

 

Néhány héttel ezelőtt az OpenAI lenyűgözte a mesterséges intelligencia (AI) világát a Codex megjelenésével, egy hatalmas modellel, amely képes a természetes nyelvet kódra fordítani. A Codex hatékonyan képes végpontokig generálni az alapvető nyelvi utasításokból. Ha nem hiszed, nézd meg ezt a videót, ami minden idők egyik legjobb mesterséges intelligencia demójának tekinthető 😉



Videó forrása: OpenAI

 

Sokat írtak a Codex képességeiről a kezdeti indulás óta.

Engem azonban jobban érdekeltek azok az apró követelmények, amelyek hihetetlenül fontosakká válnak egy ilyen nagyságrendű modell elkészítéséhez. Mélyen belemerülve a Codexbe, néhány érdekes dolgot találtam, amelyeket jó lenne kiemelni:

1. A Codex körülbelül egy tucat nyelvben jártas, de Pythonra képezték ki

 
Ezt hihetetlenül éleslátónak találtam. Az OpenAI eredeti célja az volt, hogy a Codexet járatossá tegye a Python nyelvben, de kiderült, hogy a modell más nyelveket is felvett az előképzés során. Ez a nyelvi előképzett modellek egyedi képességeiről beszél.

2. A Codex tesztelése több mint trükkös volt

 
Az AI közösséget lenyűgözte a Codex mögötti kutatás, de úgy gondolom, hogy a mérnöki oldal is ugyanolyan lenyűgöző volt. Az egyik szempont, amely különösen érdekelt, a tesztelési rész volt. Hogy a fenébe tesztelhetsz élő kódot anélkül, hogy komoly kockázatokat vállalnál. Kiderült, hogy az OpenAI csapata rengeteg munkát végzett nagyon kifinomult homokozók felépítésével, hogy a Codex kimeneteit elkülönítve tesztelje.

3. A szemantika és a kód egyeztetése korántsem triviális

 
A modell betanítása a világ összes forráskódjára jól hangzik, de korántsem triviális. Végül is nem minden kód egyenlő. A Githubban található kód rosszul dokumentálható, míg a notebookok gazdag szemantikai információkkal rendelkezhetnek. Hasonlóképpen, a Stack Overflow kódrészletei gazdagabb szemantikai információval rendelkeznek. A kódrészletek nyelvi szemantikához való hozzárendelése a Codex felépítésének egyik kihívása volt.

4. A Codex továbbra is a feladatfelbontással küszködik

 
Ha arra gondol, hogyan dolgoznak a programozók, hajlamosak vagyunk egy problémát kisebb feladatokra bontani, és kódot készíteni ezekhez. Kiderült, hogy a Codex ez utóbbiban nagyszerű, de még mindig küzd a problémabontási feladatokban. Ez nem lehet meglepő, ha azt gondoljuk, hogy a probléma lebontásához nagyon összetett kognitív készségekre van szükség.

5. A felügyelt finomhangolás nagy része volt a Codex felépítésének

 
Az interneten található kódok a teljesség, a dokumentáció, a szintaktikai gazdagság stb. minden szintjén megjelennek. Egy modell ilyen változatos kódkészletére való betanítása megbízhatatlan eredményeket hozhat. Ebben az értelemben az OpenAI-nak hatalmas, felügyelt finomhangolási erőfeszítésen kellett keresztülmennie.

 
Ezek a Codex néhány olyan vonatkozásai, amelyek nem túl jól ismertek, de jelentős mértékben hozzájárultak a modell első verziójának sikeréhez. A Codex sikere egyrészt a fejlett ML-kutatásnak köszönhető, mint hatalmas ML-mérnöki és infrastrukturális erőfeszítéseknek.

 
Bio: Jézus Rodriguez jelenleg az Intotheblock műszaki igazgatója. Technológiai szakértő, vezető befektető és startup tanácsadó. Jézus megalapította a Tellagót, egy díjnyertes szoftverfejlesztő céget, amelynek célja, hogy az új vállalati szoftvertrendek kiaknázásával segítse a vállalatokat abban, hogy nagyszerű szoftverszervezetekké váljanak.

eredeti. Engedéllyel újra közzétéve.

Kapcsolódó:

Forrás: https://www.kdnuggets.com/2021/09/openai-codex-challenges.html

Időbélyeg:

Még több KDnuggets