Ezen a héten az AI-ban, augusztus 18.: Az OpenAI pénzügyi problémákkal küzd • Stabilitás Az AI bejelentette a StableCode-ot – KDnuggets

Ezen a héten az AI-ban, augusztus 18.: Az OpenAI pénzügyi problémákkal küzd • Stabilitás Az AI bejelentette a StableCode-ot – KDnuggets

Forrás csomópont: 2833080

### ALT ###
A képet a Szerkesztő készítette a Midjourney-val
 

Üdvözöljük a KDnuggets „This Week in AI” e heti kiadásában. Ennek a heti összeállításnak a célja, hogy lépést tartson a mesterséges intelligencia rohamosan fejlődő világának leglenyűgözőbb fejleményeivel. Ez a bejegyzés átfogó áttekintést nyújt a mesterséges intelligencia jelenlegi helyzetéről az úttörő címszavaktól, amelyek az AI társadalomban betöltött szerepének megértését alakítják, elgondolkodtató cikkekig, éleslátó tanulási forrásokig és a tudásunk határait feszegető, reflektorfénybe került kutatásokig. Ez a heti frissítés célja, hogy naprakészen és tájékozott legyen ezen a folyamatosan fejlődő területen. Maradj velünk és jó olvasást!

 
A „Hírek” rovat az elmúlt hét legfontosabb híreit és fejleményeit tárgyalja a mesterséges intelligencia területén. Az információk a kormányzati AI-politikáktól a technológiai fejlesztésekig és a mesterséges intelligencia vállalati innovációiig terjednek.

 
???? ChatGPT bajban: Az OpenAI 2024-re csődbe mehet, az AI bot naponta 700,000 XNUMX dollárba kerül a cégnek

Az OpenAI pénzügyi nehézségekkel küzd a ChatGPT és más mesterséges intelligencia szolgáltatások magas költségei miatt. A gyors korai növekedés ellenére a ChatGPT felhasználói bázisa csökkent az elmúlt hónapokban. Az OpenAI azért küzd, hogy hatékonyan pénzzé tegye technológiáját, és fenntartható bevételt termeljen. Eközben továbbra is riasztó sebességgel éget el a készpénzben. A verseny felmelegedése és a vállalati GPU-hiány hátráltatja a modellfejlesztést, az OpenAI-nak sürgősen meg kell találnia a jövedelmezőség felé vezető utakat. Ha ez nem sikerül, akkor az úttörő mesterséges intelligencia induló vállalkozás csődje lehet.

 
???? Stabilitás A mesterséges intelligencia bemutatja a StableCode-ot, a fejlesztők mesterséges intelligencia kódolási asszisztensét

A Stability AI kiadta a StableCode-ot, az első szoftverfejlesztésre optimalizált generatív AI-termékét. A StableCode több, több mint 500 milliárd kódtokenre kiképzett modellt tartalmaz, amelyek intelligens automatikus kiegészítést biztosítanak, válaszolnak a természetes nyelvi utasításokra, és hosszú kódtartományokat kezelnek. Míg a társalgási mesterséges intelligencia már képes kódot írni, a StableCode célja a programozó termelékenységének növelése a kódstruktúra és a függőségek megértésével. Speciális képzésével és hosszú kontextusokat kezelni képes modelljeivel a StableCode célja, hogy javítsa a fejlesztői munkafolyamatokat, és csökkentse a belépési korlátot a törekvő kódolók számára. Az indítás a Stabilitási mesterséges intelligencia betörését jelenti a mesterséges intelligencia által támogatott kódolóeszközök felé, az űrben folyó növekvő verseny közepette.

 
???? Az OpenAI Superalignment bemutatása

Az OpenAI proaktívan dolgozik azon, hogy a szuperintelligens mesterséges intelligencia lehetséges kockázatait kezelje új Superalignment csapatukon keresztül, amely olyan technikákat alkalmaz, mint az emberi visszajelzésekből való tanulás megerősítése az AI-rendszerek összehangolására. A fő célok a skálázható képzési módszerek kifejlesztése más AI-rendszerek felhasználásával, a modell robusztusságának validálása, valamint a teljes igazítási folyamat stressztesztje még szándékosan rosszul igazított modellek esetén is. Összességében az OpenAI célja, hogy megmutassa, a szuperintelligencia felelős irányításának úttörő megközelítései révén a gépi tanulás biztonságosan végrehajtható.

 
???? Tanuljon keresés (és böngészés) közben a generatív AI használatával

A Google számos frissítést jelent be keresőmotor-generációs (SGE) mesterséges intelligencia képességeihez, beleértve a lebegő definíciókat a tudomány/történelem témákhoz, a színkódos szintaxis kiemelést a kód áttekintéséhez, valamint az „SGE böngészés közben” nevű korai kísérletet, amely összefoglalja a legfontosabb szempontokat és segíti a felhasználókat. fedezze fel az oldalakat, amikor hosszú formátumú tartalmat olvas az interneten. Ezek célja, hogy javítsák az összetett témák megértését, javítsák a kódolási információk emésztését, valamint segítsék a navigációt és a tanulást a felhasználók böngészése közben. A frissítések a Google folyamatos erőfeszítéseit tükrözik, hogy a felhasználói visszajelzések alapján fejlessze mesterséges intelligencia keresési élményét, különös tekintettel a megértésre és a kulcsfontosságú részletek kinyerésére az összetett webes tartalomból.

 
???? A Together.ai kiterjeszti a Llama2-t 32 XNUMX környezeti ablakra

A LLaMA-2-7B-32K a Together Computer által kifejlesztett nyílt forráskódú, hosszú kontextusú nyelvi modell, amely a Meta LLaMA-2 kontextushosszát 32K-ra bővíti. Olyan optimalizálásokat használ, mint a FlashAttention-2, hogy hatékonyabb következtetéseket és oktatást tegyen lehetővé. A modellt előre kiképzett adatok keverékével, beleértve a könyveket, papírokat és oktatási adatokat. Példák találhatók a hosszú formátumú minőségbiztosítási és összegzési feladatok finomhangolására. A felhasználók a Hugging Face segítségével érhetik el a modellt, vagy használhatják az OpenChatKit testreszabott finomhangolását. Mint minden nyelvi modell, a LLaMA-2-7B-32K is előállíthat elfogult vagy helytelen tartalmat, ami óvatosságot igényel.

 
A „Cikkek” rész elgondolkodtató darabokat mutat be a mesterséges intelligenciáról. Minden cikk egy adott témába mélyedik, és betekintést nyújt az olvasók számára a mesterséges intelligencia különféle aspektusaiba, beleértve az új technikákat, a forradalmi megközelítéseket és az úttörő eszközöket.

 
📰 LangChain csalólap

A LangChain segítségével a fejlesztők alkalmas mesterséges intelligencia nyelvalapú alkalmazásokat készíthetnek anélkül, hogy újra fel kellene találniuk a kereket. Összeállítható szerkezete megkönnyíti az olyan komponensek keverését, mint az LLM-ek, prompt sablonok, külső eszközök és memória. Ez felgyorsítja a prototípuskészítést, és lehetővé teszi az új képességek zökkenőmentes integrációját az idő múlásával. Akár chatbotot, minőségbiztosítási robotot vagy többlépcsős érvelési ügynököt szeretne létrehozni, a LangChain biztosítja az építőelemeket a fejlett AI gyors összeállításához.

 
📰 A ChatGPT használata szöveg PowerPoint-bemutatóvá alakításához

A cikk felvázol egy kétlépéses folyamatot a ChatGPT használatával szöveg PowerPoint prezentációvá alakítására, először a szöveget diacímekké és tartalommá összegzi, majd Python-kódot generál az összefoglaló PPTX formátumra való konvertálásához a python-pptx könyvtár használatával. Ez lehetővé teszi a hosszú szöveges dokumentumokból lebilincselő prezentációk gyors létrehozását, leküzdve a fárasztó manuális erőfeszítéseket. A ChatGPT promptok elkészítéséhez és a kód futtatásához egyértelmű utasításokat kapunk, amelyek hatékony automatizált megoldást kínálnak a prezentációs igényekre.

 
📰 Nyílt kihívások az LLM-kutatásban

A cikk áttekintést ad a 10 kulcsfontosságú kutatási irányról a nagy nyelvi modellek javítására: hallucinációk csökkentése, kontextushosszúság/konstrukció optimalizálása, multimodális adatok beépítése, modellek felgyorsítása, új architektúrák tervezése, GPU-alternatívák, például fotonikus chipek fejlesztése, használható ágensek építése, tanulás javítása. emberi visszajelzések, a chat felületek fejlesztése és a nem angol nyelvekre való kiterjesztése. Idézi az ezekre a területekre vonatkozó releváns dokumentumokat, felhívva a figyelmet az olyan kihívásokra, mint az emberi preferenciák megjelenítése a megerősített tanulásban és modellek felépítése az alacsony forrásigényű nyelvekre. A szerző arra a következtetésre jut, hogy míg egyes kérdések, például a többnyelvűség jobban kezelhetők, mások, például az építészet több áttörést igényelnek. Összességében a kutatók, a vállalatok és a közösség műszaki és nem műszaki szakértelme egyaránt kritikus fontosságú lesz az LLM-ek pozitív irányításához.

 
📰 Miért nem kell (valószínűleg) finomhangolni egy LLM-et?

A cikk áttekintést ad a 10 kulcsfontosságú kutatási irányról a nagy nyelvi modellek javítására: hallucinációk csökkentése, kontextushosszúság/konstrukció optimalizálása, multimodális adatok beépítése, modellek felgyorsítása, új architektúrák tervezése, GPU-alternatívák, például fotonikus chipek fejlesztése, használható ágensek építése, tanulás javítása. emberi visszajelzések, a chat felületek fejlesztése és a nem angol nyelvekre való kiterjesztése. Idézi az ezekre a területekre vonatkozó releváns dokumentumokat, felhívva a figyelmet az olyan kihívásokra, mint az emberi preferenciák megjelenítése a megerősített tanulásban és modellek felépítése az alacsony forrásigényű nyelvekre. A szerző arra a következtetésre jut, hogy míg egyes kérdések, például a többnyelvűség jobban kezelhetők, mások, például az építészet több áttörést igényelnek. Összességében a kutatók, a vállalatok és a közösség műszaki és nem műszaki szakértelme egyaránt kritikus fontosságú lesz az LLM-ek pozitív irányításához.

 
📰 Az OpenAI GPT-modell használatának legjobb gyakorlatai

A cikk a közösségi tapasztalatokra támaszkodva felvázolja azokat a bevált módszereket, amelyekkel az OpenAI GPT-modelljeit használva jó minőségű kimeneteket lehet elérni. Azt javasolja, hogy részletes utasításokat adjon meg olyan konkrét adatokkal, mint a hosszúság és a személy; többlépcsős utasítások; utánozandó példák; hivatkozások és idézetek; ideje a kritikai gondolkodásra; és kódvégrehajtás a pontosság érdekében. Ha követi ezeket a tippeket a modellek utasítására, például a lépések és személyek megadására, pontosabb, relevánsabb és testreszabhatóbb eredményeket kaphat. Az útmutatás célja, hogy segítse a felhasználókat a felszólítások hatékony felépítésében, hogy a legtöbbet hozzák ki az OpenAI hatékony generálási képességeiből.

 
📰 Mindannyian tévedünk az AI-val kapcsolatban

A szerző azzal érvel, hogy a jelenlegi mesterséges intelligencia-képességeket alábecsülik, és olyan példákat használ fel, mint a kreativitás, a keresés és a személyre szabás a gyakori tévhitek ellen. Kijelenti, hogy a mesterséges intelligencia kreatív lehet a fogalmak újrakombinálásával, nem csupán véletlenszerű ötletek generálásával; ez nem csak egy feltöltött keresőmotor, mint a Google; és személyre szabott kapcsolatokat fejleszthet, nem csak általános készségeket. Bár nem biztos abban, hogy melyik alkalmazások bizonyulnak majd a leghasznosabbnak, a szerző inkább nyitott gondolkodásra ösztönöz, mint elutasító magatartásra, hangsúlyozva, hogy a mesterséges intelligencia lehetőségeinek meghatározásának legjobb módja a folyamatos gyakorlati feltárás. Arra a következtetésre jutott, hogy a mesterséges intelligencia körül korlátozott a képzeletünk, és felhasználása valószínűleg messze meghaladja a jelenlegi előrejelzéseket.

 
Az „Eszközök” rész a közösség által készített hasznos alkalmazásokat és szkripteket sorolja fel azok számára, akik gyakorlati AI-alkalmazásokkal szeretnének elfoglalni. Itt számos eszköztípust talál, a nagy átfogó kódbázisoktól a kis niche szkriptekig. Vegye figyelembe, hogy az eszközöket jóváhagyás nélkül osztják meg, és semmilyen garancia nélkül. Végezze el saját házi feladatát bármilyen szoftverrel telepítés és használat előtt!

 
🇧🇷 MetaGPT: A Multi-Agent Framework

A MetaGPT egysoros követelményt használ bemenetként és kimenetként felhasználói történeteket / versenyelemzést / követelményeket / adatstruktúrákat / API-kat / dokumentumokat stb. tartalmaz. Belsőleg a MetaGPT termékmenedzsereket / építészeket / projektmenedzsereket / mérnököket tartalmaz. Ez biztosítja a szoftvercég teljes folyamatát a gondosan megtervezett SOP-okkal együtt.

 
🇧🇷 GPT LLM tréner

Ennek a projektnek a célja egy új kísérleti csővezeték feltárása egy nagy teljesítményű feladat-specifikus modell betanításához. Igyekszünk absztrahálni minden bonyolultságot, hogy a lehető legkönnyebb legyen az ötlettől -> teljesítő, teljesen betanított modelltől elmenni.

Egyszerűen írja be a feladat leírását, és a rendszer a semmiből generál egy adatkészletet, elemzi azt a megfelelő formátumba, és finomhangolja a LLaMA 2 modellt.

 
🇧🇷 DoctorGPT

A DoctorGPT egy nagy nyelvű modell, amely képes letenni az amerikai orvosi engedélyezési vizsgát. Ez egy nyílt forráskódú projekt, amelynek küldetése, hogy mindenkinek biztosítsa saját magánorvosát. A DoctorGPT a Meta Llama2 7 milliárd paraméterű Large Language Model változata, amelyet egy Medical Dialogue Dataset-en finomítottak, majd továbbfejlesztettek a Reforcement Learning & Constitutional AI segítségével. Mivel a modell mindössze 3 Gigabájt méretű, bármilyen helyi eszközre elfér, így nem kell API-t fizetni a használatáért.

 
 

Időbélyeg:

Még több KDnuggets