Tällä viikolla tekoälyssä 18. elokuuta: OpenAI taloudellisissa vaikeuksissa • Vakaus AI ilmoittaa StableCode - KDnuggets

Tällä viikolla tekoälyssä, 18. elokuuta: OpenAI taloudellisissa vaikeuksissa • Vakaus AI ilmoittaa StableCode – KDnuggets

Lähdesolmu: 2833080

### ALT ###
Kuvan on luonut Editor with Midjourney
 

Tervetuloa tämän viikon "This Week in AI" -julkaisuun KDnuggetsissa. Tämän kuratoidun viikoittaisen postauksen tavoitteena on pitää sinut ajan tasalla nopeasti kehittyvän tekoälyn maailman vakuuttavimmista kehityksestä. Uraauurtavista otsikoista, jotka muokkaavat ymmärrystämme tekoälyn roolista yhteiskunnassa, ajatuksia herättäviin artikkeleihin, oivaltaviin oppimisresursseihin ja tietojemme rajoja ylittävään tutkimukseen, tämä viesti tarjoaa kattavan yleiskatsauksen tekoälyn nykytilanteesta. Tämä viikoittainen päivitys on suunniteltu pitämään sinut ajan tasalla ja ajan tasalla tällä jatkuvasti kehittyvällä alalla. Pysy kuulolla ja mukavaa lukuhetkeä!

 
"Otsikot" -osiossa käsitellään viime viikon parhaita uutisia ja kehitystä tekoälyn alalla. Tiedot vaihtelevat valtion AI-politiikasta teknologisiin edistysaskeliin ja yritysten innovaatioihin tekoälyssä.

 
💡 ChatGPT pulassa: OpenAI saattaa mennä konkurssiin vuoteen 2024 mennessä, tekoälybotti maksaa yritykselle 700,000 XNUMX dollaria joka päivä

OpenAI:lla on taloudellisia ongelmia ChatGPT:n ja muiden tekoälypalvelujen korkeiden kustannusten vuoksi. Huolimatta nopeasta varhaisesta kasvusta ChatGPT:n käyttäjäkunta on laskenut viime kuukausina. OpenAI kamppailee tehokkaasti kaupallistaakseen teknologiansa ja tuottaakseen kestävää tuloa. Samaan aikaan se polttaa edelleen käteistä hälyttävää vauhtia. Kilpailun kiihtyessä ja yritysten GPU-pulasta mallinkehityksen esteenä OpenAI:n on etsittävä pikaisesti polkuja kannattavuuteen. Jos se ei onnistu, konkurssi voi olla uraauurtavan tekoälyn startup-yrityksen horisontissa.

 
💡 Stability AI julkistaa StableCoden, AI-koodausavustajan kehittäjille

Stability AI on julkaissut StableCoden, ensimmäisen ohjelmistokehitykseen optimoidun generatiivisen tekoälytuotteensa. StableCode sisältää useita malleja, jotka on koulutettu yli 500 miljardiin kooditunnisteeseen älykkään automaattisen täydennyksen tarjoamiseksi, luonnollisen kielen ohjeiden vastaamiseksi ja pitkien koodijaksojen hallitsemiseksi. Keskusteleva tekoäly osaa jo kirjoittaa koodia, mutta StableCode on suunniteltu parantamaan ohjelmoijan tuottavuutta ymmärtämällä koodin rakennetta ja riippuvuuksia. Erikoiskoulutuksensa ja pitkiä konteksteja käsittelevien mallien avulla StableCode pyrkii parantamaan kehittäjien työnkulkuja ja alentamaan koodaajien pääsyn esteitä. Laukaisu edustaa Stability AI:n tutkimusta tekoälyavusteisten koodaustyökalujen parissa avaruudessa kasvavan kilpailun keskellä.

 
💡 Esittelyssä OpenAI:n Superalignment

OpenAI työskentelee ennakoivasti torjuakseen superälykkään tekoälyn mahdollisia riskejä uuden Superalignment-tiiminsä avulla, joka käyttää tekniikoita, kuten ihmisten palautteen avulla tapahtuvaa oppimista AI-järjestelmien kohdistamiseen. Keskeisiä tavoitteita ovat skaalautuvien koulutusmenetelmien kehittäminen muita tekoälyjärjestelmiä hyödyntäen, mallin kestävyyden validointi ja täyden kohdistusputken stressitestaus jopa tahallisesti väärin kohdistetuilla malleilla. Kaiken kaikkiaan OpenAI pyrkii osoittamaan, että koneoppiminen voidaan suorittaa turvallisesti uraauurtavilla lähestymistavoilla ohjata superälyä vastuullisesti.

 
💡 Opi samalla kun etsit (ja selaat) generatiivisen tekoälyn avulla

Google ilmoittaa useista päivityksistä Search Engine Generation (SGE) AI-ominaisuuksiinsa, mukaan lukien hover-määritykset tieteen/historian aiheille, värikoodattu syntaksin korostus koodien yleiskatsauksia varten ja varhainen kokeilu nimeltä "SGE selatessa", joka tiivistää tärkeimmät kohdat ja auttaa käyttäjiä. tutkia sivuja lukiessasi pitkäkestoista sisältöä verkossa. Niiden tarkoituksena on parantaa monimutkaisten aiheiden ymmärtämistä, parantaa koodaustiedon sulattamista ja auttaa navigoinnissa ja oppimisessa käyttäjien selattaessa. Päivitykset edustavat Googlen jatkuvaa pyrkimystä kehittää tekoälyhakukokemustaan ​​käyttäjien palautteen perusteella keskittyen ymmärtämiseen ja tärkeiden yksityiskohtien poimimiseen monimutkaisesta verkkosisällöstä.

 
💡 Together.ai laajentaa Llama2:ta 32 XNUMX kontekstiikkunaan

LLaMA-2-7B-32K on Together Computerin kehittämä avoimen lähdekoodin pitkän kontekstin kielimalli, joka laajentaa Metan LLaMA-2:n kontekstin pituuden 32 2 tokeneihin. Se hyödyntää optimointeja, kuten FlashAttention-2, mahdollistaa tehokkaamman päättelyn ja koulutuksen. Malli oli esikoulutettu käyttämällä erilaisia ​​tietoja, kuten kirjoja, papereita ja opetustietoja. Esimerkkejä tarjotaan pitkän muodon laadunvarmistus- ja yhteenvetotehtävien hienosäätöön. Käyttäjät voivat käyttää mallia Hugging Facen kautta tai käyttää OpenChatKitin mukautettua hienosäätöä. Kuten kaikki kielimallit, LLaMA-7-32B-XNUMXK voi tuottaa puolueellista tai virheellistä sisältöä, mikä vaatii varovaisuutta käytössä.

 
Artikkelit-osiossa esitellään joukko ajatuksia herättäviä teoksia tekoälystä. Jokainen artikkeli sukeltaa syvälle tiettyyn aiheeseen ja tarjoaa lukijoille näkemyksiä tekoälyn eri puolista, mukaan lukien uudet tekniikat, vallankumoukselliset lähestymistavat ja uraauurtavat työkalut.

 
📰 LangChain-huijauslehti

LangChainin avulla kehittäjät voivat rakentaa valmiita tekoälyn kielipohjaisia ​​sovelluksia keksimättä pyörää uudelleen. Sen koostettava rakenne tekee komponenttien, kuten LLM:ien, kehotepohjien, ulkoisten työkalujen ja muistin, sekoittamisen ja yhdistämisen helposti. Tämä nopeuttaa prototyyppien valmistusta ja mahdollistaa uusien ominaisuuksien saumattoman integroinnin ajan myötä. Halusitpa sitten luoda chatbotin, QA-botin tai monivaiheisen päättelyagentin, LangChain tarjoaa rakennuspalikat kehittyneen AI:n nopeaan kokoamiseen.

 
📰 ChatGPT:n käyttäminen tekstin muuntamiseen PowerPoint-esitykseksi

Artikkelissa hahmotellaan kaksivaiheinen prosessi ChatGPT:n käyttämiseksi tekstin muuntamiseen PowerPoint-esitykseksi, ensin yhteenveto tekstistä diojen otsikoiksi ja sisällöksi ja sitten Python-koodin luominen yhteenvedon muuntamiseksi PPTX-muotoon python-pptx-kirjaston avulla. Tämä mahdollistaa kiinnostavien esitysten nopean luomisen pitkistä tekstiasiakirjoista, mikä ohittaa ikävän manuaalisen työn. Selkeät ohjeet ChatGPT-kehotteiden luomiseen ja koodin suorittamiseen tarjoavat tehokkaan automatisoidun ratkaisun esitystarpeisiin.

 
📰 Avoimet haasteet LLM-tutkimuksessa

Artikkeli tarjoaa yleiskatsauksen 10 keskeisestä tutkimussuunnasta suurten kielimallien parantamiseksi: hallusinaatioiden vähentäminen, kontekstin pituuden/rakenteen optimointi, multimodaalisen datan sisällyttäminen, mallien nopeuttaminen, uusien arkkitehtuurien suunnittelu, GPU-vaihtoehtojen, kuten fotonisirujen, kehittäminen, käyttökelpoisten aineiden rakentaminen, oppimisen parantaminen ihmisten palaute, chat-käyttöliittymien parantaminen ja laajentaminen muille kuin englannin kielille. Se lainaa asiaankuuluvia julkaisuja näillä aloilla ja panee merkille haasteita, kuten ihmisten mieltymysten esittämisen vahvistavaan oppimiseen ja mallien rakentamiseen vähän resursseja vaativille kielille. Kirjoittaja päättelee, että vaikka jotkut asiat, kuten monikielisyys, ovat paremmin selvitettävissä, toiset, kuten arkkitehtuuri, vaativat enemmän läpimurtoja. Kaiken kaikkiaan sekä tekninen että ei-tekninen asiantuntemus tutkijoiden, yritysten ja yhteisön välillä on kriittistä ohjattaessa LLM:itä myönteisesti.

 
📰 Miksi sinun (luultavasti) ei tarvitse hienosäätää LLM:ää

Artikkeli tarjoaa yleiskatsauksen 10 keskeisestä tutkimussuunnasta suurten kielimallien parantamiseksi: hallusinaatioiden vähentäminen, kontekstin pituuden/rakenteen optimointi, multimodaalisen datan sisällyttäminen, mallien nopeuttaminen, uusien arkkitehtuurien suunnittelu, GPU-vaihtoehtojen, kuten fotonisirujen, kehittäminen, käyttökelpoisten aineiden rakentaminen, oppimisen parantaminen ihmisten palaute, chat-käyttöliittymien parantaminen ja laajentaminen muille kuin englannin kielille. Se lainaa asiaankuuluvia julkaisuja näillä aloilla ja panee merkille haasteita, kuten ihmisten mieltymysten esittämisen vahvistavaan oppimiseen ja mallien rakentamiseen vähän resursseja vaativille kielille. Kirjoittaja päättelee, että vaikka jotkut asiat, kuten monikielisyys, ovat paremmin selvitettävissä, toiset, kuten arkkitehtuuri, vaativat enemmän läpimurtoja. Kaiken kaikkiaan sekä tekninen että ei-tekninen asiantuntemus tutkijoiden, yritysten ja yhteisön välillä on kriittistä ohjattaessa LLM:itä myönteisesti.

 
📰 Parhaat käytännöt OpenAI GPT -mallin käyttöön

Artikkelissa hahmotellaan parhaita käytäntöjä korkealaatuisten tulosten saamiseksi OpenAI:n GPT-malleja käytettäessä yhteisön kokemuksen pohjalta. Se suosittelee yksityiskohtaisten kehotteiden antamista yksityiskohdista, kuten pituus ja persoona; monivaiheiset ohjeet; matkittavia esimerkkejä; viittaukset ja lainaukset; kriittisen ajattelun aika; ja koodin suoritus tarkkuuden vuoksi. Näiden mallien ohjeistamiseen, kuten vaiheiden ja henkilöiden määrittämiseen, liittyvien vinkkien noudattaminen voi johtaa tarkempiin, osuvampiin ja muokattavissa oleviin tuloksiin. Ohjeiden tarkoituksena on auttaa käyttäjiä jäsentämään kehotteita tehokkaasti, jotta he saavat kaiken irti OpenAI:n tehokkaista luontiominaisuuksista.

 
📰 Olemme kaikki väärässä tekoälyn suhteen

Kirjoittaja väittää, että nykyiset tekoälykyvyt ovat aliarvioituja. Hän käyttää esimerkkejä, kuten luovuus, haku ja personointi yleisten väärinkäsitysten torjumiseksi. Hän toteaa, että tekoäly voi olla luova yhdistämällä käsitteitä uudelleen, ei pelkästään luomalla satunnaisia ​​ideoita; se ei ole vain ahdettu hakukone, kuten Google; ja se voi kehittää henkilökohtaisia ​​​​suhteita, ei vain yleisiä taitoja. Vaikka ei ole varma, mitkä sovellukset osoittautuvat hyödyllisimmiksi, kirjoittaja kehottaa avoimuutta mieluummin kuin irtisanoutumaan ja korostaa, että paras tapa määrittää tekoälyn mahdollisuudet on jatkuva käytännönläheinen tutkiminen. Hän päättelee, että mielikuvituksemme tekoälystä on rajallinen ja sen käyttö todennäköisesti ylittää nykyiset ennusteet.

 
"Työkalut" -osiossa luetellaan hyödyllisiä sovelluksia ja skriptejä, jotka yhteisö on luonut niille, jotka haluavat olla kiireisiä käytännön tekoälysovellusten parissa. Täältä löydät valikoiman työkalutyyppejä suurista kattavista koodikannoista pieniin niche-skripteihin. Huomaa, että työkalut jaetaan ilman hyväksyntää ja ilman minkäänlaista takuuta. Tee omat läksysi mistä tahansa ohjelmistosta ennen asennusta ja käyttöä!

 
🛠️ MetaGPT: Multi-Agent Framework

MetaGPT ottaa yhden rivin vaatimuksen syötteenä ja tulostaa käyttäjätarinoita / kilpailuanalyysiä / vaatimuksia / tietorakenteita / API:ita / asiakirjoja jne. Sisäisesti MetaGPT sisältää tuotepäälliköitä / arkkitehteja / projektipäälliköitä / insinöörejä. Se tarjoaa ohjelmistoyrityksen koko prosessin sekä huolellisesti organisoidut SOP:t.

 
🛠️ GPT LLM -kouluttaja

Tämän projektin tavoitteena on tutkia uutta kokeellista putkilinjaa tehokkaan tehtäväkohtaisen mallin kouluttamiseksi. Pyrimme poistamaan kaiken monimutkaisuuden, jotta ideasta -> suoriutuvasta täysin koulutetusta mallista siirtyminen on mahdollisimman helppoa.

Syötä vain kuvaus tehtävästäsi, ja järjestelmä luo tietojoukon tyhjästä, jäsentää sen oikeaan muotoon ja hienosäätää LLaMA 2 -mallin puolestasi.

 
🛠️ DoctorGPT

DoctorGPT on laaja kielimalli, joka voi läpäistä Yhdysvaltain lääketieteellisen lisenssikokeen. Tämä on avoimen lähdekoodin projekti, jonka tehtävänä on tarjota jokaiselle oma yksityinen lääkäri. DoctorGPT on versio Metan Llama2:n 7 miljardin parametrin Large Language Model -mallista, jota hienosäädettiin Medical Dialogue Datasetin avulla ja jota parannettiin sitten edelleen käyttämällä vahvistusoppimista ja konstituutiota tekoälyä. Koska malli on kooltaan vain 3 gigatavua, se sopii kaikille paikallisille laitteille, joten sen käyttämisestä ei tarvitse maksaa API:a.

 
 

Aikaleima:

Lisää aiheesta KDnuggets