Dell ja Nvidia unelmoivat generatiivisista tekoälymalleista

Julkaissut Platon

seuraajia: 0

Dell-maailma Dell on yhdistänyt Nvidian tarjotakseen yrityksille työkaluja generatiivisten tekoälymallien rakentamiseen, jotka on koulutettu niiden omiin yritystietoihin sen sijaan, että ne käyttävät julkisesti saatavilla olevia tietoja, joita käyttävät yleiskäyttöiset laajakieliset mallit (LLM), kuten OpenAI:n GPT.

Avain pitoon on tietoturva. Nvidian yritystietotekniikan varatoimitusjohtaja Manuvir Das kertoi toimittajille, että yrityksen, joka rakentaa oman generatiivisen tekoälyn, joka on koulutettu omiin toimialuekohtaisiin tietoihinsa, "ei tarvitse huolehtia siitä, että heidän omistusoikeutensa sekoittuu jonkun muun yrityksen omaan tietoon koulutusta.”

Project Helix, Nvidian ja Dellin tiistaina Dell Technologies World 2023 -tapahtumassa käynnistämä järjestelmä, sisältää PowerEdge XE9680 ja R760xa-telinepalvelimet, jotka on optimoitu tekoälyharjoitteluun ja työkuormien tekemiseen. XE9680:ssa on kaksi Intelin 4. sukupolven Xeon-skaalautuvaa prosessoria, mutta siinä on myös kahdeksan Nvidian uusinta prosessoria. H100 Tensor Core -grafiikkasuorittimet yhdistetty Nvidian NVLink-verkon kautta.

Nvidia aikoo myös hyödyntää tekoälyn yritysohjelmistoja, kehyksiä ja kehittäjätyökaluja, mukaan lukien NeMo ja esikoulutetut perusmallit NeMo suojakaiteet – rakentaa turvallisia generatiivisia AI-chatbotteja. Dellin PowerScale- ja ECS Enterprise Object Storage -järjestelmiä jäsentämättömälle tiedolle voidaan käyttää PowerEdge-telinepalvelimien kanssa.

"Kaiken tämän avulla voimme koota todella täydellisen ratkaisun generatiiviseen tekoälyyn, jota voidaan käyttää paikan päällä, joka on täysin validoitu laitteistolla ja ohjelmistolla, joka on turvallinen [ja] yksityinen", Das sanoo.

Elää reunalla

Koulutus- ja päättelykuormien suorittaminen yrityksen omassa palvelinkeskuksessa on avainasemassa, jotta kriittiset yritystiedot eivät pääty julkisuuteen ja mahdollisesti. rikkoo tietosuoja- ja turvallisuusmääräykset Huangin mukaan. Generatiivisen tekoälyn tapauksessa on-prem tarkoittaa yhä enemmän reunaa.

"Heidän on tehtävä se paikan päällä, koska heidän tietonsa ovat siellä, ja heidän on tehtävä se lähellä reunaa, koska se on lähinnä valonnopeutta", Huang sanoi. "Haluat sen reagoivan välittömästi. Haluat myös sen olevan reunalla, koska haluat tulevaisuudessa saada tietoa useista modaliteeteista.

”Mitä enemmän kontekstuaalista tietoa saamme, sitä parempia… johtopäätöksiä voimme tehdä. Kyky tehdä päätökset mahdollisimman lähellä reunaa, missä toiminta on, missä kaikki data on ja missä reagointikyky voi olla mahdollisimman korkea, on todella tärkeää."

Nvidialle, joka noin vuosikymmen sitten panosti tekoälyn tulevaisuuden kasvumoottoriksi, Project Helix vahvistaa edelleen asemaansa yritysten ja HPC-organisaatioiden koneoppimisen keskeisenä mahdollistajana.

Aikana, jolloin LLM:t harjoittelevat valtavia yleiskäyttöisiä tietojoukkoja – GPT:n ja siihen rakennetun ChatGPT-botin tapauksessa Internet –, Jeffrey Clarken mukaan organisaatiot haluavat kouluttaa pienempiä malleja omiin tietoihinsa vastatakseen omiin erityistarpeisiinsa. , Dellin varapuheenjohtaja ja COO.

"Tämä on trendi, jonka näemme asiakkaiden kanssa", Clarke sanoi. "Miten he ottavat liiketoimintakontekstinsa, tietonsa ja auttavat heitä tekemään parempia liiketoimintapäätöksiä? Sinun ei tarvitse GPT-suurkielistä mallia tehdäksesi sen. … Yritykset eivät aio ottaa ChatGPT:tä käyttöön tehtaalla parantaakseen tehtaan toimintaa. Se on yrityksen X, Y tai Z lokalisoitu malli heidän tiedoineen."

Lisää hallintaa

Pyrkimys yrityksille räätälöidä koulutusmalleja omilla tietoillaan ja omissa datakeskuksissaan on saamassa vauhtia. Aiemmin tässä kuussa ServiceNow ja Nvidia julkisti kumppanuuden samanlainen kuin Project Helix. The idea ei ole uusi, mutta se on ahdettu viime aikoina nopeutuneella generatiivisten tekoälyjen ja LLM:ien kehityksellä.

Syyskuussa 2022 järjestetyssä GTC:ssä Nvidia lanseerasi NeMo LLM -palvelun tätä silmällä pitäen, mikä antaa yrityksille tavan mukauttaa erilaisia esikoulutettuja perusmalleja luodakseen räätälöityjä malleja, jotka on koulutettu heidän omiin tietoihinsa.

Yleiskäyttöiset mallit, kuten OpenAI:n GPT-4, toimivat joissakin töissä, Das sanoi, "mutta on myös suuri joukko yritysyrityksiä, joilla on oltava omat räätälöidyt laajakieliset mallit omalle toimialueelleen omien omistustietojensa vuoksi. , varmistaakseen, että mallit tekevät juuri sitä, mitä he tarvitsevat yrityksensä yhteydessä."

"NeMo on Nvidian alusta niille asiakkaille, joiden on rakennettava ja ylläpidettävä omia mallejaan."

Nvidian toimitusjohtaja Jensen Huang, joka esiintyi videokeskustelussa Clarkin kanssa pääpuheenvuoron aikana, sanoi, että "jokainen yritys on älykkyyden ytimessä".

"Project Helix … auttaa jokaista yritystä olemaan tekoälytehdas ja pystymään tuottamaan älykkyyttään, toimialuekohtaista älykkyyttään ja asiantuntemustaan ja sitten tekemään sen valonnopeudella ja mittakaavassa", Huang sanoi.

Nopea innovaatio generatiivisen tekoälyn ympärillä antaa myös yrityksille enemmän vaihtoehtoja, Dellin Clarke väitti. Project Helixiin perustuvat Dellin validoidut mallit ovat saatavilla heinäkuun alussa. ®