Foundational Models At The Edge - IBM Blog

Taasavaldanud Platon

järgijaid: 0

Põhimudelid äärel – IBMi ajaveeb

September 20, 2023

Põhimudelid (FM-id) tähistavad uue ajastu algust masinõpe (ML) ja tehisintellekt (AI), mis viib tehisintellekti kiirema arenguni, mida saab kohandada paljude allavoolu ülesannete jaoks ja peenhäälestada mitmesuguste rakenduste jaoks.

Kuna töö tegemisel andmete töötlemise tähtsus kasvab, võimaldab tehisintellekti mudelite teenindamine ettevõtte servas peaaegu reaalajas prognoosida, järgides samal ajal andmete suveräänsuse ja privaatsusnõudeid. Kombineerides IBM watsonx Andme- ja tehisintellekti platvormi võimalused servaarvutusega FM-seadmete jaoks, ettevõtted saavad kasutada tehisintellekti töökoormust FM-i peenhäälestamiseks ja järelduste tegemiseks tööserval. See võimaldab ettevõtetel AI juurutamist äärealadel skaleerida, vähendades kiirema reageerimisajaga juurutamiseks kuluvat aega ja kulusid.

Kontrollige kindlasti kõiki selle ajaveebi postituste sarja osamakseid äärearvutite kohta:

Mis on põhimudelid?

Põhimudelid (FM-id), mida koolitatakse laiaulatuslikult märgistamata andmete põhjal, juhivad tehisintellekti (AI) nüüdisaegseid rakendusi. Neid saab kohandada paljude järgnevate ülesannete jaoks ja peenhäälestada mitmesuguste rakenduste jaoks. Kaasaegsed tehisintellekti mudelid, mis täidavad konkreetseid ülesandeid ühes domeenis, annavad teed FM-idele, kuna nad õpivad üldisemalt ning töötavad üle valdkonna ja probleemide. Nagu nimigi ütleb, võib FM olla paljude AI-mudeli rakenduste aluseks.

FM-id käsitlevad kahte peamist väljakutset, mis on takistanud ettevõtetel tehisintellekti kasutuselevõttu skaleerimast. Esiteks toodavad ettevõtted suurel hulgal märgistamata andmeid, millest vaid murdosa on märgistatud tehisintellekti mudeli koolituseks. Teiseks on see sildistamise ja annoteerimise ülesanne äärmiselt inimmahukas, nõudes sageli mitusada tundi teemaeksperdi (VKE) aega. See muudab kasutusjuhtude ulatuses skaleerimise kulukaks, kuna selleks oleks vaja VKEde ja andmeekspertide armeed. Suure hulga märgistamata andmete neelamise ja mudelikoolituse enesejärelevalve tehnikate kasutamisega on FM-id need kitsaskohad kõrvaldanud ja avanud võimaluse tehisintellekti laialdaseks kasutuselevõtuks kogu ettevõttes. Need tohutud andmemahud, mis on olemas igas ettevõttes, ootavad vallandamist, et saada teadmisi.

Mis on suured keelemudelid?

Suured keelemudelid (LLM) on põhimudelite (FM) klass, mis koosneb kihtidest närvivõrgud keda on koolitatud nende tohutute märgistamata andmete koguste kohta. Nad kasutavad mitmesuguste toimingute tegemiseks iseseisvalt juhendatud õppealgoritme loomuliku keele töötlemine (NLP) ülesandeid viisil, mis on sarnane sellele, kuidas inimesed keelt kasutavad (vt joonis 1).

Joonis 1. Suured keelemudelid (LLM-id) on tehisintellekti valdkonna tormiliselt vallutanud.

Skaleerige ja kiirendage tehisintellekti mõju

Põhimudeli (FM) loomiseks ja juurutamiseks on mitu sammu. Need hõlmavad andmete sissevõtmist, andmete valimist, andmete eeltöötlust, FM-i eelkoolitust, mudeli häälestamist ühe või mitme allavoolu ülesande jaoks, järelduste esitamist ning andmete ja tehisintellekti mudeli juhtimist ja elutsükli haldamist – kõike seda võib kirjeldada kui FMOps.

Selle kõige vastu abistamiseks pakub IBM ettevõtetele vajalikke tööriistu ja võimalusi nende FM-ide võimsuse kasutamiseks. IBM watsonx, ettevõtte jaoks valmis tehisintellekti- ja andmeplatvorm, mis on loodud tehisintellekti mõju mitmekordistamiseks kogu ettevõttes. IBM watsonx koosneb järgmistest osadest:

IBM watsonx.ai toob uut generatiivne AI FM-i ja traditsioonilise masinõppe (ML) jõul töötavad võimsad stuudiod, mis hõlmavad AI elutsüklit.
IBM watsonx.data on otstarbekohane andmesalv, mis on ehitatud avatud järvehoone arhitektuurile, et kohandada tehisintellekti töökoormust kõigi teie andmete jaoks kõikjal.
IBM watsonx.governance on täielik automatiseeritud tehisintellekti elutsükli juhtimise tööriistakomplekt, mis on loodud vastutustundlike, läbipaistvate ja seletatavate tehisintellekti töövoogude võimaldamiseks.

Teine oluline tegur on andmetöötluse kasvav tähtsus ettevõtte servas, näiteks tööstuskohtades, tootmiskorrustes, jaemüügikauplustes, telco servades jne. Täpsemalt võimaldab tehisintellekt ettevõtte servas töödelda andmeid seal, kus tehakse tööd. peaaegu reaalajas analüüs. Ettevõtte eelis on see, kus genereeritakse tohutul hulgal ettevõtte andmeid ja kus tehisintellekt võib pakkuda väärtuslikku, õigeaegset ja teostatavat äriteavet.

AI-mudelite serveerimine võimaldab peaaegu reaalajas prognoosida, järgides samal ajal andmete suveräänsuse ja privaatsusnõudeid. See vähendab oluliselt kontrolliandmete hankimise, edastamise, teisendamise ja töötlemisega sageli seotud latentsust. Äärepealne töötamine võimaldab meil kaitsta tundlikke ettevõtteandmeid ja vähendada andmeedastuskulusid kiirema reageerimisajaga.

Tehisintellekti juurutuste skaleerimine äärealadel ei ole andmete (heterogeensus, maht ja regulatiivne) ja piiratud ressursside (arvutus, võrguühenduvus, salvestus- ja isegi IT-oskused) tõttu lihtne ülesanne. Neid võib laias laastus kirjeldada kahes kategoorias:

Aeg/kulu juurutamiseks: Iga juurutamine koosneb mitmest riist- ja tarkvara kihist, mis tuleb enne juurutamist installida, konfigureerida ja testida. Tänapäeval võib hooldusspetsialistil paigaldamiseks kuluda kuni nädal või kaks igas kohas, piirab oluliselt seda, kui kiiresti ja kulutõhusalt saavad ettevõtted oma organisatsioonis kasutuselevõttu laiendada.
2. päeva juhtimine: Kasutusele võetud servade suur arv ja iga juurutuse geograafiline asukoht võivad sageli muuta igas asukohas kohaliku IT-toe pakkumise nende juurutuste jälgimiseks, hooldamiseks ja värskendamiseks ülemäära kulukaks.

Edge AI juurutamine

IBM töötas välja servaarhitektuuri, mis lahendab need väljakutsed, tuues integreeritud riistvara/tarkvara (HW/SW) seadme mudeli AI-juurutustesse. See koosneb mitmest võtmeparadigmast, mis aitavad AI juurutamise skaleeritavust:

Poliitikapõhine kogu tarkvarapakki null-puutevaba varustamine.
Servasüsteemi tervise pidev jälgimine
Võimalus hallata ja edastada tarkvara/turbe/konfiguratsiooni värskendusi paljudesse servakohtadesse – kõike seda kesksest pilvepõhisest asukohast teise päeva haldamiseks.

Jaotatud jaoturi- ja kodaraarhitektuuri saab kasutada ettevõtte tehisintellekti juurutuste skaleerimiseks äärel, kus keskne pilve- või ettevõtte andmekeskus toimib jaoturina ja serv-in-a-box seade toimib servas kodarana.. See rummu- ja kodaramudel, mis ulatub üle hübriidpilve- ja servakeskkondade, illustreerib kõige paremini tasakaalu, mis on vajalik FM-toiminguteks vajalike ressursside optimaalseks kasutamiseks (vt joonis 2).

Joonis 2. Jaoturi ja kodaraga juurutamise konfiguratsioon ettevõtte AI jaoks servades.

Nende suurte põhikeelemudelite (LLM) ja muud tüüpi alusmudelite eelkoolitus, mis kasutab enesejärelevalve tehnikaid suurtes märgistamata andmekogumites, nõuab sageli märkimisväärseid arvutusressursse (GPU) ja seda on kõige parem teostada keskuses. Peaaegu piiramatud arvutusressursid ja sageli pilves talletatavad suured andmekuhjad võimaldavad suurte parameetrite mudelite eelkoolitamist ja nende baasmudelite täpsuse pidevat parandamist.

Teisest küljest saab nende põhi-FM-ide häälestada allavoolu ülesannete jaoks – mis nõuavad vaid mõnda kümneid või sadu märgistatud andmenäidiseid ja järelduste esitamist – ainult mõne ettevõtte servas asuva GPU-ga. See võimaldab tundlikel märgistatud andmetel (või ettevõtte kroonijuveeli andmetel) ettevõtte töökeskkonnas turvaliselt püsida, vähendades samal ajal andmeedastuskulusid.

Kasutades täielikku lähenemist rakenduste juurutamiseks äärealadel, saab andmeteadlane mudeleid peenhäälestada, testida ja juurutada. Seda on võimalik saavutada ühes keskkonnas, vähendades samal ajal uute tehisintellekti mudelite lõppkasutajatele pakkumise arendustsüklit. Platvormid nagu Red Hat OpenShift Data Science (RHODS) ja hiljuti välja kuulutatud Red Hat OpenShift AI pakuvad tööriistu tootmisvalmis tehisintellekti mudelite kiireks arendamiseks ja juurutamiseks. hajutatud pilv ja äärekeskkonnad.

Lõpuks vähendab peenhäälestatud tehisintellekti mudeli teenindamine ettevõtte servas oluliselt andmete hankimise, edastamise, teisendamise ja töötlemisega sageli seotud latentsust. Pilves toimuva eelkoolituse lahtisidumine peenhäälestusest ja äärepealt järelduste tegemisest alandab üldisi tegevuskulusid, vähendades mis tahes järeldustoiminguga seotud aega ja andmete liikumise kulusid (vt joonis 3).

Joonis 3. Väärtuspakkumine FM peenhäälestuse ja järelduste tegemiseks operatiivservas serv-in-a-box abil. Eeskujulik kasutusjuht ehitusinseneriga, kes kasutab sellist FM-mudelit peaaegu reaalajas defektide tuvastamiseks, kasutades drooni kujutiste sisendeid.

Selle väärtuspakkumise täielikuks demonstreerimiseks viimistleti tsiviilinfrastruktuuri näidisnägemus-trafol põhinev alusmudel (eelkoolitatud, kasutades avalikke ja kohandatud tööstusharuspetsiifilisi andmekogumeid) ja kasutati järelduste tegemiseks kolme sõlme serval. (kodara) kobar. Tarkvarapakk sisaldas Red Hat OpenShift Container Platformi ja Red Hat OpenShift Data Science'i. See servaklaster oli ühendatud ka Red Hat Advanced Cluster Management for Kubernetes (RHACM) jaoturiga, mis töötab pilves.

Nullpuutevarustamine

Poliitikapõhine null-touch etteandmine viidi läbi Red Hat Advanced Cluster Management for Kubernetes (RHACM) abil poliitikate ja paigutusmärgendite kaudu, mis seovad konkreetsed servaklastrid tarkvarakomponentide ja konfiguratsioonide komplektiga. Need tarkvarakomponendid, mis ulatuvad üle kogu virna ja katavad arvutusi, salvestust, võrku ja tehisintellekti töökoormust, installiti erinevate OpenShift-operaatorite, vajalike rakendusteenuste ja S3 ämbri (salvestusruumi) abil.

Tsiviilinfrastruktuuri eelkoolitatud alusmudel (FM) viidi läbi Red Hat OpenShift Data Science'i (RHODS) Jupyteri sülearvuti abil, kasutades märgistatud andmeid, et klassifitseerida kuut tüüpi betoonsildadel leitud defekte. Selle peenhäälestatud FM-i järelduste edastamist demonstreeriti ka Tritoni serveriga. Lisaks sai selle servasüsteemi seisundi jälgimise võimalikuks, koondades vaadeldavuse mõõdikud riist- ja tarkvarakomponentidest Prometheuse kaudu pilves asuvasse RHACM-i kesksele armatuurlauale. Tsiviilinfrastruktuuri ettevõtted saavad neid FM-e juurutada oma servades ja kasutada droonipilte, et tuvastada peaaegu reaalajas defekte, kiirendades ülevaate saamiseks kuluvat aega ja vähendades suure hulga kõrglahutusega andmete pilve ja sealt teisaldamise kulusid.

kokkuvõte

Kombineerimine IBM watsonx Andme- ja tehisintellekti platvormi võimalused alusmudelite (FM) jaoks koos serv-in-a-box seadmega võimaldavad ettevõtetel käitada tehisintellekti töökoormust FM-i peenhäälestamiseks ja järelduste tegemiseks tööserval. See seade saab hakkama keerukate kasutusjuhtudega ja loob tsentraliseeritud halduse, automatiseerimise ja iseteeninduse jaoturi ja kodaraga raamistiku. Edge FM-i juurutamist saab vähendada nädalatelt tundideni, saavutades korduva edu, suurema vastupidavuse ja turvalisuse.

Lisateavet põhimudelite kohta

Kontrollige kindlasti kõiki selle ajaveebi postituste sarja osamakseid äärearvutite kohta:

Kategooriad

Peamised tööstusinsenerid, globaalne tootmisharu, IBMi tööstusakadeemia

IBM Researchi vanemtarkvaraarhitekt

Hajutatud infrastruktuuri ja võrguhalduse uuringud, meisterleiutaja

Rohkem Cloudist

September 20, 2023

Temenos toob IBM Cloudi uuenduslikud maksevõimalused, et aidata pankadel muutuda

3 min loetud - Maksete ökosüsteem on muutumise pöördepunktis ja me usume, et nüüd on aeg muutusteks. Kuna pangad soovivad oma maksete teekonda ajakohastada, on Temenos Payments Hubist saanud esimene spetsiaalne makselahendus, mis pakub uuenduslikke maksevõimalusi IBM Cloud for Financial Services® -valdkonnaspetsiifilises platvormis, mis on loodud finantsasutuste digitaalsete ümberkujundamiste kiirendamiseks koos turvalisusega esirinnas. See on meie pika ajaloo uusim algatus, mis aitab klientidel muutuda. Temenose maksetega…

September 18, 2023

Maksete moderniseerimise järgmine laine: keerukuse minimeerimine kliendikogemuse parandamiseks

3 min loetud - Maksete ökosüsteem on ümberkujundamise pöördepunktis, eriti kui näeme häirivate digitaalsete sisenejate tõusu, kes võtavad kasutusele uusi makseviise, nagu krüptovaluutad ja keskpanga digitaalsed valuutad (CDBC). Kuna klientidele on rohkem valikuvõimalusi, muutub rahakoti osa hõivamine traditsiooniliste pankade jaoks konkurentsivõimelisemaks. See on vaid üks näide paljudest, mis näitavad, kuidas maksete ruum on arenenud. Samal ajal näeme üha enam, et reguleerivad asutused jälgivad hoolikamalt tööstuse…

September 18, 2023

IBM Connected Trade Platform aitab kaasa kaubanduse ja tarneahela rahastamise digiteerimisele

4 min loetud - Täna näeme kaubanduse ja tarneahela rahastamise valdkonnas olulisi digitaalseid häireid, mida suuresti mõjutavad globaalsed sündmused ja geopoliitika, regulatsioonide muutumine, vastavus- ja kontrollinõuded, tehnoloogia ja innovatsiooni areng ning juurdepääs kapitalile. Kui neid häirijaid lähemalt uurida, on selge, et ülemaailmset kaubandust ja tarneahela rahastamist võivad mõjutada paljud tegurid. Need võivad ulatuda kõrgenenud inflatsioonist (mis võib põhjustada marginaali…

September 15, 2023

Salvestage SSH-seansse turvaliselt RHEL-is privaatses VPC-võrgus

5 min loetud - Sellest ajaveebi postitusest saate teada, kuidas salvestada SSH-seansse Red Hat Enterprise Linuxi (RHEL) VSI-s privaatses VPC-võrgus, kasutades sisseehitatud pakette. VPC privaatvõrk on varustatud Terraformi kaudu ja RHEL-paketid installitakse Ansible automatiseerimise abil. Lisaks saate teada, kuidas seadistada kõrgetasemelist bastioni hosti. Mis on seansi salvestamine ja miks seda vaja on? Bastioni host ja hüppeserver on mõlemad turvamehhanismid, mida kasutatakse võrgus ja…

SEO-põhise sisu ja PR-levi. Võimenduge juba täna.
PlatoData.Network Vertikaalne generatiivne Ai. Jõustage ennast. Juurdepääs siia.
PlatoAiStream. Web3 luure. Täiustatud teadmised. Juurdepääs siia.
PlatoESG. Süsinik, CleanTech, Energia, Keskkond päikeseenergia, Jäätmekäitluse. Juurdepääs siia.
PlatoTervis. Biotehnoloogia ja kliiniliste uuringute luureandmed. Juurdepääs siia.
Allikas: https://www.ibm.com/blog/foundational-models-at-the-edge/

Ajatempel: September 20, 2023

Ajatempel: Jan 12, 2024

Taasavaldanud Platon

Mis on põhimudelid?

Mis on suured keelemudelid?

Skaleerige ja kiirendage tehisintellekti mõju

Edge AI juurutamine

Nullpuutevarustamine

kokkuvõte

Kategooriad

Rohkem Cloudist

Temenos toob IBM Cloudi uuenduslikud maksevõimalused, et aidata pankadel muutuda

Maksete moderniseerimise järgmine laine: keerukuse minimeerimine kliendikogemuse parandamiseks

IBM Connected Trade Platform aitab kaasa kaubanduse ja tarneahela rahastamise digiteerimisele

Salvestage SSH-seansse turvaliselt RHEL-is privaatses VPC-võrgus

Pangandus finantsteenuste suurarvuti juhitud digitaalse ümberkujundamise kohta – IBMi ajaveeb

Kübervastupidavuse rakendamine DORA lahendustele – IBMi ajaveeb

Meist

Vertikaalne otsing ja Ai

Platvorm

Püsi ühenduses

konto