Modelele AI generative ar putea fi antrenate în grupuri masive de GPU, dar Cloudflare susține că locul evident pentru a le rula nu este doar la margine, ci în rețea însăși.
Miercuri gigantul livrărilor a anunțat o suită de servicii de inteligență artificială care vizează eliminarea complexității implementării și rulării modelelor în limbaj mare (LLM) și a altor algoritmi de învățare automată (ML), obținând în același timp cea mai scăzută latență posibilă.
Ei bine, de fapt, cea mai mică latență posibilă ar fi obținută prin rularea sarcinii de lucru de inferență pe dispozitivul utilizatorului. Intel a făcut o mare afacere în acest sens, pentru meciurile ascensiunea generației de PC-uri AI, săptămâna trecută la Intel Innovation. Dar, deși acest lucru ar putea avea sens în unele cazuri, Cloudflare susține că dispozitivele locale nu sunt încă suficient de puternice.
„Acest lucru face din rețea bucăți de aur ale inferenței. Nu prea departe, cu o putere de calcul suficientă – exact corect”, scrie biz.
Fără server pentru GPU
Suita AI cuprinde trei servicii de bază. Prima dintre acestea este o extensie a platformei Workers fără server pentru a suporta sarcinile de lucru accelerate GPU. Numit Workers AI, serviciul este conceput pentru a simplifica procesul de implementare a modelelor pre-instruite.
„Fără experiență în învățarea automată, fără a căuta GPU-uri. Alegeți unul dintre modelele furnizate și plecați”, susține Cloudflare.
Ni s-a spus că platforma rulează pe GPU-uri Nvidia, deși Cloudflare nu ne-a spus care dintre ele. „Tehnologia construită de Cloudflare poate împărți o sarcină de inferență pe mai multe GPU-uri diferite, pentru că ne ocupăm de programare și de sistem și vom decide ce cip sau cipuri au cel mai mult sens pentru a le oferi”, a spus acesta. Registrul într-o declarație.
În interesul simplității, platforma nu acceptă – cel puțin nu inițial – modelele furnizate de clienți. Ni s-a spus că intenționează să lanseze acest lucru funcțional în viitor, dar, deocamdată, este limitat la șase modele pre-antrenate, care includ:
- Meta's Llama 2 7B Int8 pentru generarea de text
- M2m100-1.2 de la Meta pentru traducere
- Whisper de la OpenAI pentru recunoașterea vorbirii
- Distilbert-sst-2-int8 de la Hugging Face pentru clasificarea textului
- Microsoft Resnet-50 pentru clasificarea imaginilor
- Bge-base-en-v1.5 de la Baai pentru încorporare
Cu toate acestea, Cloudflare spune că lucrează pentru a extinde această listă în viitorul apropiat. La fel ca mulți aspiranți la IA, a făcut-o solicitat ajutorul Hugging Face pentru a optimiza modele suplimentare pentru serviciu.
Nu este clar dacă există o limită a dimensiunii modelelor pe care platforma le poate suporta, dar lista inițială oferă câteva indicii. Cloudflare pune la dispoziție Llama 2 LLM cu parametrii de șapte miliarde de la Meta rulând la Int8, ceea ce ar necesita aproximativ 7 GB de memorie GPU. Compania notează, de asemenea, că „dacă doriți să rulați versiuni de modele cu sute de miliarde de parametri, cloudul centralizat va fi mai potrivit pentru volumul dvs. de lucru”.
Odată pus în funcțiune, Cloudflare spune că clienții pot integra serviciul în aplicațiile lor folosind API-urile REST sau legându-l în front-end-ul site-ului lor Pages.
Rezumând
Deoarece Workers AI acceptă doar deducerea modelelor pre-instruite, Cloudflare spune că a dezvoltat un serviciu de baze de date vectoriale numit Vectorize pentru a facilita modelele ML să transmită datele clienților utilizatorilor.
De exemplu, pentru un chatbot, un client ar putea să-și încarce catalogul de produse în baza de date vectorială, din care modelul l-ar transforma într-un activ încorporat.
Ideea pare să fie că, în timp ce modelul Llama 2 oferit de Cloudflare ar putea să nu aibă cunoștințe specifice despre datele unui client, chatbot-ul poate încă scoate la iveală informații relevante prin legarea la serviciul de bază de date. Potrivit Cloudflare, această abordare face deducerea mai accesibilă, mai rapidă și mai puțin intensivă în resurse, deoarece decuplează datele clienților de modelul în sine.
Pe lângă Workers AI și Vectorize, suita AI Cloudflare include și o platformă pentru monitorizarea, optimizarea și gestionarea sarcinilor de lucru de inferență la scară.
Numit AI Gateway, serviciul aplică mai multe caracteristici asociate în mod obișnuit cu rețelele de livrare a conținutului și cu proxy-urile web, cum ar fi stocarea în cache și limitarea ratei, pentru inferența AI pentru a ajuta clienții să controleze costurile.
„Prin memorarea în cache a răspunsurilor AI utilizate frecvent, reduce latența și sporește fiabilitatea sistemului, în timp ce limitarea ratei asigură o alocare eficientă a resurselor, atenuând provocările legate de creșterea costurilor AI”, explică compania în postarea pe blog.
Prețuri și disponibilitate
Cloudflare observă că serviciul este încă în fazele incipiente de implementare, având șapte site-uri online astăzi. Cu toate acestea, compania implementează GPU-uri pentru a aduce serviciul la 100 de puncte de prezență până la sfârșitul anului și „aproape peste tot” până la sfârșitul lui 2024.
Ca urmare, nu recomandă încă implementarea aplicațiilor de producție pe Workers AI, descriindu-l ca o „beta timpurie”.
„Ceea ce am lansat astăzi este doar o mică previzualizare pentru a vă oferi o idee despre ceea ce urmează”, se arată în postarea de pe blog.
Ca de obicei, Cloudflare spune că nu va factura serviciul în prima zi. Acestea fiind spuse, se așteaptă să încarce aproximativ un cent pentru fiecare mie de „neuroni de contracție obișnuiți” și 0.125 USD pentru fiecare mie de „neuroni de contracție rapidă”. Diferența dintre cele două este că acesta din urmă prioritizează proximitatea față de utilizatorul final, în timp ce cel mai puțin costisitor dintre cele două rulează oriunde Cloudflare are capacitate în exces.
Neuronii sunt o modalitate de a măsura producția AI, a explicat compania, adăugând că o mie de neuroni este bun pentru aproximativ 130 de răspunsuri LLM, 830 de clasificări de imagini sau 1,250 de înglobări ®.
- Distribuție de conținut bazat pe SEO și PR. Amplifică-te astăzi.
- PlatoData.Network Vertical Generative Ai. Împuterniciți-vă. Accesați Aici.
- PlatoAiStream. Web3 Intelligence. Cunoștințe amplificate. Accesați Aici.
- PlatoESG. carbon, CleanTech, Energie, Mediu inconjurator, Solar, Managementul deșeurilor. Accesați Aici.
- PlatoHealth. Biotehnologie și Inteligență pentru studii clinice. Accesați Aici.
- Sursa: https://go.theregister.com/feed/www.theregister.com/2023/09/28/cloudflare_ai_edge/
- :are
- :este
- :nu
- $UP
- 1
- 100
- 125
- 2024
- 250
- a
- Despre Noi
- accelerat
- accesibil
- Conform
- realizat
- realizarea
- peste
- de fapt
- adăugare
- Suplimentar
- AI
- Modele AI
- Servicii AI
- vizează
- algoritmi
- TOATE
- alocare
- de asemenea
- an
- și
- oriunde
- API-uri
- apare
- aplicatii
- se aplică
- abordare
- Apps
- SUNT
- susține
- AS
- activ
- asociate
- At
- disponibil
- departe
- BE
- deoarece
- beta
- Mai bine
- între
- Mare
- facturare
- biz
- Blog
- susține
- aduce
- construit
- dar
- by
- denumit
- CAN
- Capacitate
- pasă
- cazuri
- catalog
- cent
- centralizat
- provocări
- taxă
- chatbot
- cip
- Chips
- creanțe
- clar
- Cloud
- Cloudflare
- CO
- venire
- companie
- complexitate
- cuprinde
- Calcula
- conţinut
- Control
- converti
- Nucleu
- Cheltuieli
- client
- datele despre consumator
- clienţii care
- de date
- Baza de date
- zi
- afacere
- decide
- livra
- livrare
- Implementarea
- desfășurarea
- proiectat
- dezvoltat
- dispozitiv
- Dispozitive
- diferenţă
- diferit
- face
- nu
- numit
- Devreme
- mai ușor
- Margine
- eficient
- încorporat
- capăt
- suficient de
- asigură
- Eter (ETH)
- Fiecare
- pretutindeni
- exemplu
- exces
- Extinde
- se așteaptă
- scump
- expertiză
- a explicat
- explică
- extensie
- Față
- departe
- FAST
- mai repede
- DESCRIERE
- First
- Pentru
- frecvent
- din
- Frontend
- funcţional
- viitor
- poartă
- generaţie
- gigant
- Da
- Go
- merge
- bine
- GPU
- unități de procesare grafică
- Avea
- ajutor
- Totuși
- HTTPS
- idee
- if
- imagine
- in
- include
- include
- informații
- inițială
- inițial
- Inovaţie
- integra
- Intel
- interes
- în
- ISN
- IT
- ESTE
- în sine
- jpg
- doar
- cunoştinţe
- Nume
- Latență
- învăţare
- cel mai puțin
- mai puțin
- Permite
- ca
- LIMITĂ
- Limitat
- Listă
- ll
- Lamă
- local
- cautati
- cel mai mic
- maşină
- masina de învățare
- făcut
- face
- FACE
- Efectuarea
- de conducere
- multe
- masiv
- Mai..
- măsura
- Memorie
- meta
- ar putea
- atenuant
- ML
- model
- Modele
- Monitorizarea
- mai mult
- cele mai multe
- în mişcare
- multiplu
- În apropiere
- aproape
- reţea
- rețele
- neuronii
- Nu.
- notițe
- acum
- Nvidia
- evident
- of
- oferi
- oferit
- on
- ONE
- cele
- on-line
- afară
- Optimizați
- optimizarea
- or
- comandă
- Altele
- afară
- producție
- pagini
- parametru
- trece
- PC
- alege
- Loc
- Planurile
- platformă
- Plato
- Informații despre date Platon
- PlatoData
- puncte
- posibil
- Post
- putere
- puternic
- prezenţă
- Anunţ
- prioritizează
- proces
- Produs
- producere
- prevăzut
- proxy-uri
- rată
- RE
- recomanda
- reduce
- regulat
- eliberat
- încredere
- necesita
- resursă
- răspunsuri
- REST
- rezultat
- dreapta
- Ridica
- sul
- Alerga
- funcţionare
- ruleaza
- s
- Said
- spune
- Scară
- programare
- sens
- serverless
- serviciu
- Servicii
- Șapte
- câteva
- simplitate
- Centre de cercetare
- SIX
- Mărimea
- mic
- unele
- specific
- discurs
- împărţi
- Stadiile
- Declarație
- Încă
- simplifica
- suficient
- suită
- a sustine
- Sprijină
- Suprafață
- sistem
- T
- luare
- Sarcină
- gust
- Tehnologia
- spune
- a) Sport and Nutrition Awareness Day in Manasia Around XNUMX people from the rural commune Manasia have participated in a sports and healthy nutrition oriented activity in one of the community’s sports ready yards. This activity was meant to gather, mainly, middle-aged people from a Romanian rural community and teach them about the benefits that sports have on both their mental and physical health and on how sporting activities can be used to bring people from a community closer together. Three trainers were made available for this event, so that the participants would get the best possible experience physically and so that they could have the best access possible to correct information and good sports/nutrition practices. b) Sports Awareness Day in Poiana Țapului A group of young participants have taken part in sporting activities meant to teach them about sporting conduct, fairplay, and safe physical activities. The day culminated with a football match.
- acea
- Viitorul
- lor
- Lor
- Acolo.
- Acestea
- acest
- deşi?
- mie
- trei
- la
- astăzi
- a spus
- de asemenea
- dresat
- TIC nervos
- Două
- tipic
- us
- utilizat
- Utilizator
- folosind
- Cale..
- we
- web
- website
- miercuri
- săptămână
- Ce
- care
- în timp ce
- Şoaptă
- cu
- Castigat
- muncitorii
- de lucru
- ar
- n-ar fi
- an
- încă
- tu
- Ta
- zephyrnet