Kellele kuulub generatiivne AI platvorm?

Kellele kuulub generatiivne AI platvorm?

Allikasõlm: 1909271

Me hakkame nägema generatiivse tehisintellekti (AI) tehnoloogiavirna väga varajasi staadiume. Sajad uued idufirmad tormavad turule, et arendada alusmudeleid, luua tehisintellektipõhiseid rakendusi ja püstitada infrastruktuuri/tööriistu.

Paljud kuumad tehnoloogiatrendid saavad ülekäte palju enne, kui turg järele jõuab. Kuid generatiivse tehisintellekti buumiga on kaasnenud tõeline kasum reaalsetel turgudel ja tõeliste ettevõtete tõeline veojõud. Sellised mudelid nagu Stable Diffusion ja ChatGPT püstitavad kasutajate kasvu ajaloolisi rekordeid ning mitme rakenduse aastakäive on jõudnud 100 miljoni dollarini vähem kui aasta pärast käivitamist. Kõrvuti võrdlused näitavad AI mudeleid edestades inimesi mõnes ülesandes mitmes suurusjärgus. 

Seega on piisavalt varaseid andmeid, mis viitavad massilisele ümberkujundamisele. Mida me ei tea ja mis on nüüdseks muutunud kriitiliseks küsimuseks, on: Kuhu sellel turul väärtus koguneb?

Viimase aasta jooksul oleme kohtunud kümnete idufirmade asutajate ja operaatoritega suurettevõtetes, kes tegelevad otseselt generatiivse tehisintellektiga. Oleme seda täheldanud infrastruktuuri müüjad on tõenäoliselt selle turu seni suurimad võitjad, hõivates enamiku virna kaudu voolavatest dollaritest. Rakendusettevõtted kasvavad tulud väga kiiresti, kuid neil on sageli probleeme säilitamise, toodete diferentseerimise ja brutomarginaaliga. Ja enamus mudeli pakkujad, kuigi vastutavad selle turu olemasolu eest, ei ole nad veel saavutanud suurt kaubanduslikku ulatust.

Teisisõnu, ettevõtted, kes loovad kõige rohkem väärtust – st treenivad generatiivseid tehisintellekti mudeleid ja rakendavad neid uutes rakendustes – ei ole enamikku sellest kinni püüdnud. Edasise toimumise ennustamine on palju raskem. Kuid me arvame, et peamine asi, mida tuleb mõista, on see, millised virna osad on tõeliselt eristuvad ja kaitstavad. Sellel on suur mõju turustruktuurile (st horisontaalne vs vertikaalne ettevõtte areng) ja pikaajalise väärtuse tegurid (nt marginaalid ja säilitamine). Siiani on meil olnud raske leida struktuurset kaitsevõimet kuskil virnas, väljaspool turgu valitsevate ettevõtjate traditsioonilisi vallikraave.

Oleme generatiivse tehisintellekti suhtes uskumatult innukad ja usume, et sellel on tohutu mõju tarkvaratööstusele ja mujalegi. Selle postituse eesmärk on kaardistada turu dünaamika ja hakata vastama laiematele küsimustele generatiivsete tehisintellekti ärimudelite kohta.

Kõrgetasemeline tehniline virn: infrastruktuur, mudelid ja rakendused

Et mõista, kuidas generatiivne tehisintellekti turg kujuneb, peame esmalt määratlema, kuidas virn tänapäeval välja näeb. Siin on meie esialgne vaade.

Virna saab jagada kolmeks kihiks:

  • Rakendused mis integreerivad generatiivseid tehisintellekti mudeleid kasutajale suunatud tootesse, käitades kas oma mudelikonveierte (“otsast lõpuni rakendused”) või tuginedes kolmanda osapoole API-le
  • Mudelid mis toidavad tehisintellekti tooteid, mis on saadaval kas patenteeritud API-de või avatud lähtekoodiga kontrollpunktidena (mis omakorda nõuavad hostimislahendust)
  • Infrastruktuur müüjad (st pilveplatvormid ja riistvaratootjad), kes korraldavad generatiivsete AI mudelite jaoks koolitusi ja järelduste töökoormust

Oluline on märkida: see ei ole turukaart, vaid raamistik turu analüüsimiseks. Igas kategoorias oleme välja toonud mõned näited tuntud müüjatest. Me ei ole püüdnud olla kõikehõlmav ega loetleda kõiki hämmastavaid generatiivseid tehisintellekti rakendusi, mis on välja antud. Samuti ei lähe me siin sügavamale MLopsi või LLMopsi tööriistade kohta, mis pole veel väga standarditud ja mida käsitletakse tulevases postituses.

Generatiivsete AI-rakenduste esimene laine hakkab jõudma mastaapse, kuid võitleb säilitamise ja eristumisega

Varasemates tehnoloogiatsüklites oli tavapärane tarkus, et suure sõltumatu ettevõtte loomiseks peab teil olema lõppklient – ​​olgu see siis üksiktarbijad või B2B ostjad. On ahvatlev uskuda, et generatiivse AI suurimad ettevõtted on ka lõppkasutajate rakendused. Siiani pole selge, kas see nii on.

Kindlasti on generatiivsete tehisintellekti rakenduste kasv olnud vapustav, tõukejõuks uudsus ja kasutusjuhtumite rohkus. Tegelikult oleme teadlikud vähemalt kolmest tootekategooriast, mille aastane tulu on juba ületanud 100 miljonit dollarit: piltide loomine, tekstide kirjutamine ja koodi kirjutamine.

Kestvate tarkvarafirmade loomiseks aga ainult kasvust ei piisa. Kriitiline on see, et kasv peab olema kasumlik – selles mõttes, et kasutajad ja kliendid teenivad pärast registreerumist kasumit (kõrge brutomarginaal) ja püsivad pikka aega (kõrge säilitamine). Tugeva tehnilise eristuse puudumisel toovad B2B ja B2C rakendused klientidele pikaajalist väärtust võrguefektide, andmete hoidmise või üha keerukamate töövoogude loomise kaudu.

Generatiivse AI puhul ei pea need eeldused tingimata paika. Rakenduste ettevõtetes, kellega oleme rääkinud, on lai valik brutomarginaali – mõnel juhul kuni 90%, kuid sagedamini kuni 50–60%, mis on suuresti tingitud mudeli järelduste maksumusest. Kasv lehtri tipus on olnud hämmastav, kuid pole selge, kas praegused klientide hankimise strateegiad on skaleeritavad – me juba näeme, et tasulise omandamise tõhusus ja säilitamine hakkavad langema. Paljud rakendused on samuti suhteliselt eristamatud, kuna need tuginevad sarnastele tehisintellekti mudelitele ega ole avastanud ilmseid võrguefekte ega andmeid/töövooge, mida konkurentidel on raske dubleerida.

Seega pole veel ilmne, et lõppkasutajatele mõeldud rakenduste müümine on ainus või isegi parim tee jätkusuutliku generatiivse AI-äri ülesehitamiseks. Marginaalid peaksid paranema, kui konkurents ja keelemudelite tõhusus suureneb (sellest lähemalt allpool). Säilitamine peaks suurenema, kui AI-turistid turult lahkuvad. Ja siin on tugev argument, et vertikaalselt integreeritud rakendustel on eristamist soodustav eelis. Kuid tõestada on veel palju.

Tulevikku vaadates on mõned suured küsimused, millega generatiivsete AI-rakenduste ettevõtted silmitsi seisavad:

  • Vertikaalne integratsioon ("mudel + rakendus"). AI-mudelite kasutamine teenusena võimaldab rakenduste arendajatel väikese meeskonnaga kiiresti itereerida ja tehnoloogia arenedes mudelipakkujaid vahetada. Teisest küljest väidavad mõned arendajad, et toode is mudelit ja et nullist väljaõpe on ainus viis kaitstavust luua – st pidevalt ümber koolitades patenteeritud tooteandmeid. Kuid selle hinnaks on palju suuremad kapitalinõuded ja vähem krapsakas tootemeeskond.
  • Funktsioonide loomine vs. rakendused. Generatiivsetel AI-toodetel on mitu erinevat vormi: töölauarakendused, mobiilirakendused, Figma/Photoshopi pistikprogrammid, Chrome'i laiendused ja isegi Discordi robotid. AI-tooteid on lihtne integreerida sinna, kus kasutajad juba töötavad, kuna kasutajaliides on üldiselt vaid tekstikast. Millistest neist saavad eraldiseisvad ettevõtted – ja millised võtavad enda alla turgu valitsevad ettevõtjad, nagu Microsoft või Google, kes juba lisavad tehisintellekti oma tootesarjadesse?
  • Juhtimine läbi hype tsükli. Ei ole veel selge, kas loobumine on generatiivsete AI-toodete praeguse partii omane või on see varase turu artefakt. Või kui hüppe vaibudes kaob huvi generatiivse AI vastu. Need küsimused avaldavad rakendusettevõtetele olulist mõju, sealhulgas seda, millal raha kogumisel gaasipedaali vajutada; kui agressiivselt investeerida klientide hankimisse; milliseid kasutajasegmente eelistada; ja millal kuulutada tooteturule sobivaks.

Mudelite pakkujad leiutasid generatiivse AI, kuid ei ole jõudnud suure kaubandusliku ulatuseni

See, mida me praegu nimetame generatiivseks tehisintellektiks, ei eksisteeriks ilma suurepärase uurimis- ja inseneritööta, mida tehakse sellistes kohtades nagu Google, OpenAI ja Stabiilsus. Tänu uudsetele mudeliarhitektuuridele ja kangelaslikele jõupingutustele koolitustorustike laiendamisel saame me kõik kasu praeguste suurte keelemudelite (LLM) ja kujutiste genereerimise mudelite hämmastavatest võimalustest.

Nende ettevõtetega seotud tulud on siiski suhteliselt väikesed, võrreldes kasutuse ja buzziga. Piltide genereerimisel on Stable Diffusion näinud kogukonna plahvatuslikku kasvu, mida toetab kasutajaliideste, hostitud pakkumiste ja peenhäälestusmeetodite ökosüsteem. Kuid Stabiilsus annab nende peamised kontrollpunktid tasuta ära kui nende äri põhiprintsiip. Loomuliku keele mudelites domineerib OpenAI koos GPT-3/3.5 ja ChatGPT-ga. Aga suhteliselt Seni on OpenAI-le ehitatud tapvaid rakendusi vähe ja hinnad on juba olemas kukkus korra maha.

See võib olla vaid ajutine nähtus. Stabiilsus on uus ettevõte, mis pole veel raha teenimisele keskendunud. OpenAI-l on potentsiaali saada tohutuks ettevõtteks, mis teenib märkimisväärse osa kõigist NLP-kategooria tuludest, kuna ehitatakse rohkem tapvaid rakendusi – eriti kui integreerimine Microsofti tooteportfelli läheb libedalt. Arvestades nende mudelite tohutut kasutamist, ei pruugi suuremahulised tulud palju maha jääda.

Kuid on ka vastukajalisi jõude. Avatud lähtekoodina välja antud mudeleid võivad majutada kõik, sealhulgas välised ettevõtted, kes ei kanna suuremahulise mudelikoolitusega seotud kulusid (kuni kümneid või sadu miljoneid dollareid). Ja pole selge, kas mõni suletud lähtekoodiga mudel suudab oma eelist lõputult säilitada. Näiteks hakkame nägema, et selliste ettevõtete nagu Anthropic, Cohere ja Character.ai loodud LLM-id jõuavad OpenAI jõudlustasemetele lähemale ning on koolitatud sarnaste andmekogumite (st Interneti) ja sarnase mudeliarhitektuuriga. Stabiilse difusiooni näide viitab sellele if avatud lähtekoodiga mudelid saavutavad piisava jõudluse ja kogukonna toetuse taseme, siis võib patenteeritud alternatiividel olla raske konkureerida.

Võib-olla on mudelipakkujate jaoks seni kõige selgem tõdemus, et kommertsialiseerimine on tõenäoliselt seotud hostimisega. Nõudlus patenteeritud API-de järele (nt OpenAI-lt) kasvab kiiresti. Avatud lähtekoodiga mudelite (nt Hugging Face ja Replicate) hostimisteenused on kujunemas kasulikeks jaoturiteks mudelite hõlpsaks jagamiseks ja integreerimiseks ning neil on isegi kaudne võrgumõju mudelitootjate ja tarbijate vahel. Samuti on tugev hüpotees, et äriklientidega peenhäälestus- ja hostimislepingute kaudu on võimalik raha teenida.

Lisaks sellele seisavad mudelite pakkujad silmitsi mitmete suurte küsimustega:

  • Kaubaks muutmine. Levinud on arvamus, et AI mudelite jõudlus aja jooksul läheneb. Rakenduste arendajatega rääkides on selge, et seda pole veel juhtunud, nii teksti- kui pildimudelite osas on tugevad liidrid. Nende eelised ei põhine mitte ainulaadsetel mudeliarhitektuuridel, vaid kõrgetel kapitalinõuetel, patenteeritud toodete interaktsiooniandmetel ja vähesel tehisintellektil. Kas see on püsiv eelis?
  • Lõpetamise oht. Mudelite pakkujatele lootmine on rakendusettevõtetele suurepärane võimalus alustada ja isegi oma ettevõtet kasvatada. Kuid neil on stiimul ehitada ja/või majutada oma mudeleid, kui need jõuavad mastaapsuseni. Ja paljudel mudelite pakkujatel on klientide jaotus väga kallutatud ning mõned rakendused moodustavad suurema osa tulust. Mis juhtub, kui/kui need kliendid lähevad üle ettevõttesisesele tehisintellekti arendusele?
  • Kas raha on oluline? Generatiivse tehisintellekti lubadus on nii suur – ja ka potentsiaalselt nii kahjulik –, et paljud mudelipakkujad on organiseerunud avalike hüvede korporatsioonideks (B-korporatsioon), emiteerinud piiratud kasumiosakuid või muul viisil lisanud avaliku hüve selgesõnaliselt oma missiooni. See ei ole sugugi takistanud nende raha kogumist. Kuid selle üle, kas enamik mudelipakkujaid tegelikult on, tuleb arutleda tahan väärtuse leidmiseks ja kui peaks.

Infrastruktuurimüüjad puudutavad kõike ja saavad sellest kasu

Peaaegu kõik generatiivses AI-s läbib mingil hetkel pilve hostitud GPU (või TPU). Olgu see siis mudelipakkujatele/õppelaboritele, kes tegelevad koolitustööga, hostimisettevõtetega, kes tegelevad järelduste/peenhäälestusega, või rakendusettevõtetega, kes teevad mõlema kombinatsiooni – LÕBUD on generatiivse tehisintellekti elujõud. Esimest korda üle väga pika aja on kõige murettekitavama andmetöötlustehnoloogia areng massiliselt arvutuslik.

Selle tulemusel liigub suur osa generatiivse tehisintellekti turul olevast rahast lõpuks taristuettevõtetesse. Mõned panema väga umbkaudsed arvud: meie hinnangul kulutavad rakenduste ettevõtted keskmiselt 20–40% tulust järelduste tegemiseks ja kliendipõhiseks peenhäälestamiseks. Tavaliselt makstakse seda kas otse pilveteenuse pakkujatele arvutusjuhtumite eest või kolmandatest osapooltest mudelite pakkujatele – kes omakorda kulutavad umbes poole oma tuludest pilveinfrastruktuurile. Seega on mõistlik arvata, et 10-20%. kogutulu generatiivses AI-s läheb täna pilveteenuse pakkujatele.

Lisaks on oma mudeleid koolitavad idufirmad kogunud miljardeid dollareid riskikapitali – suurem osa sellest (kuni 80–90% varases voorus) kulutatakse tavaliselt ka pilveteenuse pakkujatele. Paljud avalikud tehnoloogiaettevõtted kulutavad aastas sadu miljoneid mudelikoolitustele kas väliste pilveteenuse pakkujate või otse riistvaratootjatega.

Seda nimetaksime tehnilises mõttes "paljuks rahaks" – eriti tekkiva turu puhul. Suurem osa sellest kulutatakse Big 3 pilved: Amazon Web Services (AWS), Google Cloud Platform (GCP) ja Microsoft Azure. Need pilveteenuse pakkujad koos kulutada rohkem kui $ 100 miljardit eurot aastas capexis, et tagada kõige põhjalikumad, usaldusväärsemad ja kulutõhusamad platvormid. Eelkõige generatiivse tehisintellekti puhul saavad nad kasu ka tarnepiirangutest, kuna neil on eelisjuurdepääs vähesele riistvarale (nt Nvidia A100 ja H100 GPU-d).

Huvitaval kombel hakkame aga nägema usaldusväärse konkurentsi tekkimist. Väljakutsujad, nagu Oracle, on astunud sisse suurte kapitalikulude ja müügistiimulitega. Ja mõned idufirmad, nagu Coreweave ja Lambda Labs, on spetsiaalselt suurtele mudeliarendajatele suunatud lahendustega kiiresti kasvanud. Nad võistlevad kulude, saadavuse ja isikupärastatud toe osas. Need paljastavad ka üksikasjalikumad ressursiabstraktsioonid (st konteinerid), samas kui suured pilved pakuvad GPU virtualiseerimispiirangute tõttu ainult VM-i eksemplare.

Kulisside taga, enamiku tehisintellekti töökoormuste käitamine, on generatiivse AI seni suurim võitja: Nvidia. Ettevõte teatas 3.8 dollarit miljard andmekeskuse GPU tuludest 2023. eelarveaasta kolmandas kvartalis, sealhulgas sisukas osa generatiivsete AI kasutusjuhtude jaoks. Ja nad on ehitanud selle ettevõtte ümber tugevad vallikraavid, kasutades aastakümneid investeeringuid GPU-arhitektuuri, tugevasse tarkvaraökosüsteemi ja laialdast kasutamist akadeemilises kogukonnas. Üks hiljutine analüüs leidis, et Nvidia GPU-sid mainitakse uurimistöödes 90 korda rohkem kui parimaid tehisintellekti kiipide idufirmasid kokku.

Muud riistvaravalikud on olemas, sealhulgas Google Tensor Processing Units (TPU-d); AMD Instinct GPU-d; AWS Inferentia ja Trainium kiibid; ja tehisintellekti kiirendid idufirmadelt nagu Cerebras, Sambanova ja Graphcore. Intel, kes on mänguga hiljaks jäänud, siseneb turule ka oma tipptasemel Habana kiipide ja Ponte Vecchio GPU-dega. Kuid seni on vähesed neist uutest kiipidest võtnud märkimisväärse turuosa. Kaks erandit, mida vaadata, on Google, kelle TPU-d on stabiilse difusiooni kogukonnas ja mõnes suures GCP tehingus saavutanud, ja TSMC, kes arvatavasti toodab kõik siin loetletud kiipidest, sealhulgas Nvidia GPU-d (Intel kasutab oma kiipide valmistamiseks segu oma seadmetest ja TSMC-st).

Infrastruktuur on teisisõnu tulus, vastupidav ja pealtnäha kaitstav kiht virnas. Suured küsimused, millele infraettevõtete jaoks vastata, on järgmised:

  • Kodakondsuseta töökoormuse hoidmine. Nvidia GPU-d on samad, kus iganes te neid laenutate. Enamik tehisintellekti töökoormusi on olekuta, selles mõttes, et mudeli järeldamine ei nõua lisatud andmebaase ega salvestusruumi (peale mudeli kaalude endi). See tähendab, et tehisintellekti töökoormused võivad olla pilvede kaudu rohkem kaasaskantavad kui traditsioonilised rakenduste töökoormused. Kuidas saavad pilveteenuse pakkujad selles kontekstis kleepuvust tekitada ja takistada klientidel odavaima valiku juurde hüppamast?
  • Kiibipuuduse lõpu üleelamine. Pilveteenuse pakkujate ja Nvidia enda hinnakujundust on toetanud kõige ihaldusväärsemate GPU-de napp varu. Üks pakkuja ütles meile, et A100 hinnakirja hind on tegelikult olemas kasvanud käivitamisest saadik, mis on arvutusriistvara jaoks väga ebatavaline. Kui see tarnepiirang lõpuks eemaldatakse, suurendades tootmist ja/või uute riistvaraplatvormide kasutuselevõttu, kuidas see pilveteenuse pakkujaid mõjutab?
  • Kas väljakutsepilv võib läbi murda? Oleme sellesse tugevad uskujad vertikaalsed pilved võtab suurelt 3-lt turuosa spetsialiseeritud pakkumistega. Siiani on tehisintellektis väljakutsujad saavutanud märkimisväärse veojõu tänu mõõdukale tehnilisele eristamisele ja Nvidia toele – kelle jaoks on turgu valitsevad pilveteenuse pakkujad nii suurimad kliendid kui ka esilekerkivad konkurendid. Pikaajaline küsimus on, kas sellest piisab suure 3 mastaabieeliste ületamiseks?

Niisiis… kuhu väärtus koguneb?

Muidugi me veel ei tea. Kuid tuginedes varastele andmetele, mis meil on generatiivse AI kohta koos meie kogemus varasemate AI/ML ettevõtetega, meie intuitsioon on järgmine. 

Tänapäeval ei paista generatiivses tehisintellektis olevat süsteemseid vallikraake. Esimese järgu lähendusena puudub rakendustel tugev toodete eristamine, kuna nad kasutavad sarnaseid mudeleid; mudelid seisavad silmitsi ebaselge pikaajalise diferentseerumisega, kuna neid koolitatakse sarnase arhitektuuriga sarnaste andmekogumite kohta; pilveteenuse pakkujatel puudub sügav tehniline eristus, kuna nad kasutavad samu GPU-sid; ja isegi riistvaraettevõtted toodavad oma kiipe samades tehastes.

Loomulikult on olemas standardsed vallikraavid: skaalakraavid ("Mul on või saan koguda rohkem raha kui teil!"), tarneahela vallikraavid ("Mul on GPU-d, teil mitte!"), ökosüsteemi vallikraavid (" Kõik kasutavad juba minu tarkvara!”), algoritmilised vallikraavid (“Me oleme sinust targemad!”), levitamisvallid (“Mul on juba müügimeeskond ja rohkem kliente kui teil!”) ja andmekonveieri vallikraavid (“Mina” olen roomanud rohkem Internetis kui sina!”). Kuid ükski neist vallikraavidest ei ole pikas perspektiivis vastupidav. Ja veel on liiga vara öelda, kas tugevad otsesed võrguefektid on mõnes virna kihis võimust võtmas.

Olemasolevate andmete põhjal pole lihtsalt selge, kas generatiivses tehisintellektis on pikaajaline võitja-kõik dünaamika.

See on imelik. Kuid meie jaoks on see hea uudis. Selle turu potentsiaalset suurust on raske mõista – kuskil vahepeal kogu tarkvara ja kõik inimlikud ettevõtmised — seega ootame palju-palju mängijaid ja tervet konkurentsi kõigil stäki tasanditel. Samuti ootame nii horisontaalsete kui ka vertikaalsete ettevõtete edu saavutamist, kasutades lõppturgude ja lõppkasutajate poolt dikteeritud parimat lähenemist. Näiteks kui lõpptoote peamine erinevus on AI ise, on tõenäoline, et vertikaaliseerimine (st kasutajale suunatud rakenduse tihe sidumine koduse mudeliga) võidab. Kui AI on osa suuremast pika saba funktsioonide komplektist, on tõenäolisem, et horisontaalsus toimub. Muidugi peaksime aja jooksul nägema ka traditsioonilisemate vallikraavide ehitamist - ja võime isegi näha, et uut tüüpi vallikraavid hakkavad kehtima.

Igal juhul oleme kindlad, et generatiivne AI muudab mängu. Me kõik õpime reaalajas reegleid, avatakse tohutult palju väärtust ja selle tulemusel näeb tehnikamaastik välja palju-palju teistsugune. Ja me oleme siin selleks!

Kõik selles postituses olevad pildid loodi Midjourney abil.

Ajatempel:

Veel alates Andreessen Horowitz