Användare hyper Whisper JAX som snabbaste tal-till-text-API

Användare hyper Whisper JAX som snabbaste tal-till-text-API

Källnod: 2607028

Mark Zuckerberg må ha populariserat termen "metavers", men Meta-grundaren och VD:n kanske inte längre pitchar metaversen för användare och annonsörer med samma entusiasm som han gjorde tidigare. Eller så verkar det. På senare tid har Meta visat större fokus på generativ AI.

Generativ AI är en uppsättning maskininlärningstekniker som gör att datorer kan generera text, rita bilder och skapa andra medier som liknar mänsklig produktion. Nu försöker Meta få användare och annonsörer att haka på sina TikTok-liknande kortformade videor och AI-verktyg.

Det Kalifornien-baserade teknikföretaget nyligen meddelade skapandet av en ny produktenhet fokuserad på artificiell intelligens – Meta AI. Divisionen leds av nuvarande produktchef Chris Cox och kombinerar flera team över Meta.

Läs också: Big Tech Quit Metaverse i Chase of AI Chatbot Hype

Meta presenterar DinoV2

Meta-teamet utvecklar AI-personas som kan hjälpa användare på många sätt, hävdar Zuckerberg. Detta inkluderar tester med AI-chattupplevelser i WhatsApp och Messenger, AI-bildfilter och annonsformat i Instagram, och AI-video och multimodala upplevelser.

Förra året introducerade Meta AI Make-A-Video, ett artificiellt intelligent system som låter användare generera videor från en textprompt. Mer nyligen lanserade det flera AI-produkter, inklusive DinoV2 och SAM.

DinoV17 släpptes den 2 april och är en generativ AI-modell som snabbt kan generera 3D-tillgångar för virtuella världar. Enligt a blogginlägg, kan modellen skapa tredimensionella (3D) former med topologi, rika geometriska detaljer och texturer från data som bilder och videor.

DinoV2 använder självövervakad inlärning, en teknik som gör att modellen kan lära sig av enorma mängder omärkt data utan någon extern märkningshjälp, säger Meta. Verktyget kan vara mycket användbart för skapare av videoinnehåll och i andra applikationer.

Meta sa att de använde modellen i samarbete med Återställ framåt att "karta skogar, träd för träd, över områden lika stora som kontinenter." DinoV2 kan identifiera och känna igen olika objekt i en video som människor, husdjur och andra föremål. Den kan också identifiera relationerna mellan dessa objekt och scenen som helhet.

Digital entreprenör Abah beskriven modellen på Twitter som "ett banbrytande steg mot att uppnå datorseendemodeller på industrinivå. Användningen av självövervakad inlärning är en spelomvandlare och kommer säkerligen att göra vågor i den tekniska industrin."

Andra uttryckte intresse för att använda DinoV2 inom jordbruk, medicin och andra industrier. SAM, å sidan, är en ny AI-modell som kan identifiera enskilda objekt inifrån en bild. Den levereras med en datauppsättning av bildkommentarer som är tillgänglig för forskare att använda.

Metas metaversa problem

Ett växande antal stora teknikföretag har under de senaste månaderna svalnat på metaversen när fokus skiftar till den nya AI-chatbot-villet.

I februari, kinesiska teknikjätten Tencent Holdings skära ner personalen på dess utökade verklighet (XR) enhet och vikta planer för virtuell verklighet (VR) hårdvara. Både Meta och Microsoft har skalat ner sina metaverse-planer på ett stort sätt.

Metas Reality Labs-division, den del av verksamheten som fokuserar på VR och metaversen, har förlorat pengar sedan starten och rapporterade mer än 13.7 miljarder dollar i förluster förra året. Företaget är på väg att avskaffa mer än 21,000 XNUMX jobb i år.

Microsoft stängde av sin VR-metaversarm AltspaceVR den 10 mars och sparkade även hela personalen vid dess populära utökade verklighetsprojekt HoloLens och Mixed Reality Tool Kit (MRTK).

Nedskärningarna sammanfaller med den nuvarande hypen kring AI-chatbots, som började med OpenAI:s breakout-hit ChatGPT. Microsoft leder en utgiftsrunda inom AI-teknik, med miljarder dollar som satsas på att skaffa ChatGPT-krafter för sin Bing-sökning.

När de globala teknikjättarnas exodus väckte frågor om huruvida metaversen håller på att tappa fart, har Meta blivit mer aggressiv i sin AI-utveckling, i ett drag som paradoxalt nog kan stärka dess metaversa ambitioner.

Företagets intåg i generativa verktyg som DinoV2 kan ses som ett steg mot metaversen, den virtuella världen där människor kan interagera med varandra som de gör i den verkliga världen. Med DinoV2 hoppas Meta skapa en mer uppslukande upplevelse för användarna och tänja på gränserna för vad som är möjligt med AI-teknik.

AI-loppet värms upp

Metas AI-fokus är en del av en större trend inom teknikbranschen, eftersom företag tävlar om att införliva artificiell intelligens i sina produkter och tjänster. Adobe, till exempel, presenterade nyligen flera AI-verktyg, inklusive Adobe Sensei.

Som MetaNews tidigare rapporteradeSensei använder maskininlärning för att automatisera uppgifter och förbättra användarupplevelsen. Adobes AI-verktyg inkluderar även Adobe Stock, ett AI-drivet verktyg som hjälper användare att hitta rätt bilder för sina projekt.

Det finns även Adobe Experience Cloud, som använder AI för att anpassa kundupplevelser. Adobe har dock inga produkter som är direkt jämförbara med DinoV2 eller SAM.

Men det faktum att DinoV2 behöver mängder av data innebär också att datanoggrannhet kan vara en stor utmaning för AI-modellen eftersom felaktiga eller inkonsekventa data kan påverka modellens prestanda och noggrannhet negativt.

Tidsstämpel:

Mer från MetaNews