Brukere hype Whisper JAX som raskeste tale-til-tekst API

Brukere hype Whisper JAX som raskeste tale-til-tekst API

Kilde node: 2607028

Mark Zuckerberg kan ha popularisert begrepet "metaverse", men Meta-grunnleggeren og administrerende direktør kan ikke lenger vise metaversen til brukere og annonsører med samme entusiasme som han gjorde før. Eller slik det virker. I det siste har Meta vist større fokus på generativ AI.

Generativ AI er et sett med maskinlæringsteknikker som lar datamaskiner generere tekst, tegne bilder og lage andre medier som ligner menneskelig produksjon. Nå prøver Meta å få brukere og annonsører hektet på sine TikTok-lignende kortformede videoer og AI-verktøy.

Det California-baserte teknologiselskapet nylig annonsert opprettelsen av en ny produktenhet med fokus på kunstig intelligens – Meta AI. Divisjonen ledes av nåværende produktsjef Chris Cox og kombinerer flere team på tvers av Meta.

Les også: Big Tech Quit Metaverse i Chase of AI Chatbot Hype

Meta avduker DinoV2

Meta-teamet utvikler AI-personas som kan hjelpe brukere på mange måter, hevder Zuckerberg. Dette inkluderer forsøk med AI-chatopplevelser i WhatsApp og Messenger, AI-bildefiltre og annonseformater på Instagram, og AI-video og multimodale opplevelser.

I fjor introduserte Meta AI Make-A-Video, et kunstig intelligent system som lar brukere generere videoer fra en tekstmelding. Mer nylig lanserte den flere AI-produkter, inkludert DinoV2 og SAM.

Utgitt 17. april, DinoV2 er en generativ AI-modell som raskt kan generere 3D-ressurser for virtuelle verdener. I følge a blogginnlegg, er modellen i stand til å lage tredimensjonale (3D) former med topologi, rike geometriske detaljer og teksturer fra data som bilder og videoer.

DinoV2 bruker selvovervåket læring, en teknikk som gjør at modellen kan lære av enorme mengder umerkede data uten ekstern merkingshjelp, sier Meta. Verktøyet kan være svært nyttig for videoinnholdsskapere og i andre applikasjoner.

Meta sa at de brukte modellen i samarbeid med Gjenopprett Videresend å "kartlegge skoger, tre for tre, på tvers av områder på størrelse med kontinenter." DinoV2 kan identifisere og gjenkjenne ulike objekter i en video som mennesker, kjæledyr og andre gjenstander. Den er også i stand til å identifisere relasjonene mellom disse objektene og scenen som helhet.

Digital gründer Abah beskrevet modellen på Twitter som «et banebrytende skritt mot å oppnå datasynsmodeller på industrinivå. Bruken av selvovervåket læring er en game-changer og vil garantert skape bølger i teknologibransjen."

Andre uttrykte interesse for å bruke DinoV2 i landbruk, medisin og andre næringer. SAM, på siden, er en ny AI-modell som kan identifisere individuelle objekter fra et bilde. Den kommer med et datasett med bildekommentarer som er tilgjengelig for forskere å bruke.

Metas metaverse problemer

Et økende antall store teknologiselskaper har de siste månedene gått avkjølt på metaversen ettersom fokus skifter til den nye AI-chatbot-mani.

I februar, kinesisk teknologigigant Tencent Holdings kuttet ansatte ved utvidet virkelighetsenhet (XR) og foldet planer for maskinvare for virtuell virkelighet (VR). Både Meta og Microsoft har skalert ned sine metaverseplaner i stor grad.

Metas Reality Labs-divisjon, den delen av virksomheten som er fokusert på VR og metaverse, har tapt penger siden starten og rapporterte mer enn 13.7 milliarder dollar i tap i fjor. Selskapet er på vei til å kutte mer enn 21,000 XNUMX arbeidsplasser i år.

Microsoft stengte sin VR-metaversarm AltspaceVR 10. mars og sparket også hele staben ved sine populære utvidede reality-prosjekter HoloLens og Mixed Reality Tool Kit (MRTK).

Nedskjæringene faller sammen med den nåværende hypen rundt AI chatbots, som begynte med OpenAIs breakout-hit ChatGPT. Microsoft leder en utgiftsrunde innen AI-teknologi, med milliarder av dollar til å skaffe ChatGPT-krefter for sitt Bing-søk.

Ettersom de globale teknologigigantenes eksodus reiste spørsmål om hvorvidt metaversen er i ferd med å miste farten, har Meta blitt mer aggressiv i sin AI-utvikling, i et trekk som paradoksalt nok kan styrke metaverse-ambisjonene.

Selskapets inntreden i generative verktøy som DinoV2 kan sees på som et trekk mot metaversen, den virtuelle verdenen der folk kan samhandle med hverandre slik de gjør i den virkelige verden. Med DinoV2 håper Meta å skape en mer oppslukende opplevelse for brukerne og flytte grensene for hva som er mulig med AI-teknologi.

AI-løpet varmer opp

Metas AI-fokus er en del av en større trend i teknologibransjen, ettersom selskaper kjemper for å inkorporere kunstig intelligens i sine produkter og tjenester. Adobe, for eksempel, avduket nylig flere AI-verktøy, inkludert Adobe Sensei.

Som MetaNews tidligere rapportertSensei bruker maskinlæring for å automatisere oppgaver og forbedre brukeropplevelsen. Adobes AI-verktøy inkluderer også Adobe Stock, et AI-drevet verktøy som hjelper brukere med å finne de riktige bildene for prosjektene sine.

Det er også Adobe Experience Cloud, som bruker AI for å tilpasse kundeopplevelser. Adobe har imidlertid ingen produkter som er direkte sammenlignbare med DinoV2 eller SAM.

Det faktum at DinoV2 trenger mengder data betyr imidlertid også at datanøyaktighet kan være en stor utfordring for AI-modellen siden feil eller inkonsekvente data kan påvirke modellens ytelse og nøyaktighet negativt.

Tidstempel:

Mer fra MetaNews