Kan generativ AI ladda telefonmarknader? - Semiwiki

Kan generativ AI ladda telefonmarknader? – Semiwiki

Källnod: 2926005

Konsensus om smartphonemarknader svävar någonstans mellan en liten nedgång och liten tillväxt, vilket indikerar brist på uppenbara drivkrafter för mer robust tillväxt. Som en affärsmöjlighet kompenseras detta oattraktiva tillstånd något av ren volym ($500 miljarder 2023 enligt en källa) men vi är redan nära att ta en topp utanför Kina så den verkliga frågan för telefontillverkare måste vara "vad är nästa mördare app som kan flytta nålen?”

Kan generativ AI ladda telefonmarknader

Vi konsumenter är ett ombytligt parti och underhållning verkar rankas högt på vår lista över måsten. Arm är satsa på mobilspel. En annan möjlighet kan vara generativ AI för att skapa/manipulera bilder. Qualcomm har redan visat en telefonbaserad kapacitet medan andra inklusive Apple fortfarande fokuserar på appar för stora språkmodeller. För mig är det värt att titta närmare på bildaspekten av generativ AI helt enkelt för att vara lite mer kunnig om och när detta tar fart. För skojs skull skapade jag bilden här med Image Creator från Microsoft Bing.

Diffusionsbaserad generation

Jag ska försöka förklara konceptet genom att jämföra med en LLM. LLM:er tränar på textsekvenser, nödvändigtvis linjära. Massor av det. Och de arbetar med tokeniserad text och lär sig när de ser en viss sekvens av tokens vad som vanligtvis följer den sekvensen. Perfekt för text men inte bilder som är 2D och i allmänhet inte tokeniserbara, så träningssättet måste vara annorlunda. I diffusionsbaserad träning läggs det första bruset successivt till träningsbilderna (framåtriktad diffusion), medan nätverket tränas genom att denoise modifierade bildbilder för att återställa varje originalbild (omvänd diffusion). Låter rörigt men uppenbarligen är denoisingmetoden (att lösa stokastiska differentialekvationer) väldefinierad och robust. Den stabila diffusionsmodellen, som ett exempel, är allmänt tillgänglig.

Det är då möjligt att generera nya bilder från detta tränade nätverk, utgående från en slumpmässig brusbild. Nu behöver du en metod för att vägleda vilken bild du vill generera. Dall.E-2, Midjourney och Stable Diffusion kan alla ta textmeddelanden. Dessa beror på utbildning hämtad från textetiketter som tillhandahålls tillsammans med träningsbilderna. Slutledning inkluderar sedan snabb information i uppmärksamhetsprocessen i vägen till att sluta sig till en slutlig bild. Liksom LLM:er använder dessa system också transformatorer, vilket innebär att stöd för denna förmåga kräver ny hårdvara.

Generation är inte begränsad till att skapa bilder från grunden. En teknik som kallas målning kan användas för att förbättra eller ersätta delar av en bild. Tänk på detta som en AI-baserad version av den bildredigering som redan är populär på smartphones. Inte bara grundläggande färg, ljusbalans, beskära fotobomber, etc, utan att fixa mycket mer utmanande problem eller rita om dig själv i cosplay-outfits – vad som helst. Nu när jag kan se att det är väldigt populärt.

Kommer generativ AI att flytta nålen?

Jag har ingen aning – se ovan kommentar om ombytliga konsumenter. Återigen, visuell stimulans, särskilt runt oss själva, och lek tilltalar nästan alla. Om du kan göra detta på din telefon, varför inte? AI är en snabbrörlig domän som verkar uppmuntra stora satsningar. Jag skulle absolut inte vilja satsa mot denna möjlighet.

Jag bör också nämna att generativ bildbehandling redan har mer seriösa tillämpningar, särskilt inom det medicinska området där den kan användas för att reparera en bullrig CAT-skanning eller återställa detaljer som potentiellt blockeras av benstruktur. Jag kan till och med föreställa mig att den här tekniken arbetar sig in i kriminaltekniska verktygslådan. Vi har alla sett TV-programmen – Abby eller Angela fyller i saknade detaljer i ett fotografi genom att extrapolera med tränad data från det som är synligt. Generativ bildbehandling skulle kunna göra det möjligt!

Dela det här inlägget via:

Tidsstämpel:

Mer från Semiwiki