Can Generative AI Recharge Phone Markets? - Semiwiki

Újra kiadta Platón

Követő: 0

Az okostelefonok piacával kapcsolatos konszenzus valahol az enyhe csökkenés és az enyhe növekedés között mozog, ami azt jelzi, hogy hiányoznak a határozottabb növekedéshez szükséges nyilvánvaló hajtóerők. Üzleti lehetőségként ezt a nem tetszetős állapotot némileg ellensúlyozza a puszta mennyiség (egy forrás szerint 500 milliárd dollár 2023-ban), de már közel járunk a Kínán kívüli elfogadás csúcsához, így a telefongyártók valódi kérdésének az kell lennie, hogy „mi a következő gyilkos alkalmazás, amely képes mozgatni a tűt?”

A generatív AI újratöltheti a telefonpiacokat

Mi, fogyasztók, változékonyak vagyunk, és úgy tűnik, hogy a szórakoztatás előkelő helyet foglal el a kötelező termékek listáján. A kar az fogadás mobiljátékokra. Egy másik lehetőség lehet a generatív mesterséges intelligencia a képalkotáshoz/manipulációhoz. Qualcomm már bemutatta a telefon alapú képességét míg mások, köztük az Apple, továbbra is a nagy nyelvű modellalkalmazásokra összpontosítanak. Számomra érdemes közelebbről megvizsgálni a generatív mesterséges intelligencia imázsaspektusát, pusztán azért, hogy egy kicsit jobban tájékozott legyek, ha és amikor ez beindul. A móka kedvéért itt generáltam a képet a Microsoft Bing Image Creator segítségével.

Diffúzió alapú generálás

Megpróbálom elmagyarázni a fogalmat egy LLM-mel való összehasonlítással. Az LLM-ek szövegszekvenciákon edzenek, szükségszerűen lineárisan. Rengeteg belőle. És a tokenizált szövegen dolgoznak, és tanulnak, amikor látják a tokenek egy bizonyos sorozatát, ami általában követheti ezt a sorozatot. Szövegekhez kiváló, de nem olyan képekhez, amelyek 2D-sek és általában nem tokenizálhatók, ezért a képzési megközelítésnek másnak kell lennie. A diffúzió alapú képzésben az első zaj fokozatosan hozzáadódik a betanított képekhez (előre irányuló diffúzió), míg a hálózatot a módosított képek zajtalanításával képezik az egyes eredeti képek helyreállításához (fordított diffúzió). Zavarosan hangzik, de úgy tűnik, a zajcsökkentési módszer (a sztochasztikus differenciálegyenletek megoldása) jól definiált és robusztus. A Stable Diffusion modell, mint egy példa, nyilvánosan elérhető.

Ezután lehetőség nyílik új képek generálására ebből a betanított hálózatból, egy véletlenszerű zajképből kiindulva. Most szüksége van egy módszerre, amely meghatározza, hogy milyen képet szeretne létrehozni. A Dall.E-2, a Midjourney és a Stable Diffusion egyaránt képes szöveges felszólításokat fogadni. Ezek a képzési képekkel együtt mellékelt szöveges címkékből vett képzéstől függenek. A következtetés ezután azonnali információkat tartalmaz a figyelem folyamatában, a végső kép kikövetkeztetéséhez vezető úton. Az LLM-ekhez hasonlóan ezek a rendszerek is transzformátorokat használnak, ami azt jelenti, hogy ennek a képességnek a támogatásához új hardverre van szükség.

A generálás nem korlátozódik a képek létrehozására a semmiből. Egy technika ún festés használható a kép egyes részei javítására vagy cseréjére. Tekintsd ezt az okostelefonokon már népszerű képszerkesztés AI-alapú változatának. Nem csak az alapszínek, a fényegyensúly, a fotobombák kivágása stb., hanem a sokkal nagyobb kihívást jelentő problémák megoldása vagy a cosplay ruhák újratervezése – bármi. Most, hogy látom, nagyon népszerű.

A generatív AI mozgatja a tűt?

Fogalmam sincs – lásd fent a változékony fogyasztókra vonatkozó megjegyzést. Aztán a vizuális inger, különösen magunk körül, és a játék szinte mindenkit megszólít. Ha ezt megteheti a telefonján, miért ne? Az AI egy gyorsan változó tartomány, amely úgy tűnik, nagy fogadásokra ösztönöz. Biztosan nem szeretnék fogadni ez ellen a lehetőség ellen.

Azt is meg kell említenem, hogy a generatív képalkotásnak már komolyabb alkalmazásai is vannak, különösen az orvosi területen, ahol zajos CAT-vizsgálatok javítására vagy a csontszerkezet által esetlegesen blokkolt részletek helyreállítására használható. El is tudom képzelni, hogy ez a technológia bekerüljön a kriminalisztikai eszköztárba. Mindannyian láttuk már a tévéműsorokat – Abby vagy Angela pótolja a hiányzó részleteket egy fényképen úgy, hogy a láthatóból képzett adatokkal extrapolál. A generatív képalkotás ezt lehetővé teheti!

Oszd meg ezt a bejegyzést ezen keresztül:

SEO által támogatott tartalom és PR terjesztés. Erősödjön még ma.
PlatoData.Network Vertical Generative Ai. Erősítse meg magát. Hozzáférés itt.
PlatoAiStream. Web3 Intelligence. Felerősített tudás. Hozzáférés itt.
PlatoESG. Carbon, CleanTech, Energia, Környezet, Nap, Hulladékgazdálkodás. Hozzáférés itt.
PlatoHealth. Biotechnológiai és klinikai vizsgálatok intelligencia. Hozzáférés itt.
Forrás: https://semiwiki.com/artificial-intelligence/336176-can-generative-ai-recharge-phone-markets/

Időbélyeg: Október 9, 2023

Még több Semiwiki

Következő generációs mesterséges intelligencia motor intelligens látási alkalmazásokhoz – Semiwiki

Semiwiki

Forrás csomópont: 2654245

Időbélyeg: May 15, 2023

2023-as visszatekintés. Innováció az ellenőrzésben – Semiwiki

Forrás klaszter:

Semiwiki

Forrás csomópont: 3086907

Időbélyeg: 25. január 2024.

A Generative AI feltöltheti a telefonpiacokat? – Semiwiki

Újra kiadta Platón

Diffúzió alapú generálás

A generatív AI mozgatja a tűt?

Még több Semiwiki

Következő generációs mesterséges intelligencia motor intelligens látási alkalmazásokhoz – Semiwiki

Heterogén chipletek tervezése és integrációja

WEBINÁRIUM: Vezetés előre az UWB radarral: A gyermekek biztonságának fokozása az autóiparban – Semiwiki

DAC 2021 – Mi újság az Agnisys-szel és a specifikációvezérelt IC-fejlesztéssel?

Az Ansys IDEAS Digital Forum 2021 kibővített hatókört kínál az elektronikus tervezés jövőjéhez

Better Randomizing Constrained Random. Innováció a hitelesítésben – Semiwiki

Az analóg bitek lehetővé teszik az átállást 3 nm-re és azon túl – Semiwiki

A Primer on EUV Lithography – Semiwiki

A félvezető ellátási lánc szűk keresztmetszeteinek leküzdése – Semiwiki

Rólunk

Vertical Search & Ai

Emelvény

Maradjon kapcsolatban

Fiók