A Generative AI feltöltheti a telefonpiacokat? - Semiwiki

A Generative AI feltöltheti a telefonpiacokat? – Semiwiki

Forrás csomópont: 2926005

Az okostelefonok piacával kapcsolatos konszenzus valahol az enyhe csökkenés és az enyhe növekedés között mozog, ami azt jelzi, hogy hiányoznak a határozottabb növekedéshez szükséges nyilvánvaló hajtóerők. Üzleti lehetőségként ezt a nem tetszetős állapotot némileg ellensúlyozza a puszta mennyiség (egy forrás szerint 500 milliárd dollár 2023-ban), de már közel járunk a Kínán kívüli elfogadás csúcsához, így a telefongyártók valódi kérdésének az kell lennie, hogy „mi a következő gyilkos alkalmazás, amely képes mozgatni a tűt?”

A generatív AI újratöltheti a telefonpiacokat

Mi, fogyasztók, változékonyak vagyunk, és úgy tűnik, hogy a szórakoztatás előkelő helyet foglal el a kötelező termékek listáján. A kar az fogadás mobiljátékokra. Egy másik lehetőség lehet a generatív mesterséges intelligencia a képalkotáshoz/manipulációhoz. Qualcomm már bemutatta a telefon alapú képességét míg mások, köztük az Apple, továbbra is a nagy nyelvű modellalkalmazásokra összpontosítanak. Számomra érdemes közelebbről megvizsgálni a generatív mesterséges intelligencia imázsaspektusát, pusztán azért, hogy egy kicsit jobban tájékozott legyek, ha és amikor ez beindul. A móka kedvéért itt generáltam a képet a Microsoft Bing Image Creator segítségével.

Diffúzió alapú generálás

Megpróbálom elmagyarázni a fogalmat egy LLM-mel való összehasonlítással. Az LLM-ek szövegszekvenciákon edzenek, szükségszerűen lineárisan. Rengeteg belőle. És a tokenizált szövegen dolgoznak, és tanulnak, amikor látják a tokenek egy bizonyos sorozatát, ami általában követheti ezt a sorozatot. Szövegekhez kiváló, de nem olyan képekhez, amelyek 2D-sek és általában nem tokenizálhatók, ezért a képzési megközelítésnek másnak kell lennie. A diffúzió alapú képzésben az első zaj fokozatosan hozzáadódik a betanított képekhez (előre irányuló diffúzió), míg a hálózatot a módosított képek zajtalanításával képezik az egyes eredeti képek helyreállításához (fordított diffúzió). Zavarosan hangzik, de úgy tűnik, a zajcsökkentési módszer (a sztochasztikus differenciálegyenletek megoldása) jól definiált és robusztus. A Stable Diffusion modell, mint egy példa, nyilvánosan elérhető.

Ezután lehetőség nyílik új képek generálására ebből a betanított hálózatból, egy véletlenszerű zajképből kiindulva. Most szüksége van egy módszerre, amely meghatározza, hogy milyen képet szeretne létrehozni. A Dall.E-2, a Midjourney és a Stable Diffusion egyaránt képes szöveges felszólításokat fogadni. Ezek a képzési képekkel együtt mellékelt szöveges címkékből vett képzéstől függenek. A következtetés ezután azonnali információkat tartalmaz a figyelem folyamatában, a végső kép kikövetkeztetéséhez vezető úton. Az LLM-ekhez hasonlóan ezek a rendszerek is transzformátorokat használnak, ami azt jelenti, hogy ennek a képességnek a támogatásához új hardverre van szükség.

A generálás nem korlátozódik a képek létrehozására a semmiből. Egy technika ún festés használható a kép egyes részei javítására vagy cseréjére. Tekintsd ezt az okostelefonokon már népszerű képszerkesztés AI-alapú változatának. Nem csak az alapszínek, a fényegyensúly, a fotobombák kivágása stb., hanem a sokkal nagyobb kihívást jelentő problémák megoldása vagy a cosplay ruhák újratervezése – bármi. Most, hogy látom, nagyon népszerű.

A generatív AI mozgatja a tűt?

Fogalmam sincs – lásd fent a változékony fogyasztókra vonatkozó megjegyzést. Aztán a vizuális inger, különösen magunk körül, és a játék szinte mindenkit megszólít. Ha ezt megteheti a telefonján, miért ne? Az AI egy gyorsan változó tartomány, amely úgy tűnik, nagy fogadásokra ösztönöz. Biztosan nem szeretnék fogadni ez ellen a lehetőség ellen.

Azt is meg kell említenem, hogy a generatív képalkotásnak már komolyabb alkalmazásai is vannak, különösen az orvosi területen, ahol zajos CAT-vizsgálatok javítására vagy a csontszerkezet által esetlegesen blokkolt részletek helyreállítására használható. El is tudom képzelni, hogy ez a technológia bekerüljön a kriminalisztikai eszköztárba. Mindannyian láttuk már a tévéműsorokat – Abby vagy Angela pótolja a hiányzó részleteket egy fényképen úgy, hogy a láthatóból képzett adatokkal extrapolál. A generatív képalkotás ezt lehetővé teheti!

Oszd meg ezt a bejegyzést ezen keresztül:

Időbélyeg:

Még több Semiwiki