->
Kép: Mark Hachman / IDG a Dreamstudio.ai-n keresztül
Tom Hanks nem csak azért hívott fel, hogy bemutasson egy részt, de biztosan úgy hangzik.
Amióta a PCWorld foglalkozni kezdett a felemelkedésével különféle AI-alkalmazások, mint például az AI art, kutakodtam a GitHub kódtáraiban és a Redditen belüli hivatkozásokban, ahol az emberek különféle megközelítéseket tesznek közzé saját AI-modelljeiken.
E modellek némelyike valójában kereskedelmi oldalakra kerül, amelyek vagy saját algoritmusaikat dobják fel, vagy adaptálnak másokat, amelyeket nyílt forráskódként tettek közzé. Egy meglévő mesterséges intelligencia-audio webhely nagyszerű példája az Uberduck.ai, amely szó szerint több száz előre programozott modellt kínál. Írja be a szöveget a szövegmezőbe, és egy virtuális Elon Musk, Bill Gates, Peggy Hill, Daffy Duck, Alex Trebek, Beavis, The Joker vagy akár Siri felolvassa előre beprogramozott sorait.
Tavaly feltöltöttünk egy hamis Bill Clintont, ami a PCWorldot dicséri, és máris egész jól hangzik a modell.
A mesterséges intelligencia beszéd reprodukálására való betanítása tiszta hangminták feltöltését jelenti. Az AI „megtanulja”, hogyan kombinálja a hangszóró a hangokat a céllal, hogy megtanulja ezeket a kapcsolatokat, tökéletesítse azokat, és utánozza az eredményeket. Ha ismeri a kiváló 1992-es thrillert Tornacipő (többek között Robert Redford, Sidney Poitier és Ben Kingsley főszereplésével), akkor tud arról a jelenetről, amelyben a szereplőknek fel kell törniük egy biometrikus hangjelszót a célpont hangjának hangmintájának rögzítésével. . Ez majdnem pontosan ugyanaz.
Normális esetben egy jó hangmodell összeállítása sok edzést igényel, hosszas minták segítségével jelzi, hogyan beszél egy adott személy. Az elmúlt napokban azonban valami új is megjelent: Microsoft Vall-E, egy kutatási dokumentum (élő példákkal) egy szintetizált hang, amely mindössze néhány másodperces forráshangot igényel egy teljesen programozható hang létrehozásához.
Az AI-kutatók és más AI-csoportok természetesen tudni akarták, hogy a Vall-E modellt már nyilvánosságra hozták-e. A válasz nem, bár ha akarod, játszhatsz egy másik modellel is, a Teknős nevű modellel. (A szerző megjegyzi, hogy teknősnek hívják, mert lassú, ami az, de működik.)
Tanítsd meg saját AI-hangodat a Teknősökkel
A Tortoise-t az teszi érdekessé, hogy néhány hangfelvétel feltöltésével bármilyen hangon betaníthatod a modellt. A Tortoise GitHub oldal megjegyzi, hogy kellene néhány, körülbelül egy tucat másodperces klip. Ezeket meghatározott minőségű .WAV-fájlként kell elmentenie.
Hogyan működik mindez? Olyan közszolgáltatón keresztül, amelyről esetleg nem is tud: google colab. A Collab lényegében a Google által biztosított felhőszolgáltatás, amely hozzáférést biztosít egy Python-kiszolgálóhoz. Az Ön (vagy valaki más) által írt kód jegyzetfüzetként tárolható, amelyet megoszthat az általános Google-fiókkal rendelkező felhasználókkal. A A Teknős megosztott erőforrás itt található.
A felület ijesztőnek tűnik, de nem olyan rossz. Google-felhasználóként kell bejelentkeznie, majd kattintson a „Csatlakozás” gombra a jobb felső sarokban. Figyelmeztető szó. Bár ez a Colab nem tölt le semmit az Ön Google Drive-jára, más Colabok ezt megtehetik. (Az így generált hangfájlokat azonban a böngésző tárolja, de letölthetők a számítógépére.) Ügyeljen arra, hogy valaki más által írt kódot futtat. Hibaüzeneteket kaphat rossz bemenetek miatt, vagy azért, mert a Google-nak akadozása van a háttérben, például nincs elérhető GPU. Kicsit kísérleti jellegű az egész.
Minden kódblokkhoz tartozik egy kis „lejátszás” ikon, amely akkor jelenik meg, ha fölé viszi az egeret. Minden egyes kódblokknál a „lejátszás” gombra kell kattintania a futtatáshoz, és meg kell várnia az egyes blokkok végrehajtását, mielőtt futtatná a következőt.
Bár nem fogunk az összes funkcióra vonatkozó részletes utasításokon végigmenni, ügyeljen arra, hogy a piros szöveg a felhasználó által módosítható, például a javasolt szöveg, amelyet a modellnek el kell mondania. Körülbelül hét háztömbbel lejjebb lehetősége lesz a modell betanítására. Nevezze el a modellt, majd töltse fel a hangfájlokat. Ha ez kész, válassza ki az új hangmodellt a negyedik blokkban, futtassa a kódot, majd konfigurálja a szöveget a harmadik blokkban. Fuss hogy kódblokk.
Ha minden a tervek szerint megy, akkor kis hangkimenetet kap a mintahangból. Működik? Nos, készítettem egy gyors és piszkos hangmintát kollégámról, Gordon Mah Ungról, akinek munkája megjelenik a mi oldalunkon. A Full Nerd podcast valamint különféle videókat. A rövid kivonatok helyett több perces mintát töltöttem fel, csak hogy lássam, működik-e.
Az eredmény? Nos, az hangok életszerű, de egyáltalán nem olyan, mint Gordon. Egyelőre biztosan biztonságban van a digitális megszemélyesítéstől. (Ez sem egy gyorséttermi lánc támogatása.)
De egy létező modell, amelyet a teknős szerzője Tom Hanks színészre tanított, nagyon jól hangzik. Itt nem Tom Hanks beszél! Tom is megtette nem állást ajánlani, de ez elég volt ahhoz, hogy legalább az egyik barátomat átverjem.
A következtetés? Kicsit ijesztő: véget ér az a kor, amikor elhiggyük, amit hallunk (és hamarosan látunk). Vagy már megvan.
Kupon kódok
- SEO által támogatott tartalom és PR terjesztés. Erősödjön még ma.
- Platoblockchain. Web3 metaverzum intelligencia. Felerősített tudás. Hozzáférés itt.
- Forrás: https://www.pcworld.com/article/1473072/tom-hanks-did-not-offer-me-a-job-but-ai-sounds-like-it.html
- 1
- 2023
- 39
- a
- Rólunk
- hozzáférés
- Fiók
- tulajdonképpen
- alkalmazkodni
- AI
- alex
- algoritmusok
- Minden termék
- lehetővé teszi, hogy
- már
- között
- amp
- és a
- Másik
- válasz
- alkalmazások
- megközelít
- körül
- cikkben
- mesterséges
- hang-
- szerző
- elérhető
- vissza
- Rossz
- mert
- előtt
- kezdődött
- hívő
- Számla
- Bill Clinton
- Bill Gates
- biometrikus
- Bit
- Blokk
- Blocks
- böngésző
- gomb
- hívás
- hívott
- kártya
- Kategória
- biztosan
- lánc
- karakter
- csip
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a
- világos
- klipek
- felhő
- kód
- kolléga
- kombájnok
- Hozzászólások
- kereskedelmi
- Befejezi
- következtetés
- ellenőrzések
- Sarok
- tanfolyam
- fedő
- hitel
- CSS
- találka
- Nap
- leírás
- részletes
- DID
- digitális
- Nem
- le-
- letöltés
- tucat
- hajtás
- minden
- szerkesztő
- bármelyik
- Elon
- Elon Musk
- alakult
- elég
- belép
- hiba
- lényegében
- Eter (ETH)
- Még
- minden
- példa
- példák
- kiváló
- kivégez
- létező
- hamisítvány
- ismerős
- Jellemzők
- kevés
- mező
- filé
- Fájlok
- koncentrál
- következik
- Korábbi
- korábban
- Negyedik
- barátok
- ból ből
- Tele
- teljesen
- Gates
- generál
- generál
- kap
- szerzés
- GitHub
- cél
- Goes
- megy
- jó
- GPU
- nagy
- tekintettel
- magasság
- lebeg
- Hogyan
- azonban
- HTML
- HTTPS
- emberi
- Több száz
- ICON
- kép
- in
- index
- jelez
- utasítás
- érdekes
- Felület
- megfélemlítő
- IT
- január
- Munka
- tréfacsináló
- Ismer
- nagy
- keresztnév
- Tavaly
- tanulás
- vonalak
- linkek
- kis
- él
- MEGJELENÉS
- KÉSZÍT
- menedzser
- jel
- Mátrix
- max-width
- üzenetek
- microsoft
- esetleg
- jegyzőkönyv
- tükör
- modell
- modellek
- Pézsma
- név
- Szükség
- Új
- hír
- következő
- jegyzetfüzet
- Megjegyzések
- ajánlat
- Ajánlatok
- ONE
- nyitva
- nyílt forráskódú
- optimalizált
- opció
- Más
- Egyéb
- saját
- rész
- különös
- Jelszó
- múlt
- PC
- Emberek (People)
- tökéletesítés
- person
- személyes
- Hangmagasság
- tervezett
- Plató
- Platón adatintelligencia
- PlatoData
- játszani
- csatlakoztat
- állás
- prémium
- elnök
- szép
- elsődleges
- profil
- biztosít
- nyilvános
- közzétett
- Piton
- világítás
- Olvass
- Olvasás
- kap
- új
- felvétel
- Piros
- Kapcsolatok
- felszabaduló
- megköveteli,
- kutatás
- kutatók
- forrás
- eredményez
- Eredmények
- Emelkedik
- ROBERT
- robot
- robotok
- Tekercs
- futás
- futás
- biztonságos
- azonos
- Megtakarítás
- színhely
- másodperc
- idősebb
- SEO
- szolgáltatás
- Szolgáltatások
- hét
- megosztott
- rövid
- kellene
- egyszerűen
- óta
- egyetlen
- Siri
- weboldal
- Webhely (ek)
- Ülés
- lassú
- kicsi
- So
- szoftver
- Valaki
- valami
- Nemsokára
- forrás
- beszél
- Hangszóró
- beszélő
- beszél
- különleges
- beszéd
- kezdet
- kezdődött
- Lépés
- memorizált
- TÖRTÉNETEK
- ilyen
- táblázat
- TAG
- Vesz
- Technológia
- A
- azok
- dolog
- Harmadik
- Keresztül
- idő
- Cím
- nak nek
- is
- Vonat
- kiképzett
- Képzések
- FORDULAT
- feltöltve
- Feltöltés
- URL
- használó
- Felhasználók
- hasznosság
- különféle
- változat
- keresztül
- Videók
- Tényleges
- Hang
- HANGOK
- W
- Várakozás
- kívánatos
- figyelmeztetés
- Mit
- ami
- míg
- WHO
- lesz
- belül
- szó
- Munka
- művek
- lenne
- írott
- év
- A te
- youtube
- zephyrnet