->
Bilde: Mark Hachman / IDG via Dreamstudio.ai
Tom Hanks ringte meg ikke bare for å gi meg en del, men det høres sikkert ut som det.
Helt siden PCWorld begynte å dekke fremveksten av ulike AI-applikasjoner som AI art, Jeg har kikket rundt i kodelagrene i GitHub og lenker i Reddit, hvor folk vil legge ut justeringer til sine egne AI-modeller for ulike tilnærminger.
Noen av disse modellene havner faktisk på kommersielle sider, som enten ruller sine egne algoritmer eller tilpasser andre som har publisert som åpen kildekode. Et godt eksempel på en eksisterende AI-lydside er Uberduck.ai, som tilbyr bokstavelig talt hundrevis av forhåndsprogrammerte modeller. Skriv inn teksten i tekstfeltet, og du kan få en virtuell Elon Musk, Bill Gates, Peggy Hill, Daffy Duck, Alex Trebek, Beavis, The Joker eller til og med Siri til å lese opp de forhåndsprogrammerte linjene dine.
Vi lastet opp en falsk Bill Clinton som priste PCWorld i fjor, og modellen høres allerede ganske bra ut.
Å trene en AI til å reprodusere tale innebærer å laste opp klare stemmeprøver. AI-en "lærer" hvordan høyttaleren kombinerer lyder med målet om å lære disse relasjonene, perfeksjonere dem og imitere resultatene. Hvis du er kjent med den utmerkede thrilleren fra 1992 Joggesko (med en all-star rollebesetning av blant andre Robert Redford, Sidney Poitier og Ben Kingsley), så vet du om scenen der karakterene trenger å "knekke" et biometrisk stemmepassord ved å ta opp et stemmeeksempel av målets stemme . Dette er nesten det samme.
Normalt kan det å sette sammen en god stemmemodell ta ganske mye trening, med lange prøver for å indikere hvordan en bestemt person snakker. De siste dagene har imidlertid noe nytt dukket opp: Microsoft Vall-E, en forskningsartikkel (med levende eksempler) av en syntetisert stemme som krever bare noen få sekunder med kildelyd for å generere en fullt programmerbar stemme.
Naturligvis ønsket AI-forskere og andre AI-groupies å vite om Vall-E-modellen hadde blitt utgitt for offentligheten ennå. Svaret er nei, selv om du kan leke med en annen modell hvis du ønsker, kalt Tortoise. (Forfatteren bemerker at den heter Tortoise fordi den er treg, som den er, men den fungerer.)
Tren din egen AI-stemme med Tortoise
Det som gjør Tortoise interessant er at du kan trene modellen på hvilken stemme du enn velger ved å laste opp noen lydklipp. De Tortoise GitHub-side bemerker at du bør ha noen få klipp på omtrent et dusin sekunder eller så. Du må lagre dem som en .WAV-fil med en bestemt kvalitet.
Hvordan fungerer det hele? Gjennom et offentlig verktøy som du kanskje ikke er klar over: Google Colab. I hovedsak er Collab en skytjeneste som Google tilbyr som gir tilgang til en Python-server. Koden du (eller noen andre) skriver kan lagres som en notatbok, som kan deles med brukere som har en generisk Google-konto. De Delt ressurs for skilpadde er her.
Grensesnittet ser skremmende ut, men det er ikke så ille. Du må være logget på som en Google-bruker, og deretter må du klikke på "Koble til" i øvre høyre hjørne. Et ord til advarsel. Selv om denne Colab ikke laster ned noe til Google Disk, kan andre Colabs. (Lydfilene dette genererer lagres imidlertid i nettleseren, men kan lastes ned til din PC.) Vær oppmerksom på at du kjører kode som noen andre har skrevet. Du kan motta feilmeldinger enten på grunn av dårlige innganger eller fordi Google har en hikke på baksiden, for eksempel at du ikke har en tilgjengelig GPU. Det hele er litt eksperimentelt.
Hver kodeblokk har et lite "spill"-ikon som vises hvis du holder musen over den. Du må klikke "spill" på hver blokk med kode for å kjøre den, og vente på at hver blokk skal kjøres før du kjører den neste.
Selv om vi ikke skal gå gjennom detaljerte instruksjoner om alle funksjonene, vær bare oppmerksom på at den røde teksten kan endres av brukeren, for eksempel den foreslåtte teksten som du vil at modellen skal si. Omtrent syv kvartaler ned vil du ha muligheten til å trene modellen. Du må navngi modellen, og deretter laste opp lydfilene. Når det er fullført, velg den nye lydmodellen i den fjerde blokken, kjør koden og konfigurer teksten i den tredje blokken. Løpe Det kodeblokk.
Hvis alt går som planlagt, vil du ha en liten lydutgang av prøvestemmen din. Virker det? Vel, jeg laget en rask og skitten stemmemodell av min kollega Gordon Mah Ung, hvis arbeid vises på vår The Full Nerd-podcast samt diverse videoer. Jeg lastet opp en prøve på flere minutter i stedet for de korte utdragene, bare for å se om det ville fungere.
Resultatet? Vel, det lyder naturtro, men ikke som Gordon i det hele tatt. Han er absolutt trygg fra digital etterligning for nå. (Dette er heller ikke en godkjenning av noen hurtigmatkjede.)
Men en eksisterende modell som Tortoise-forfatteren trente på skuespilleren Tom Hanks høres ganske bra ut. Det er ikke Tom Hanks som snakker her! Tom gjorde det også ikke tilby meg en jobb, men det var nok til å lure minst en av vennene mine.
Konklusjonen? Det er litt skummelt: Tidsalderen for å tro det vi hører (og snart ser) tar slutt. Eller det har den allerede.
Kupongkoder
- SEO-drevet innhold og PR-distribusjon. Bli forsterket i dag.
- Platoblokkkjede. Web3 Metaverse Intelligence. Kunnskap forsterket. Tilgang her.
- kilde: https://www.pcworld.com/article/1473072/tom-hanks-did-not-offer-me-a-job-but-ai-sounds-like-it.html
- 1
- 2023
- 39
- a
- Om oss
- adgang
- Logg inn
- faktisk
- tilpasse
- AI
- alex
- algoritmer
- Alle
- tillater
- allerede
- blant
- amp
- og
- En annen
- besvare
- søknader
- tilnærminger
- rundt
- Artikkel
- kunstig
- lyd
- forfatter
- tilgjengelig
- tilbake
- dårlig
- fordi
- før du
- begynte
- tro
- Bill
- Bill Clinton
- Bill Gates
- biometrisk
- Bit
- Blokker
- Blocks
- nett~~POS=TRUNC leseren~~POS=HEADCOMP
- knapp
- ring
- som heter
- kort
- Kategori
- Gjerne
- kjede
- tegn
- chip
- Velg
- fjerne
- klipp
- Cloud
- kode
- kollega
- skurtreskerne
- kommentarer
- kommersiell
- Fullfører
- konklusjon
- kontroller
- Corner
- kurs
- dekker
- kreditt
- CSS
- Dato
- Dager
- beskrivelse
- detaljert
- gJORDE
- digitalt
- ikke
- ned
- nedlasting
- dusin
- stasjonen
- hver enkelt
- redaktør
- enten
- Elon
- Elon Musk
- dukket
- nok
- Enter
- feil
- hovedsak
- Eter (ETH)
- Selv
- alt
- eksempel
- eksempler
- utmerket
- henrette
- eksisterende
- forfalskning
- kjent
- Egenskaper
- Noen få
- felt
- filet
- Filer
- fokuserer
- følge
- Tidligere
- tidligere
- Fjerde
- venner
- fra
- fullt
- fullt
- Gates
- generere
- genererer
- få
- få
- GitHub
- mål
- Går
- skal
- god
- GPU
- flott
- å ha
- høyde
- hover
- Hvordan
- Men
- HTML
- HTTPS
- menneskelig
- Hundrevis
- ICON
- bilde
- in
- indeks
- indikerer
- instruksjoner
- interessant
- Interface
- skremmende
- IT
- Januar
- Jobb
- Joker
- Vet
- stor
- Siste
- I fjor
- læring
- linjer
- lenker
- lite
- leve
- UTSEENDE
- GJØR AT
- leder
- merke
- Matrix
- max bredde
- meldinger
- Microsoft
- kunne
- minutter
- speil
- modell
- modeller
- Musk
- navn
- Trenger
- Ny
- nyheter
- neste
- bærbare
- Merknader
- tilby
- Tilbud
- ONE
- åpen
- åpen kildekode
- optimalisert
- Alternativ
- Annen
- andre
- egen
- del
- Spesielt
- Passord
- Past
- PC
- porsjoner
- perfeksjonere
- person
- personlig
- Tonehøyde
- planlagt
- plato
- Platon Data Intelligence
- PlatonData
- Spille
- plugg inn
- Post
- Premium
- president
- pen
- primære
- Profil
- gir
- offentlig
- publisert
- Python
- kvalitet
- Lese
- Lesning
- motta
- nylig
- innspilling
- Rød
- Relasjoner
- utgitt
- Krever
- forskning
- forskere
- ressurs
- resultere
- Resultater
- Rise
- ROBERT
- robot
- roboter
- Rull
- Kjør
- rennende
- trygge
- samme
- Spar
- scene
- sekunder
- senior
- SEO
- tjeneste
- Tjenester
- syv
- delt
- Kort
- bør
- ganske enkelt
- siden
- enkelt
- siri
- nettstedet
- Nettsteder
- Sittende
- langsom
- liten
- So
- Software
- Noen
- noe
- Snart
- kilde
- snakke
- Høyttaler
- sett
- Snakker
- spesifikk
- tale
- Begynn
- startet
- Trinn
- lagret
- Stories
- slik
- bord
- TAG
- Ta
- Teknologi
- De
- deres
- ting
- Tredje
- Gjennom
- tid
- Tittel
- til
- også
- Tog
- trent
- Kurs
- SVING
- lastet opp
- Opplasting
- URL
- Bruker
- Brukere
- verktøyet
- ulike
- versjon
- av
- videoer
- virtuelle
- Voice
- STemmer
- W
- venter
- ønsket
- advarsel
- Hva
- hvilken
- mens
- HVEM
- vil
- innenfor
- ord
- Arbeid
- virker
- ville
- skrevet
- år
- Din
- youtube
- zephyrnet