->
Billede: Mark Hachman / IDG via Dreamstudio.ai
Tom Hanks ringede ikke bare til mig for at pitche mig en rolle, men det lyder bestemt sådan.
Lige siden PCWorld begyndte at dække fremkomsten af forskellige AI-applikationer som AI art, Jeg har søgt rundt i kodelagrene i GitHub og links i Reddit, hvor folk vil poste tweaks til deres egne AI-modeller til forskellige tilgange.
Nogle af disse modeller ender faktisk på kommercielle sider, som enten ruller deres egne algoritmer eller tilpasser andre, der er udgivet som open source. Et godt eksempel på en eksisterende AI-lydside er Uberduck.ai, som tilbyder bogstaveligt talt hundredvis af forprogrammerede modeller. Indtast teksten i tekstfeltet, og du kan få en virtuel Elon Musk, Bill Gates, Peggy Hill, Daffy Duck, Alex Trebek, Beavis, The Joker eller endda Siri til at læse dine forprogrammerede linjer op.
Vi uploadede en falsk Bill Clinton, der roste PCWorld sidste år, og modellen lyder allerede ret godt.
At træne en AI til at gengive tale involverer upload af klare stemmeprøver. AI'en "lærer", hvordan højttaleren kombinerer lyde med det formål at lære disse relationer, perfektionere dem og efterligne resultaterne. Hvis du er bekendt med den fremragende thriller fra 1992 Sneakers (med en all-star cast af blandt andre Robert Redford, Sidney Poitier og Ben Kingsley), så kender du til scenen, hvor karaktererne skal "knække" en biometrisk stemmeadgangskode ved at optage en stemmeprøve af målets stemme . Dette er næsten det samme.
Normalt kan det kræve en del træning at samle en god stemmemodel, med lange prøver for at indikere, hvordan en bestemt person taler. I de sidste par dage er der dog dukket noget nyt op: Microsoft Vall-E, et forskningspapir (med levende eksempler) af en syntetiseret stemme, der kun kræver et par sekunders kildelyd for at generere en fuldt programmerbar stemme.
Naturligvis ønskede AI-forskere og andre AI-groupies at vide, om Vall-E-modellen var blevet frigivet til offentligheden endnu. Svaret er nej, selvom du kan lege med en anden model, hvis du ønsker det, kaldet Tortoise. (Forfatteren bemærker, at den hedder Tortoise, fordi den er langsom, hvilket den er, men den virker.)
Træn din egen AI-stemme med Tortoise
Det, der gør Tortoise interessant, er, at du kan træne modellen på den stemme, du vælger, blot ved at uploade et par lydklip. Det Tortoise GitHub-side bemærker, at du bør have et par klip på omkring et dusin sekunder eller deromkring. Du skal gemme dem som en .WAV-fil med en bestemt kvalitet.
Hvordan fungerer det hele? Gennem et offentligt værktøj, som du måske ikke er opmærksom på: google colab. I det væsentlige er Collab en cloud-tjeneste, som Google leverer, der giver adgang til en Python-server. Koden, som du (eller en anden) skriver, kan gemmes som en notesbog, som kan deles med brugere, der har en generisk Google-konto. Det Tortoise delt ressource er her.
Interfacet ser skræmmende ud, men det er ikke så slemt. Du skal være logget ind som Google-bruger, og derefter skal du klikke på "Forbind" i øverste højre hjørne. Et ord af advarsel. Selvom denne Colab ikke downloader noget til dit Google Drev, kan andre Colabs muligvis. (Lydfilerne, som dette genererer, gemmes dog i browseren, men kan downloades til din pc.) Vær opmærksom på, at du kører kode, som en anden har skrevet. Du kan modtage fejlmeddelelser enten på grund af dårlige input, eller fordi Google har et hikke på bagsiden, som f.eks. ikke at have en tilgængelig GPU. Det hele er lidt eksperimentelt.
Hver kodeblok har et lille "play"-ikon, der vises, hvis du holder musen over den. Du skal klikke på "afspil" på hver kodeblok for at køre den, mens du venter på, at hver blok udføres, før du kører den næste.
Selvom vi ikke vil gennemgå detaljerede instruktioner om alle funktionerne, skal du blot være opmærksom på, at den røde tekst kan ændres af brugeren, såsom den foreslåede tekst, som du ønsker, at modellen skal tale. Omkring syv blokke nede har du mulighed for at træne modellen. Du skal navngive modellen og derefter uploade lydfilerne. Når det er fuldført, skal du vælge den nye lydmodel i den fjerde blok, køre koden og derefter konfigurere teksten i den tredje blok. Løb at kodeblok.
Hvis alt går som planlagt, får du et lille lydoutput af din prøvestemme. Virker det? Nå, jeg lavede en hurtig og beskidt stemmemodel af min kollega Gordon Mah Ung, hvis arbejde vises på vores The Full Nerd podcast samt diverse videoer. Jeg uploadede en prøve på flere minutter i stedet for de korte uddrag, bare for at se, om det ville virke.
Resultatet? Nå, det lyde naturtro, men slet ikke som Gordon. Han er helt sikkert sikker fra digital efterligning i øjeblikket. (Dette er heller ikke en godkendelse af nogen fastfood-kæde.)
Men en eksisterende model, som Tortoise-forfatteren trænede på skuespilleren Tom Hanks, lyder ret godt. Det er ikke Tom Hanks, der taler her! Det gjorde Tom også ikke tilbyde mig et job, men det var nok til at narre mindst en af mine venner.
Konklusionen? Det er lidt skræmmende: Tidsalderen for at tro på det, vi hører (og snart ser), er ved at være slut. Eller det har den allerede.
Kuponkoder
- SEO Powered Content & PR Distribution. Bliv forstærket i dag.
- Platoblokkæde. Web3 Metaverse Intelligence. Viden forstærket. Adgang her.
- Kilde: https://www.pcworld.com/article/1473072/tom-hanks-did-not-offer-me-a-job-but-ai-sounds-like-it.html
- 1
- 2023
- 39
- a
- Om
- adgang
- Konto
- faktisk
- tilpasse
- AI
- alex
- algoritmer
- Alle
- tillader
- allerede
- blandt
- amp
- ,
- En anden
- besvare
- applikationer
- tilgange
- omkring
- artikel
- kunstig
- lyd
- forfatter
- til rådighed
- tilbage
- Bad
- fordi
- før
- begyndte
- tro
- Bill
- Bill Clinton
- Bill Gates
- biometrisk
- Bit
- Bloker
- Blocks
- browser
- .
- ringe
- kaldet
- kort
- Boligtype
- sikkert
- kæde
- tegn
- chip
- Vælg
- klar
- clips
- Cloud
- kode
- kollega
- kombinerer
- kommentarer
- kommerciel
- Fuldender
- konklusion
- kontrol
- Corner
- kursus
- dækker
- kredit
- CSS
- Dato
- Dage
- beskrivelse
- detaljeret
- DID
- digital
- Er ikke
- ned
- downloade
- dusin
- køre
- hver
- editor
- enten
- Elon
- Elon Musk
- opstået
- nok
- Indtast
- fejl
- væsentlige
- Ether (ETH)
- Endog
- at alt
- eksempel
- eksempler
- fremragende
- udføre
- eksisterende
- falsk
- bekendt
- Funktionalitet
- få
- felt
- File (Felt)
- Filer
- fokuserer
- følger
- Tidligere
- tidligere
- Fjerde
- venner
- fra
- fuld
- fuldt ud
- Gates
- generere
- genererer
- få
- få
- GitHub
- mål
- Goes
- gå
- godt
- GPU
- stor
- have
- højde
- hover
- Hvordan
- Men
- HTML
- HTTPS
- menneskelig
- Hundreder
- ICON
- billede
- in
- indeks
- angiver
- anvisninger
- interessant
- grænseflade
- skræmmende
- IT
- januar
- Job
- Joker
- Kend
- stor
- Efternavn
- Sidste år
- læring
- linjer
- links
- lidt
- leve
- UDSEENDE
- maerker
- leder
- markere
- Matrix
- max-bredde
- beskeder
- microsoft
- måske
- minutter
- spejl
- model
- modeller
- Musk
- navn
- Behov
- Ny
- nyheder
- næste
- notesbog
- Noter
- tilbyde
- Tilbud
- ONE
- åbent
- open source
- optimeret
- Option
- Andet
- Andre
- egen
- del
- særlig
- Adgangskode
- forbi
- PC
- Mennesker
- perfektionere
- person,
- personale
- Pitch
- planlagt
- plato
- Platon Data Intelligence
- PlatoData
- Leg
- plugin
- Indlæg
- Premium
- præsident
- smuk
- primære
- Profil
- giver
- offentlige
- offentliggjort
- Python
- kvalitet
- Læs
- Læsning
- modtage
- nylige
- optagelse
- Rød
- Relationer
- frigivet
- Kræver
- forskning
- forskere
- ressource
- resultere
- Resultater
- Rise
- ROBERT
- robot
- robotter
- Roll
- Kør
- kører
- sikker
- samme
- Gem
- scene
- sekunder
- senior
- SEO
- tjeneste
- Tjenester
- syv
- delt
- Kort
- bør
- ganske enkelt
- siden
- enkelt
- siri
- websted
- Websteder
- Siddende
- langsom
- lille
- So
- Software
- Nogen
- noget
- Snart
- Kilde
- tale
- Højttaler
- taler
- Taler
- specifikke
- tale
- starte
- påbegyndt
- Trin
- opbevaret
- Historier
- sådan
- bord
- TAG
- Tag
- Teknologier
- deres
- ting
- Tredje
- Gennem
- tid
- Titel
- til
- også
- Tog
- uddannet
- Kurser
- TUR
- uploadet
- Uploading
- URL
- Bruger
- brugere
- nytte
- forskellige
- udgave
- via
- Videoer
- Virtual
- Voice
- STEMMER
- W
- Venter
- ønskede
- advarsel
- Hvad
- som
- mens
- WHO
- vilje
- inden for
- ord
- Arbejde
- virker
- ville
- skriftlig
- år
- Din
- youtube
- zephyrnet