->
Gambar: Mark Hachman / IDG via Dreamstudio.ai
Tom Hanks tidak hanya menelepon saya untuk memberi saya bagian, tetapi memang terdengar seperti itu.
Sejak PCWorld mulai meliput kebangkitan berbagai aplikasi AI seperti seni AI, saya telah mencari-cari di repositori kode di GitHub dan tautan di dalam Reddit, tempat orang akan memposting tweak ke model AI mereka sendiri untuk berbagai pendekatan.
Beberapa dari model ini benar-benar berakhir di situs komersial, yang menjalankan algoritme mereka sendiri atau mengadaptasi algoritme lain yang telah dipublikasikan sebagai sumber terbuka. Contoh bagus dari situs audio AI yang ada adalah Uberduck.ai, yang menawarkan ratusan model yang telah diprogram sebelumnya. Masukkan teks di bidang teks dan Anda dapat meminta Elon Musk, Bill Gates, Peggy Hill, Daffy Duck, Alex Trebek, Beavis, The Joker, atau bahkan Siri virtual untuk membacakan baris yang telah diprogram sebelumnya.
Kami mengunggah Bill Clinton palsu yang memuji PCWorld tahun lalu dan modelnya sudah terdengar cukup bagus.
Melatih AI untuk mereproduksi ucapan melibatkan pengunggahan sampel suara yang jelas. AI "mempelajari" bagaimana pembicara menggabungkan suara dengan tujuan untuk mempelajari hubungan tersebut, menyempurnakannya, dan meniru hasilnya. Jika Anda terbiasa dengan film thriller 1992 yang luar biasa Sepatu kets (dengan pemeran Robert Redford, Sidney Poitier, dan Ben Kingsley, antara lain), maka Anda tahu tentang adegan di mana karakter perlu "memecahkan" kata sandi suara biometrik dengan merekam sampel suara dari suara target. . Ini hampir sama persis.
Biasanya, merakit model suara yang bagus membutuhkan sedikit pelatihan, dengan sampel yang panjang untuk menunjukkan bagaimana seseorang berbicara. Namun, dalam beberapa hari terakhir, sesuatu yang baru telah muncul: Microsoft Vall-E, makalah penelitian (dengan contoh langsung) dari suara yang disintesis yang hanya membutuhkan beberapa detik audio sumber untuk menghasilkan suara yang sepenuhnya dapat diprogram.
Secara alami, peneliti AI dan grup AI lainnya ingin tahu apakah model Vall-E sudah dirilis ke publik. Jawabannya adalah tidak, meskipun Anda bisa bermain dengan model lain jika mau, yang disebut Tortoise. (Penulis mencatat bahwa ini disebut Kura-kura karena memang lambat, tetapi berhasil.)
Latih suara AI Anda sendiri dengan Tortoise
Apa yang membuat Kura-kura menarik adalah Anda dapat melatih model pada suara apa pun yang Anda pilih hanya dengan mengunggah beberapa klip audio. Itu halaman Tortoise GitHub catatan bahwa Anda harus memiliki beberapa klip sekitar belasan detik atau lebih. Anda harus menyimpannya sebagai file .WAV dengan kualitas tertentu.
Bagaimana cara kerjanya? Melalui utilitas publik yang mungkin tidak Anda sadari: google colab. Pada dasarnya, Collab adalah layanan cloud yang disediakan Google yang memungkinkan akses ke server Python. Kode yang Anda (atau orang lain) tulis dapat disimpan sebagai buku catatan, yang dapat dibagikan dengan pengguna yang memiliki akun Google generik. Itu Sumber daya bersama kura-kura ada di sini.
Antarmukanya terlihat mengintimidasi, tetapi tidak seburuk itu. Anda harus masuk sebagai pengguna Google dan kemudian Anda harus mengeklik "Hubungkan" di sudut kanan atas. Sebuah kata peringatan. Meskipun Colab ini tidak mendownload apa pun ke Google Drive Anda, Colab lain mungkin melakukannya. (Namun, file audio yang dihasilkan ini disimpan di browser tetapi dapat diunduh ke PC Anda.) Ketahuilah bahwa Anda menjalankan kode yang ditulis orang lain. Anda mungkin menerima pesan kesalahan baik karena input yang buruk atau karena Google mengalami masalah di bagian belakang seperti tidak memiliki GPU yang tersedia. Semuanya sedikit eksperimental.
Setiap blok kode memiliki ikon "putar" kecil yang muncul jika Anda mengarahkan mouse ke atasnya. Anda harus mengklik "mainkan" pada setiap blok kode untuk menjalankannya, menunggu setiap blok dieksekusi sebelum Anda menjalankan yang berikutnya.
Meskipun kami tidak akan melangkah melalui instruksi mendetail tentang semua fitur, perlu diketahui bahwa teks merah dapat dimodifikasi oleh pengguna, seperti teks yang disarankan yang ingin Anda ucapkan pada model. Sekitar tujuh blok ke bawah, Anda akan memiliki opsi untuk melatih model tersebut. Anda harus memberi nama model, lalu mengunggah file audio. Setelah selesai, pilih model audio baru di blok keempat, jalankan kode, lalu konfigurasikan teks di blok ketiga. Lari bahwa blok kode.
Jika semuanya berjalan sesuai rencana, Anda akan memiliki output audio kecil dari sampel suara Anda. Apakah itu bekerja? Nah, saya membuat model suara cepat dan kotor dari rekan saya Gordon Mah Ung, yang karyanya muncul di kami Podcast Nerd Penuh serta berbagai video. Saya mengunggah sampel beberapa menit daripada potongan pendek, hanya untuk melihat apakah itu akan berhasil.
Hasil? Yah, itu suara seperti aslinya, tapi tidak seperti Gordon sama sekali. Dia pasti aman dari peniruan digital untuk saat ini. (Ini juga bukan dukungan dari rantai makanan cepat saji mana pun.)
Tapi model yang sudah ada yang dilatih oleh penulis Kura-kura pada aktor Tom Hanks terdengar cukup bagus. Ini bukan Tom Hanks yang berbicara di sini! Tom juga melakukannya tidak menawari saya pekerjaan, tetapi itu cukup untuk membodohi setidaknya salah satu teman saya.
Kesimpulannya? Agak menakutkan: zaman mempercayai apa yang kita dengar (dan segera lihat) sudah berakhir. Atau sudah.
Kode Kupon
- Konten Bertenaga SEO & Distribusi PR. Dapatkan Amplifikasi Hari Ini.
- Platoblockchain. Intelijen Metaverse Web3. Pengetahuan Diperkuat. Akses Di Sini.
- Sumber: https://www.pcworld.com/article/1473072/tom-hanks-did-not-offer-me-a-job-but-ai-sounds-like-it.html
- 1
- 2023
- 39
- a
- Tentang Kami
- mengakses
- Akun
- sebenarnya
- menyesuaikan
- AI
- alex
- algoritma
- Semua
- memungkinkan
- sudah
- antara
- amp
- dan
- Lain
- menjawab
- aplikasi
- pendekatan
- sekitar
- artikel
- buatan
- audio
- penulis
- tersedia
- kembali
- Buruk
- karena
- sebelum
- mulai
- percaya
- tagihan
- Bill Clinton
- Bill Gates
- biometrik
- Bit
- Memblokir
- Blok
- Browser
- tombol
- panggilan
- bernama
- kartu
- Kategori
- Pasti
- rantai
- karakter
- keping
- Pilih
- jelas
- klip
- awan
- kode
- rekan
- menggabungkan
- komentar
- komersial
- Selesaikan
- kesimpulan
- kontrol
- Sudut
- Tentu saja
- penutup
- kredit
- CSS
- Tanggal
- Hari
- deskripsi
- terperinci
- MELAKUKAN
- digital
- Tidak
- turun
- Download
- lusin
- mendorong
- setiap
- editor
- antara
- Elon
- Elon Musk
- muncul
- cukup
- Enter
- kesalahan
- dasarnya
- Eter (ETH)
- Bahkan
- segala sesuatu
- contoh
- contoh
- unggul
- menjalankan
- ada
- gadungan
- akrab
- Fitur
- beberapa
- bidang
- File
- File
- berfokus
- mengikuti
- Bekas
- dahulu
- Keempat
- teman
- dari
- penuh
- sepenuhnya
- Gates
- menghasilkan
- menghasilkan
- mendapatkan
- mendapatkan
- GitHub
- tujuan
- Pergi
- akan
- baik
- GPU
- besar
- memiliki
- tinggi
- melayang-layang
- Seterpercayaapakah Olymp Trade? Kesimpulan
- Namun
- HTML
- HTTPS
- manusia
- Ratusan
- ICON
- gambar
- in
- indeks
- menunjukkan
- instruksi
- menarik
- Antarmuka
- mengintimidasi
- IT
- Januari
- Pekerjaan
- pelawak
- Tahu
- besar
- Terakhir
- Tahun lalu
- pengetahuan
- baris
- link
- sedikit
- hidup
- TERLIHAT
- MEMBUAT
- manajer
- tanda
- Matriks
- max-width
- pesan
- Microsoft
- mungkin
- menit
- cermin
- model
- model
- Jebat
- nama
- Perlu
- New
- berita
- berikutnya
- buku catatan
- Catatan
- menawarkan
- Penawaran
- ONE
- Buka
- open source
- dioptimalkan
- pilihan
- Lainnya
- Lainnya
- sendiri
- bagian
- tertentu
- Kata Sandi
- lalu
- PC
- Konsultan Ahli
- menyempurnakan
- orang
- pribadi
- Nada
- berencana
- plato
- Kecerdasan Data Plato
- Data Plato
- Bermain
- Plugin
- Pos
- Premium
- presiden
- cukup
- primer
- Profil
- menyediakan
- publik
- diterbitkan
- Ular sanca
- kualitas
- Baca
- Bacaan
- menerima
- baru
- rekaman
- Merah
- Hubungan
- dirilis
- membutuhkan
- penelitian
- peneliti
- sumber
- mengakibatkan
- Hasil
- Naik
- ROBERT
- robot
- robot
- Menggulung
- Run
- berjalan
- aman
- sama
- Save
- adegan
- detik
- senior
- SEO
- layanan
- Layanan
- tujuh
- berbagi
- Pendek
- harus
- hanya
- sejak
- tunggal
- siri
- situs web
- Situs
- Duduk
- lambat
- kecil
- So
- Perangkat lunak
- Seseorang
- sesuatu
- Segera
- sumber
- berbicara
- Pembicara
- berbicara
- Bicara
- tertentu
- pidato
- awal
- mulai
- Langkah
- tersimpan
- cerita
- seperti itu
- tabel
- MENANDAI
- Mengambil
- Teknologi
- Grafik
- mereka
- hal
- Ketiga
- Melalui
- waktu
- Judul
- untuk
- terlalu
- Pelatihan VE
- terlatih
- Pelatihan
- MENGHIDUPKAN
- upload
- Mengunggah
- URL
- Pengguna
- Pengguna
- kegunaan
- berbagai
- versi
- melalui
- Video
- maya
- Suara
- SUARA
- W
- Menunggu
- ingin
- peringatan
- Apa
- yang
- sementara
- SIAPA
- akan
- dalam
- Word
- Kerja
- bekerja
- akan
- tertulis
- tahun
- Anda
- Youtube
- zephyrnet.dll