->
Resim: Dreamstudio.ai aracılığıyla Mark Hachman / IDG
Tom Hanks beni sadece bana bir rol teklif etmek için aramadı, ama kulağa kesinlikle öyle geliyor.
PCWorld'ün yükselişini haber yapmaya başladığından beri AI sanatı gibi çeşitli AI uygulamaları, GitHub'daki kod havuzlarında ve Reddit'te insanların çeşitli yaklaşımlar için kendi yapay zeka modellerine ince ayarlar gönderecekleri bağlantıları kurcalıyorum.
Bu modellerden bazıları, aslında ya kendi algoritmalarını kullanan ya da açık kaynak olarak yayınlanan diğerlerini uyarlayan ticari sitelerde sona eriyor. Mevcut bir AI ses sitesine harika bir örnek: uberduck.aiKelimenin tam anlamıyla yüzlerce önceden programlanmış model sunan. Metin alanına metni girin ve sanal bir Elon Musk, Bill Gates, Peggy Hill, Daffy Duck, Alex Trebek, Beavis, The Joker ve hatta Siri'nin önceden programlanmış satırlarınızı okumasını sağlayabilirsiniz.
Geçen yıl PCWorld'ü öven sahte bir Bill Clinton yükledik ve model kulağa şimdiden oldukça iyi geliyor.
Bir yapay zekayı konuşmayı yeniden üretmesi için eğitmek, net ses örneklerinin yüklenmesini içerir. Yapay zeka, konuşmacının bu ilişkileri öğrenmek, onları mükemmelleştirmek ve sonuçları taklit etmek için sesleri hedefle nasıl birleştirdiğini "öğrenir". Mükemmel 1992 gerilim filmine aşina iseniz Lastik ayakkabı (diğerlerinin yanı sıra Robert Redford, Sidney Poitier ve Ben Kingsley'den oluşan yıldızlardan oluşan bir kadroyla), o zaman karakterlerin hedefin ses örneğini kaydederek biyometrik bir ses şifresini "kırması" gereken sahneyi bilirsiniz. . Bu hemen hemen aynı şey.
Normalde, iyi bir ses modeli oluşturmak, belirli bir kişinin nasıl konuştuğunu gösteren uzun örneklerle birlikte oldukça fazla eğitim alabilir. Ancak son günlerde yeni bir şey ortaya çıktı: Microsoft Vall-E, bir araştırma makalesi Tamamen programlanabilir bir ses oluşturmak için yalnızca birkaç saniyelik kaynak ses gerektiren sentezlenmiş bir sesin (canlı örneklerle birlikte).
Doğal olarak, AI araştırmacıları ve diğer AI hayranları, Vall-E modelinin henüz halka açıklanıp yayınlanmadığını bilmek istediler. Cevap hayır, ancak dilerseniz Tortoise adlı başka bir modelle oynayabilirsiniz. (Yazar, yavaş olduğu için Kaplumbağa olarak adlandırıldığını belirtiyor, ki öyle ama işe yarıyor.)
Tortoise ile kendi AI sesinizi eğitin
Tortoise'ı ilginç kılan şey, sadece birkaç ses klibi yükleyerek modeli seçtiğiniz herhangi bir sesle eğitebilmenizdir. bu Kaplumbağa GitHub sayfası yaklaşık bir düzine saniyelik birkaç klibinizin olması gerektiğini not eder. Bunları belirli bir kalitede bir .WAV dosyası olarak kaydetmeniz gerekir.
Her şey nasıl çalışıyor? Farkında olmayabileceğiniz bir kamu hizmeti aracılığıyla: Google İşbirliği. Temel olarak Collab, Google'ın sağladığı ve bir Python sunucusuna erişime izin veren bir bulut hizmetidir. Sizin (veya bir başkasının) yazdığı kod, genel bir Google hesabı olan kullanıcılarla paylaşılabilen bir not defteri olarak saklanabilir. bu Kaplumbağa paylaşılan kaynağı burada.
Arayüz korkutucu görünüyor, ancak o kadar da kötü değil. Bir Google kullanıcısı olarak oturum açmanız ve ardından sağ üst köşedeki "Bağlan"ı tıklamanız gerekir. Uyarı kelimesi. Bu Colab, Google Drive'ınıza hiçbir şey indirmese de diğer Colab'ler indirebilir. (Bununla birlikte, bunun oluşturduğu ses dosyaları tarayıcıda depolanır ancak bilgisayarınıza indirilebilir.) Başka birinin yazdığı kodu çalıştırdığınızın farkında olun. Kötü girdiler nedeniyle veya Google'ın kullanılabilir bir GPU'ya sahip olmaması gibi arka uçta bir aksaklık olması nedeniyle hata mesajları alabilirsiniz. Hepsi biraz deneysel.
Her kod bloğunun, farenizi üzerine getirdiğinizde görünen küçük bir "oynat" simgesi vardır. Çalıştırmak için her kod bloğunda "oynat" düğmesine tıklamanız ve bir sonrakini çalıştırmadan önce her bloğun çalışmasını beklemeniz gerekir.
Tüm özelliklerle ilgili ayrıntılı talimatları adım adım anlatmayacak olsak da, kırmızı metnin, örneğin modelin konuşmasını istediğiniz önerilen metin gibi, kullanıcı tarafından değiştirilebileceğini unutmayın. Yaklaşık yedi blok aşağıda, modeli eğitme seçeneğiniz olacak. Modeli adlandırmanız ve ardından ses dosyalarını yüklemeniz gerekir. Bu tamamlandığında, dördüncü blokta yeni ses modelini seçin, kodu çalıştırın ve ardından üçüncü blokta metni yapılandırın. Koşmak o kod bloğu.
Her şey planlandığı gibi giderse, örnek sesinizin küçük bir ses çıkışına sahip olacaksınız. Çalışıyor mu? Pekala, çalışmaları sitemizde görünen meslektaşım Gordon Mah Ung'un hızlı ve kirli bir ses modelini yaptım. Tam İnek podcast'i yanı sıra çeşitli videolar. İşe yarayıp yaramayacağını görmek için kısa parçalar yerine birkaç dakikalık bir örnek yükledim.
Sonuç? Peki, o sesleri gerçekçi, ama hiç de Gordon gibi değil. Şimdilik dijital kimliğe bürünmeye karşı kesinlikle güvende. (Bu, herhangi bir fast-food zincirinin onaylanması da değildir.)
Ancak Kaplumbağa yazarının oyuncu Tom Hanks üzerinde eğittiği mevcut bir model kulağa oldukça iyi geliyor. Burada konuşan Tom Hanks değil! Tom da yaptı değil bana bir iş teklif et ama en azından bir arkadaşımı kandırmaya yetti.
Sonuç? Biraz ürkütücü: Duyduklarımıza (ve yakında göreceklerimize) inanma çağı sona eriyor. Ya da zaten var.
Kupon Kodları
- SEO Destekli İçerik ve Halkla İlişkiler Dağıtımı. Bugün Gücünüzü Artırın.
- Plato blok zinciri. Web3 Metaverse Zekası. Bilgi Güçlendirildi. Buradan Erişin.
- Kaynak: https://www.pcworld.com/article/1473072/tom-hanks-did-not-offer-me-a-job-but-ai-sounds-like-it.html
- 1
- 2023
- 39
- a
- Hakkımızda
- erişim
- Hesap
- aslında
- uyarlamak
- AI
- alex
- algoritmalar
- Türkiye
- veriyor
- zaten
- arasında
- amp
- ve
- Başka
- cevap
- uygulamaları
- yaklaşımlar
- etrafında
- göre
- yapay
- ses
- yazar
- mevcut
- Arka
- Kötü
- Çünkü
- önce
- başladı
- inanan
- Fatura
- Bill Clinton
- Bill Gates
- biyometrik
- Bit
- Engellemek
- Blokları
- tarayıcı
- düğmesine tıklayın
- çağrı
- denilen
- kart
- Kategoriler
- kesinlikle
- zincir
- karakterler
- yonga
- Klinik
- açık
- klipleri
- bulut
- kod
- meslektaş
- biçerdöverler
- yorumlar
- ticari
- Tamamladı
- sonuç
- kontroller
- Köşe
- kurs
- kaplama
- kredi
- CSS
- Tarih
- Günler
- tanım
- detaylı
- DID
- dijital
- Değil
- aşağı
- indir
- düzine
- sürücü
- her
- editör
- ya
- Elon
- Elon Musk
- ortaya
- yeterli
- Keşfet
- hata
- esasen
- Eter (ETH)
- Hatta
- her şey
- örnek
- örnekler
- mükemmel
- yürütmek
- mevcut
- sahte
- tanıdık
- Özellikler
- az
- alan
- fileto
- dosyalar
- odaklanır
- takip et
- Eski
- eskiden
- Dördüncü
- arkadaşlar
- itibaren
- tam
- tamamen
- Gates,
- oluşturmak
- üretir
- almak
- alma
- GitHub
- gol
- Goes
- gidiş
- Tercih Etmenizin
- GPU
- harika
- sahip olan
- yükseklik
- duraksamak
- Ne kadar
- Ancak
- HTML
- HTTPS
- insan
- Yüzlerce
- ICON
- görüntü
- in
- indeks
- belirtmek
- talimatlar
- ilginç
- arayüzey
- korkutucu
- IT
- Ocak
- İş
- joker
- Bilmek
- büyük
- Soyad
- Geçen yıl
- öğrenme
- hatları
- bağlantılar
- küçük
- yaşamak
- GÖRÜNÜYOR
- YAPAR
- müdür
- işaret
- Matris
- maksimum genişlik
- mesajları
- Microsoft
- olabilir
- dakika
- ayna
- model
- modelleri
- Misk
- isim
- gerek
- yeni
- haber
- sonraki
- defter
- notlar
- teklif
- Teklifler
- ONE
- açık
- açık kaynak
- optimize
- seçenek
- Diğer
- Diğer
- kendi
- Bölüm
- belirli
- Şifre
- geçmiş
- PC
- İnsanlar
- mükemmelleştirmek
- kişi
- kişisel
- Zift
- planlanmış
- Platon
- Plato Veri Zekası
- PlatoVeri
- OYNA
- fişe takmak
- Çivi
- Premium
- başkan
- güzel
- birincil
- Profil
- sağlar
- halka açık
- yayınlanan
- Python
- kalite
- Okumak
- Okuma
- teslim almak
- son
- kayıt
- Kırmızı
- İlişkiler
- serbest
- gerektirir
- araştırma
- Araştırmacılar
- kaynak
- sonuç
- Sonuçlar
- Yükselmek
- ROBERT
- robot
- robotlar
- Rulo
- koşmak
- koşu
- güvenli
- aynı
- İndirim
- sahne
- saniye
- kıdemli
- SEO
- hizmet
- Hizmetler
- Yedi
- Paylaşılan
- kısa
- meli
- sadece
- beri
- tek
- siri
- yer
- Yer
- Oturan
- yavaş
- küçük
- So
- Yazılım
- Birisi
- bir şey
- Yakında
- Kaynak
- konuşmak
- konuşmacı
- konuşma
- Konuştu
- özel
- konuşma
- başlama
- başladı
- adım
- saklı
- hikayeler
- böyle
- tablo
- TAG
- Bizi daha iyi tanımak için
- Teknoloji
- The
- ve bazı Asya
- şey
- Üçüncü
- İçinden
- zaman
- Başlık
- için
- çok
- Tren
- eğitilmiş
- Eğitim
- DÖNÜŞ
- Yüklenen
- Yükleme
- URL
- kullanıcı
- kullanıcılar
- yarar
- çeşitli
- versiyon
- üzerinden
- Videolar
- Sanal
- ses
- SESLER
- W
- Bekleyen
- aranan
- uyarı
- Ne
- hangi
- süre
- DSÖ
- irade
- içinde
- Word
- İş
- çalışır
- olur
- yazılı
- yıl
- Youtube
- zefirnet