->
Зображення: Марк Хахман / IDG через Dreamstudio.ai
Том Генкс не просто подзвонив мені, щоб запропонувати мені роль, але це точно звучить так.
Відколи PCWorld почав висвітлювати зростання різні додатки штучного інтелекту, такі як мистецтво штучного інтелекту, я копався в сховищах коду на GitHub і посиланнях на Reddit, де люди публікуватимуть налаштування своїх власних моделей ШІ для різних підходів.
Деякі з цих моделей фактично потрапляють на комерційні сайти, які або розгортають власні алгоритми, або адаптують інші, опубліковані як відкриті. Чудовим прикладом існуючого аудіосайту AI є Uberduck.ai, яка пропонує буквально сотні попередньо запрограмованих моделей. Введіть текст у текстове поле, і ваш віртуальний Ілон Маск, Білл Гейтс, Пеггі Хілл, Даффі Дак, Алекс Требек, Бівіс, Джокер або навіть Сірі прочитають ваші попередньо запрограмовані рядки.
Минулого року ми завантажили підробку Білла Клінтона, який хвалив PCWorld, і модель вже звучить досить добре.
Навчання ШІ відтворювати мову передбачає завантаження чітких зразків голосу. ШІ «дізнається», як диктор поєднує звуки з метою, вивчаючи ці зв’язки, вдосконалюючи їх та імітуючи результати. Якщо ви знайомі з чудовим трилером 1992 року Кросівки (із зірковим акторським складом Роберта Редфорда, Сідні Пуатьє та Бена Кінгслі, серед інших), тоді ви знаєте про сцену, у якій персонажам потрібно «зламати» біометричний голосовий пароль, записавши зразок голосу цілі . Це майже те ж саме.
Зазвичай для складання хорошої моделі голосу потрібно досить багато тренувань із тривалими зразками, щоб показати, як говорить конкретна особа. Однак за останні кілька днів з’явилося щось нове: Microsoft Vall-E, дослідницька стаття (з живими прикладами) синтезованого голосу, який вимагає лише кількох секунд вихідного аудіо, щоб створити повністю програмований голос.
Звичайно, дослідники штучного інтелекту та інші шанувальники штучного інтелекту хотіли знати, чи була модель Vall-E вже оприлюднена. Відповідь - ні, хоча ви можете грати з іншою моделлю, якщо хочете, під назвою Черепаха. (Автор зазначає, що він називається «Черепаха», тому що він повільний, що так і є, але він працює.)
Тренуйте власний голос штучного інтелекту за допомогою Tortoise
Що робить Turtoise цікавим, так це те, що ви можете навчити модель голосу, який ви виберете, просто завантаживши кілька аудіозаписів. The Сторінка Tortoise GitHub зазначає, що у вас має бути кілька кліпів тривалістю близько дюжини секунд. Вам потрібно буде зберегти їх як файл .WAV із певною якістю.
Як це все працює? За допомогою загальнодоступної програми, про яку ви можете не знати: google colab. По суті, Collab — це хмарний сервіс, який надає Google і який надає доступ до сервера Python. Код, який ви (або хтось інший) пишете, можна зберегти як блокнот, яким можна поділитися з користувачами, які мають загальний обліковий запис Google. The Спільний ресурс Tortoise тут.
Інтерфейс виглядає лякаюче, але це не так вже й погано. Вам потрібно буде ввійти як користувач Google, а потім вам потрібно буде натиснути «Підключити» у верхньому правому куті. Слово попередження. Хоча цей Colab нічого не завантажує на ваш Диск Google, інші Colabs можуть. (Однак аудіофайли, які це створює, зберігаються у браузері, але їх можна завантажити на ваш ПК.) Майте на увазі, що ви використовуєте код, який написав хтось інший. Ви можете отримувати повідомлення про помилку або через неправильні введення, або через те, що Google має збій на задній частині, як-от відсутність доступного графічного процесора. Це все трохи експериментально.
Кожен блок коду має маленьку піктограму «відтворення», яка з’являється, якщо навести на нього курсор миші. Вам потрібно буде натиснути «відтворити» на кожному блоці коду, щоб запустити його, чекаючи виконання кожного блоку, перш ніж запускати наступний.
Хоча ми не збираємося надавати детальні інструкції щодо всіх функцій, пам’ятайте, що червоний текст може змінювати користувач, як-от пропонований текст, який ви хочете озвучити моделлю. Приблизно через сім кварталів у вас буде можливість навчити модель. Вам потрібно буде назвати модель, а потім завантажити аудіофайли. Коли це завершиться, виберіть нову модель аудіо в четвертому блоці, запустіть код, а потім налаштуйте текст у третьому блоці. бігти Що кодовий блок.
Якщо все піде за планом, ви матимете невеликий аудіовихід вашого зразка голосу. Це працює? Що ж, я зробив швидкий і брудний голосовий зразок мого колеги Гордона Ма Унга, робота якого з’являється на нашому Подкаст The Full Nerd а також різні відео. Я завантажив кількахвилинний зразок, а не короткі фрагменти, просто щоб перевірити, чи це спрацює.
Результат? Ну це звуки живий, але зовсім не такий, як Гордон. Наразі він точно захищений від цифрового уособлення. (Це також не є схваленням будь-якої мережі швидкого харчування.)
Але існуюча модель, яку автор «Черепахи» навчив на акторі Томі Хенксі, звучить досить добре. Тут говорить не Том Генкс! Том також зробив НЕ запропонував мені роботу, але цього було достатньо, щоб обдурити хоча б одного мого друга.
Висновок? Це трохи страшно: вік віри в те, що ми чуємо (і незабаром бачимо), закінчується. Або вже є.
Купонні коди
- Розповсюдження контенту та PR на основі SEO. Отримайте посилення сьогодні.
- Платоблокчейн. Web3 Metaverse Intelligence. Розширені знання. Доступ тут.
- джерело: https://www.pcworld.com/article/1473072/tom-hanks-did-not-offer-me-a-job-but-ai-sounds-like-it.html
- 1
- 2023
- 39
- a
- МЕНЮ
- доступ
- рахунки
- насправді
- пристосовувати
- AI
- Alex
- алгоритми
- ВСІ
- дозволяє
- вже
- серед
- amp
- та
- Інший
- відповідь
- застосування
- підходи
- навколо
- стаття
- штучний
- аудіо
- автор
- доступний
- назад
- поганий
- оскільки
- перед тим
- почалася
- віруючи
- Білл
- Білл Клінтон
- Білл Гейтс
- біометричні
- Біт
- Блокувати
- блоки
- браузер
- button
- call
- званий
- карта
- Категорія
- звичайно
- ланцюг
- символи
- чіп
- Вибирати
- ясно
- кліпси
- хмара
- код
- колега
- комбінати
- коментарі
- комерційний
- Завершує
- висновок
- управління
- Кут
- курс
- покриття
- кредит
- CSS
- Дата
- Днів
- description
- докладно
- DID
- цифровий
- Ні
- вниз
- скачати
- дюжина
- управляти
- кожен
- редактор
- або
- Елон
- Елон Маск
- з'явився
- досить
- Що натомість? Створіть віртуальну версію себе у
- помилка
- по суті
- Ефір (ETH)
- Навіть
- все
- приклад
- Приклади
- відмінно
- виконувати
- існуючий
- підроблений
- знайомий
- риси
- кілька
- поле
- філе
- Файли
- фокусується
- стежити
- Колишній
- раніше
- Четвертий
- друзі
- від
- Повний
- повністю
- Гейтс
- породжувати
- генерує
- отримати
- отримання
- GitHub
- мета
- йде
- буде
- добре
- GPU
- великий
- має
- висота
- hover
- Як
- Однак
- HTML
- HTTPS
- людина
- Сотні
- ICON
- зображення
- in
- індекс
- вказувати
- інструкції
- цікавий
- інтерфейс
- залякуючи
- IT
- січня
- робота
- Joker
- Знати
- великий
- останній
- Минулого року
- вивчення
- ліній
- зв'язку
- трохи
- жити
- ВИГЛЯДИ
- РОБОТИ
- менеджер
- позначити
- Матриця
- макс-ширина
- повідомлення
- Microsoft
- може бути
- протокол
- дзеркало
- модель
- Моделі
- Маск
- ім'я
- Необхідність
- Нові
- новини
- наступний
- ноутбук
- примітки
- пропонувати
- Пропозиції
- ONE
- відкрити
- з відкритим вихідним кодом
- оптимізований
- варіант
- Інше
- інші
- власний
- частина
- приватність
- Пароль
- Минуле
- PC
- Люди
- вдосконалення
- людина
- персонал
- Крок
- запланований
- plato
- Інформація про дані Платона
- PlatoData
- Play
- підключати
- пошта
- Premium
- президент
- досить
- первинний
- профіль
- забезпечує
- громадськість
- опублікований
- Python
- якість
- Читати
- читання
- отримати
- останній
- запис
- червоний
- Відносини
- випущений
- Вимагається
- дослідження
- Дослідники
- ресурс
- результат
- результати
- Зростання
- РОБЕРТ
- робот
- роботи
- Котити
- прогін
- біг
- сейф
- то ж
- зберегти
- сцена
- seconds
- старший
- пошукова оптимізація
- обслуговування
- Послуги
- сім
- загальні
- Короткий
- Повинен
- просто
- з
- один
- Siri
- сайт
- сайти
- Сидячий
- сповільнювати
- невеликий
- So
- Софтвер
- Хтось
- що в сім'ї щось
- Скоро
- Source
- говорити
- Гучномовець
- розмова
- Говорить
- конкретний
- мова
- старт
- почалася
- Крок
- зберігати
- історії
- такі
- таблиця
- TAG
- Приймати
- Технологія
- Команда
- їх
- річ
- третій
- через
- час
- назва
- до
- занадто
- поїзд
- навчений
- Навчання
- ПЕРЕГЛЯД
- завантажено
- Завантаження
- URL
- користувач
- користувачі
- утиліта
- різний
- версія
- через
- Відео
- Віртуальний
- Голос
- ГОЛОСИ
- W
- Очікування
- хотів
- попередження
- Що
- який
- в той час як
- ВООЗ
- волі
- в
- слово
- Work
- працює
- б
- письмовий
- рік
- вашу
- YouTube
- зефірнет