->
Изображение: Марк Хачман / IDG через Dreamstudio.ai
Том Хэнкс не просто позвонил мне, чтобы предложить мне роль, но это действительно звучит так.
С тех пор, как PCWorld начал освещать рост различные приложения ИИ, такие как искусство ИИ, я копался в репозиториях кода на GitHub и ссылках на Reddit, где люди будут публиковать изменения в своих собственных моделях ИИ для различных подходов.
Некоторые из этих моделей фактически попадают на коммерческие сайты, которые либо внедряют свои собственные алгоритмы, либо адаптируют другие, опубликованные с открытым исходным кодом. Отличным примером существующего аудиосайта с искусственным интеллектом является Uberduck.ai, который предлагает буквально сотни предварительно запрограммированных моделей. Введите текст в текстовое поле, и вы можете попросить виртуального Илона Маска, Билла Гейтса, Пегги Хилл, Даффи Дак, Алекса Требека, Бивиса, Джокера или даже Сири прочитать ваши запрограммированные строки.
В прошлом году мы загрузили фальшивого Билла Клинтона, восхваляющего PCWorld, и модель уже звучит неплохо.
Обучение ИИ воспроизведению речи включает в себя загрузку четких образцов голоса. ИИ «узнает», как говорящий сочетает звуки с целью, изучая эти отношения, совершенствуя их и имитируя результаты. Если вы знакомы с отличным триллером 1992 года Кроссовки (со звездным составом Роберта Редфорда, Сидни Пуатье и Бена Кингсли, среди прочих), то вы знаете о сцене, в которой персонажам нужно «взломать» биометрический голосовой пароль, записав голосовой образец голоса цели. . Это почти то же самое.
Обычно для создания хорошей голосовой модели требуется довольно много тренировок с длинными образцами, чтобы показать, как говорит конкретный человек. Однако в последние несколько дней появилось кое-что новое: Microsoft Vall-E, исследовательская работа (с живыми примерами) синтезированного голоса, которому требуется всего несколько секунд исходного звука для создания полностью программируемого голоса.
Естественно, исследователи искусственного интеллекта и другие поклонники искусственного интеллекта хотели знать, была ли модель Vall-E обнародована. Ответ — нет, хотя вы можете поиграть с другой моделью, если хотите, под названием Черепаха. (Автор отмечает, что он называется Tortoise, потому что он медленный, но работает.)
Тренируйте свой собственный голос ИИ с черепахой
Что делает Tortoise интересным, так это то, что вы можете обучить модель любому голосу, который вы выберете, просто загрузив несколько аудиоклипов. Страница черепахи на GitHub отмечает, что у вас должно быть несколько клипов продолжительностью около дюжины секунд или около того. Вам нужно будет сохранить их как файл .WAV с определенным качеством.
Как все это работает? Через общедоступную утилиту, о которой вы могли не знать: Google Colab. По сути, Collab — это облачный сервис, предоставляемый Google, который позволяет получить доступ к серверу Python. Код, который вы (или кто-то другой) пишет, можно сохранить в виде записной книжки, которой можно поделиться с пользователями, имеющими общую учетную запись Google. Общий ресурс Tortoise находится здесь.
Интерфейс выглядит пугающе, но это не так уж и плохо. Вам необходимо войти в систему как пользователь Google, а затем нажать «Подключиться» в правом верхнем углу. Слово предупреждения. Хотя этот Colab ничего не загружает на ваш Google Диск, другие Colabs могут. (Однако создаваемые при этом аудиофайлы хранятся в браузере, но их можно загрузить на компьютер.) Имейте в виду, что вы запускаете код, написанный кем-то другим. Вы можете получать сообщения об ошибках либо из-за неверных входных данных, либо из-за того, что у Google есть проблемы с серверной частью, например, из-за отсутствия доступного графического процессора. Все немного экспериментально.
Каждый блок кода имеет небольшой значок «воспроизведение», который появляется, если вы наводите на него указатель мыши. Вам нужно будет нажимать «воспроизведение» на каждом блоке кода, чтобы запустить его, ожидая выполнения каждого блока, прежде чем запускать следующий.
Хотя мы не собираемся подробно рассказывать обо всех функциях, просто имейте в виду, что красный текст может быть изменен пользователем, например предлагаемый текст, который вы хотите, чтобы модель произнесла. Примерно через семь кварталов у вас будет возможность обучить модель. Вам нужно будет назвать модель, а затем загрузить аудиофайлы. Когда это будет завершено, выберите новую аудиомодель в четвертом блоке, запустите код, затем настройте текст в третьем блоке. Бег который кодовый блок.
Если все пойдет по плану, у вас будет небольшой аудиовыход вашего образца голоса. Это работает? Что ж, я наспех озвучил своего коллегу Гордона Мах Унга, чья работа появилась на нашем сайте. Подкаст «Полный ботаник» а также различные видеоролики. Я загрузил несколько минут образца, а не короткие фрагменты, просто чтобы посмотреть, сработает ли это.
Результат? Ну, это звуки реалистично, но совсем не похоже на Гордона. Сейчас он точно в безопасности от цифрового олицетворения. (Это также не одобрение какой-либо сети быстрого питания.)
Но существующая модель, которую автор «Черепахи» обучил на актере Томе Хэнксе, звучит довольно неплохо. Здесь говорит не Том Хэнкс! Том также сделал не предложили мне работу, но этого было достаточно, чтобы одурачить хотя бы одного из моих друзей.
Вывод? Это немного пугает: эпоха веры в то, что мы слышим (и вскоре видим), заканчивается. Или уже есть.
Скидочные Купоны
- SEO-контент и PR-распределение. Получите усиление сегодня.
- Платоблокчейн. Интеллект метавселенной Web3. Расширение знаний. Доступ здесь.
- Источник: https://www.pcworld.com/article/1473072/tom-hanks-did-not-offer-me-a-job-but-ai-sounds-like-it.html
- 1
- 2023
- 39
- a
- О нас
- доступ
- Учетная запись
- на самом деле
- приспосабливать
- AI
- Alex
- алгоритмы
- Все
- позволяет
- уже
- среди
- amp
- и
- Другой
- ответ
- Приложения
- подходы
- около
- гайд
- искусственный
- аудио
- автор
- доступен
- назад
- Плохой
- , так как:
- до
- начал
- верить
- Билл
- Билл Клинтон
- Билл Гейтс
- биометрический
- Немного
- Заблокировать
- Блоки
- браузер
- кнопка
- призывают
- под названием
- карта
- Категории
- конечно
- цепь
- символы
- чип
- Выберите
- Очистить
- клипсы
- облако
- код
- коллега
- комбинаты
- Комментарии
- коммерческая
- зАВЕРШАЕТ
- заключение
- контрольная
- Corner
- курс
- покрытие
- кредит
- CSS
- Время
- Дней
- описание
- подробный
- DID
- Интернет
- не
- вниз
- скачать
- дюжина
- управлять
- каждый
- редактор
- или
- Элон
- Elon Musk
- появившийся
- достаточно
- Enter
- ошибка
- по существу
- Эфир (ETH)
- Даже
- многое
- пример
- Примеры
- отлично
- выполнять
- существующий
- не настоящие
- знакомый
- Особенности
- несколько
- поле
- Файл
- Файлы
- фокусируется
- следовать
- Бывший
- раньше
- Четвертый
- друзья
- от
- полный
- полностью
- ворота
- порождать
- генерирует
- получить
- получающий
- GitHub
- цель
- идет
- будет
- хорошо
- GPU / ГРАФИЧЕСКИЙ ПРОЦЕССОР
- большой
- имеющий
- высота
- зависать
- Как
- Однако
- HTML
- HTTPS
- человек
- Сотни
- ICON
- изображение
- in
- индекс
- указывать
- инструкции
- интересный
- Интерфейс
- пугающим
- IT
- январь
- работа
- джокер
- Знать
- большой
- Фамилия
- В прошлом году
- изучение
- линий
- связи
- мало
- жить
- ВЗГЛЯДЫ
- ДЕЛАЕТ
- менеджер
- отметка
- матрица
- макс-ширина
- Сообщения
- Microsoft
- может быть
- минут
- зеркало
- модель
- Модели
- Маск:
- имя
- Необходимость
- Новые
- Новости
- следующий
- ноутбук
- Заметки
- предлагают
- Предложения
- ONE
- открытый
- с открытым исходным кодом
- оптимизированный
- Опция
- Другие контрактные услуги
- Другое
- собственный
- часть
- особый
- Пароль
- мимо
- PC
- Люди
- совершенствование
- человек
- личного
- Pitch
- запланированный
- Платон
- Платон Интеллектуальные данные
- ПлатонДанные
- Играть
- плагин
- После
- Премиум
- президент
- довольно
- первичный
- Профиль
- приводит
- что такое варган?
- опубликованный
- Питон
- Читать
- Reading
- Получать
- последний
- запись
- Red
- Reddit.
- Отношения
- выпустил
- требуется
- исследованиям
- исследователи
- ресурс
- результат
- Итоги
- Рост
- РОБЕРТ
- робот
- Роботы
- Катить
- Run
- Бег
- безопасный
- то же
- Сохранить
- сцена
- секунды
- старший
- поисковая оптимизация
- обслуживание
- Услуги
- семь
- общие
- Короткое
- должен
- просто
- с
- одинарной
- краб
- сайте
- Сайтов
- Сидящий
- медленной
- небольшой
- So
- Software
- Кто-то
- удалось
- Скоро
- Источник
- говорить
- Динамик
- Говоря
- Говорит
- конкретный
- речь
- Начало
- и политические лидеры
- Шаг
- хранить
- Истории
- такие
- ТАБЛИЦЫ
- TAG
- взять
- Технологии
- Ассоциация
- их
- задача
- В третьих
- Через
- время
- Название
- в
- слишком
- Train
- специалистов
- Обучение
- ОЧЕРЕДЬ
- загружено
- Загрузка
- URL
- Информация о пользователе
- пользователей
- утилита
- различный
- версия
- с помощью
- Видео
- Виртуальный
- Режимы
- ГОЛОСА
- W
- Ожидание
- стремятся
- предупреждение
- Что
- который
- в то время как
- КТО
- будете
- в
- Word
- Работа
- работает
- бы
- письменный
- год
- ВАШЕ
- YouTube
- зефирнет