AI Tom Hanks Didn’t Offer Me A Job, But It Sure Sounds Like He Did

Republicado por Platão

seguidores: 0

AI Tom Hanks não me ofereceu um emprego, mas com certeza parece que sim | PC World

<!--

O ser humano olha para o robô no espelho

Imagem: Mark Hachman / IDG via Dreamstudio.ai

Tom Hanks não me ligou apenas para me apresentar um papel, mas com certeza parece que sim.

Desde que a PCWorld começou a cobrir a ascensão da vários aplicativos de IA, como arte de IA, Tenho pesquisado os repositórios de código no GitHub e links no Reddit, onde as pessoas postarão ajustes em seus próprios modelos de IA para várias abordagens.

Alguns desses modelos realmente acabam em sites comerciais, que lançam seus próprios algoritmos ou adaptam outros que foram publicados como código aberto. Um ótimo exemplo de um site de áudio AI existente é Uberduck.ai, que oferece literalmente centenas de modelos pré-programados. Digite o texto no campo de texto e você pode ter um Elon Musk virtual, Bill Gates, Peggy Hill, Daffy Duck, Alex Trebek, Beavis, The Joker ou até mesmo Siri lendo suas falas pré-programadas.

Carregamos um falso Bill Clinton elogiando a PCWorld no ano passado e o modelo já parece muito bom.

Aqui está um modelo de nosso ex-presidente sentado com PCWorld e um lanche. É falso, claro.

Treinar uma IA para reproduzir a fala envolve o upload de amostras de voz claras. A IA “aprende” como o orador combina sons com o objetivo de aprender essas relações, aperfeiçoá-las e imitar os resultados. Se você conhece o excelente thriller de 1992 Tênis (com um elenco de estrelas de Robert Redford, Sidney Poitier e Ben Kingsley, entre outros), então você conhece a cena em que os personagens precisam “quebrar” uma senha de voz biométrica gravando uma amostra de voz da voz do alvo . Isso é quase exatamente a mesma coisa.

Normalmente, montar um bom modelo de voz pode exigir um pouco de treinamento, com amostras extensas para indicar como uma determinada pessoa fala. Nos últimos dias, no entanto, algo novo surgiu: Microsoft Vall-E, um trabalho de pesquisa (com exemplos ao vivo) de uma voz sintetizada que requer apenas alguns segundos de áudio de origem para gerar uma voz totalmente programável.

Naturalmente, os pesquisadores de IA e outros grupos de IA queriam saber se o modelo Vall-E já havia sido lançado ao público. A resposta é não, mas você pode brincar com outro modelo se quiser, chamado Tortoise. (O autor observa que é chamado Tortoise porque é lento, o que é, mas funciona.)

Treine sua própria voz AI com Tortoise

O que torna o Tortoise interessante é que você pode treinar o modelo em qualquer voz que escolher simplesmente carregando alguns clipes de áudio. o Página do GitHub da tartaruga observa que você deve ter alguns clipes de cerca de uma dúzia de segundos ou mais. Você precisará salvá-los como um arquivo .WAV com uma qualidade específica.

Como tudo funciona? Por meio de um serviço público que você talvez não conheça: google colab. Essencialmente, o Collab é um serviço em nuvem que o Google fornece que permite acesso a um servidor Python. O código que você (ou outra pessoa) escreve pode ser armazenado como um notebook, que pode ser compartilhado com usuários que possuem uma conta genérica do Google. o O recurso compartilhado Tortoise está aqui.

A interface parece intimidante, mas não é tão ruim assim. Você precisará estar logado como usuário do Google e clicar em “Conectar” no canto superior direito. Uma palavra de alerta. Embora este Colab não baixe nada para o seu Google Drive, outros Colabs podem. (Os arquivos de áudio que isso gera, no entanto, são armazenados no navegador, mas podem ser baixados para o seu PC.) Esteja ciente de que você está executando um código que outra pessoa escreveu. Você pode receber mensagens de erro devido a entradas incorretas ou porque o Google tem um problema no back-end, como não ter uma GPU disponível. É tudo um pouco experimental.

Google Colaboração Tartaruga — A colaboração da tartaruga. Clique no botão “Conectar” para começar e, em seguida, clique no pequeno ícone “reproduzir” ao lado de cada bloco de código por vez.

Mark Hachman / IDG

Cada bloco de código tem um pequeno ícone de “reproduzir” que aparece se você passar o mouse sobre ele. Você precisará clicar em “play” em cada bloco de código para executá-lo, esperando que cada bloco seja executado antes de executar o próximo.

Apesar de não fornecermos instruções detalhadas sobre todos os recursos, lembre-se de que o texto em vermelho pode ser modificado pelo usuário, como o texto sugerido que você deseja que o modelo fale. Cerca de sete quarteirões abaixo, você terá a opção de treinar o modelo. Você precisará nomear o modelo e, em seguida, carregar os arquivos de áudio. Quando isso for concluído, selecione o novo modelo de áudio no quarto bloco, execute o código e configure o texto no terceiro bloco. Corre que bloco de código.

Se tudo correr como planejado, você terá uma pequena saída de áudio de sua voz de amostra. Funciona? Bem, eu fiz um modelo de voz rápido e sujo do meu colega Gordon Mah Ung, cujo trabalho aparece em nosso O podcast completo do Nerd bem como vários vídeos. Carreguei uma amostra de vários minutos em vez dos trechos curtos, apenas para ver se funcionaria.

O resultado? Bem sons realista, mas não como Gordon. Ele certamente está a salvo de personificação digital por enquanto. (Isso também não é um endosso de nenhuma rede de fast-food.)

Mas um modelo existente que o autor do Tortoise treinou no ator Tom Hanks parece muito bom. Não é Tom Hanks falando aqui! Tom também fez não me ofereceu um emprego, mas foi o suficiente para enganar pelo menos um dos meus amigos.

A conclusão? É um pouco assustador: a era de acreditar no que ouvimos (e logo vemos) está acabando. Ou já tem.

Autor: Mark Hachman, Editor sénior

Como editor sênior da PCWorld, Mark se concentra nas notícias da Microsoft e na tecnologia de chips, entre outros assuntos. Anteriormente, ele escreveu para Garon, BYTE, Slashdot, eWEEK e ReadWrite.

Histórias recentes de Mark Hachman:

Cupom Códigos

Conteúdo com tecnologia de SEO e distribuição de relações públicas. Seja amplificado hoje.
Platoblockchain. Inteligência Metaverso Web3. Conhecimento Ampliado. Acesse aqui.
Fonte: https://www.pcworld.com/article/1473072/tom-hanks-did-not-offer-me-a-job-but-ai-sounds-like-it.html

Carimbo de hora: 13 de janeiro de 2023

Carimbo de hora: 15 Dezembro, 2023

AI Tom Hanks não me ofereceu um emprego, mas com certeza parece que sim

Republicado por Platão

Treine sua própria voz AI com Tortoise

Autor: Mark Hachman, Editor sénior

Histórias recentes de Mark Hachman:

Cupom Códigos

Mais de PC World

RIP Cortana: Microsoft diz que seu aplicativo Windows AI morrerá

Testado: a tecnologia DirectStorage da Microsoft sinaliza o fim dos SSDs SATA

Pode valer a pena comprar o novo laptop colorido e-ink da Lenovo

O luxuoso laptop XPS 13 da Dell está à venda por US$ 650

Nvidia lança GeForce RTX 4070 Ti, laptops avançados da série RTX 40 e muito mais

Aprenda algo novo todos os dias com um desconto extra de $ 20 no Headway

O mais recente Swift Edge 16 da Acer fica mais fino, mais inteligente e mais barato

A 1 principal precaução de segurança que você deve sempre habilitar em um novo PC

Estas lanternas de emergência estão à venda para o Memorial Day

Gordon Moore, co-fundador da Intel e lenda da indústria de chips, morre aos 94 anos

Atualize para o Microsoft Office Pro 2021 vitalício por apenas US$ 50

Sobre Nós

Pesquisa vertical e IA

Plataforma

Fique Ligado

Conta