->
Imagem: Mark Hachman / IDG via Dreamstudio.ai
Tom Hanks não me ligou apenas para me apresentar um papel, mas com certeza parece que sim.
Desde que a PCWorld começou a cobrir a ascensão da vários aplicativos de IA, como arte de IA, Tenho pesquisado os repositórios de código no GitHub e links no Reddit, onde as pessoas postarão ajustes em seus próprios modelos de IA para várias abordagens.
Alguns desses modelos realmente acabam em sites comerciais, que lançam seus próprios algoritmos ou adaptam outros que foram publicados como código aberto. Um ótimo exemplo de um site de áudio AI existente é Uberduck.ai, que oferece literalmente centenas de modelos pré-programados. Digite o texto no campo de texto e você pode ter um Elon Musk virtual, Bill Gates, Peggy Hill, Daffy Duck, Alex Trebek, Beavis, The Joker ou até mesmo Siri lendo suas falas pré-programadas.
Carregamos um falso Bill Clinton elogiando a PCWorld no ano passado e o modelo já parece muito bom.
Treinar uma IA para reproduzir a fala envolve o upload de amostras de voz claras. A IA “aprende” como o orador combina sons com o objetivo de aprender essas relações, aperfeiçoá-las e imitar os resultados. Se você conhece o excelente thriller de 1992 Tênis (com um elenco de estrelas de Robert Redford, Sidney Poitier e Ben Kingsley, entre outros), então você conhece a cena em que os personagens precisam “quebrar” uma senha de voz biométrica gravando uma amostra de voz da voz do alvo . Isso é quase exatamente a mesma coisa.
Normalmente, montar um bom modelo de voz pode exigir um pouco de treinamento, com amostras extensas para indicar como uma determinada pessoa fala. Nos últimos dias, no entanto, algo novo surgiu: Microsoft Vall-E, um trabalho de pesquisa (com exemplos ao vivo) de uma voz sintetizada que requer apenas alguns segundos de áudio de origem para gerar uma voz totalmente programável.
Naturalmente, os pesquisadores de IA e outros grupos de IA queriam saber se o modelo Vall-E já havia sido lançado ao público. A resposta é não, mas você pode brincar com outro modelo se quiser, chamado Tortoise. (O autor observa que é chamado Tortoise porque é lento, o que é, mas funciona.)
Treine sua própria voz AI com Tortoise
O que torna o Tortoise interessante é que você pode treinar o modelo em qualquer voz que escolher simplesmente carregando alguns clipes de áudio. o Página do GitHub da tartaruga observa que você deve ter alguns clipes de cerca de uma dúzia de segundos ou mais. Você precisará salvá-los como um arquivo .WAV com uma qualidade específica.
Como tudo funciona? Por meio de um serviço público que você talvez não conheça: google colab. Essencialmente, o Collab é um serviço em nuvem que o Google fornece que permite acesso a um servidor Python. O código que você (ou outra pessoa) escreve pode ser armazenado como um notebook, que pode ser compartilhado com usuários que possuem uma conta genérica do Google. o O recurso compartilhado Tortoise está aqui.
A interface parece intimidante, mas não é tão ruim assim. Você precisará estar logado como usuário do Google e clicar em “Conectar” no canto superior direito. Uma palavra de alerta. Embora este Colab não baixe nada para o seu Google Drive, outros Colabs podem. (Os arquivos de áudio que isso gera, no entanto, são armazenados no navegador, mas podem ser baixados para o seu PC.) Esteja ciente de que você está executando um código que outra pessoa escreveu. Você pode receber mensagens de erro devido a entradas incorretas ou porque o Google tem um problema no back-end, como não ter uma GPU disponível. É tudo um pouco experimental.
Cada bloco de código tem um pequeno ícone de “reproduzir” que aparece se você passar o mouse sobre ele. Você precisará clicar em “play” em cada bloco de código para executá-lo, esperando que cada bloco seja executado antes de executar o próximo.
Apesar de não fornecermos instruções detalhadas sobre todos os recursos, lembre-se de que o texto em vermelho pode ser modificado pelo usuário, como o texto sugerido que você deseja que o modelo fale. Cerca de sete quarteirões abaixo, você terá a opção de treinar o modelo. Você precisará nomear o modelo e, em seguida, carregar os arquivos de áudio. Quando isso for concluído, selecione o novo modelo de áudio no quarto bloco, execute o código e configure o texto no terceiro bloco. Corre que bloco de código.
Se tudo correr como planejado, você terá uma pequena saída de áudio de sua voz de amostra. Funciona? Bem, eu fiz um modelo de voz rápido e sujo do meu colega Gordon Mah Ung, cujo trabalho aparece em nosso O podcast completo do Nerd bem como vários vídeos. Carreguei uma amostra de vários minutos em vez dos trechos curtos, apenas para ver se funcionaria.
O resultado? Bem sons realista, mas não como Gordon. Ele certamente está a salvo de personificação digital por enquanto. (Isso também não é um endosso de nenhuma rede de fast-food.)
Mas um modelo existente que o autor do Tortoise treinou no ator Tom Hanks parece muito bom. Não é Tom Hanks falando aqui! Tom também fez não me ofereceu um emprego, mas foi o suficiente para enganar pelo menos um dos meus amigos.
A conclusão? É um pouco assustador: a era de acreditar no que ouvimos (e logo vemos) está acabando. Ou já tem.
Cupom Códigos
- Conteúdo com tecnologia de SEO e distribuição de relações públicas. Seja amplificado hoje.
- Platoblockchain. Inteligência Metaverso Web3. Conhecimento Ampliado. Acesse aqui.
- Fonte: https://www.pcworld.com/article/1473072/tom-hanks-did-not-offer-me-a-job-but-ai-sounds-like-it.html
- 1
- 2023
- 39
- a
- Sobre
- Acesso
- Conta
- adaptar
- AI
- alex
- algoritmos
- Todos os Produtos
- permite
- já
- entre
- amp
- e
- Outro
- responder
- aplicações
- se aproxima
- por aí
- artigo
- artificial
- auditivo
- autor
- disponível
- em caminho duplo
- Mau
- Porque
- antes
- começou
- crente
- Projeto de lei
- Bill Clinton
- Bill Gates
- biométrico
- Pouco
- Bloquear
- Blocos
- navegador
- botão
- chamada
- chamado
- cartão
- Categoria
- certamente
- cadeia
- caracteres
- lasca
- Escolha
- remover filtragem
- clipes
- Na nuvem
- código
- colega
- combina
- comentários
- comercial
- Completa
- conclusão
- controles
- Canto
- curso
- cobertura
- crédito
- APF
- Data
- dias
- descrição
- detalhado
- DID
- digital
- Não faz
- down
- download
- dúzia
- distância
- cada
- editor
- ou
- Elon
- Elon Musk
- emergiu
- suficiente
- Entrar
- erro
- essencialmente
- Éter (ETH)
- Mesmo
- tudo
- exemplo
- exemplos
- excelente
- executar
- existente
- falsificação
- familiar
- Funcionalidades
- poucos
- campo
- Envie o
- Arquivos
- concentra-se
- seguir
- Antigo
- Antigamente
- Quarto
- amigos
- da
- cheio
- totalmente
- Portões
- gerar
- gera
- ter
- obtendo
- GitHub
- meta
- vai
- vai
- Bom estado, com sinais de uso
- GPU
- ótimo
- ter
- altura
- pairar
- Como funciona o dobrador de carta de canal
- Contudo
- HTML
- HTTPS
- humano
- Centenas
- ÍCONE
- imagem
- in
- índice
- indicam
- instruções
- interessante
- Interface
- intimidante
- IT
- janeiro
- Trabalho
- Joker
- Saber
- grande
- Sobrenome
- Ano passado
- aprendizagem
- linhas
- Links
- pequeno
- viver
- OLHARES
- FAZ
- Gerente
- marca
- Matriz
- max-width
- mensagens
- Microsoft
- poder
- minutos
- espelho
- modelo
- modelos
- Almíscar
- nome
- você merece...
- Novo
- notícias
- Próximo
- caderno
- Notas
- oferecer
- Oferece
- ONE
- aberto
- open source
- otimizado
- Opção
- Outros
- Outros
- próprio
- parte
- particular
- Senha
- passado
- PC
- Pessoas
- aperfeiçoamento
- pessoa
- pessoal
- Passo
- planejado
- platão
- Inteligência de Dados Platão
- PlatãoData
- Jogar
- plug-in
- Publique
- Premium
- presidente
- bastante
- primário
- Perfil
- fornece
- público
- publicado
- Python
- qualidade
- Leia
- Leitura
- receber
- recentemente
- gravação
- Vermelho
- Relacionamentos
- liberado
- exige
- pesquisa
- pesquisadores
- recurso
- resultar
- Resultados
- Subir
- ROBERT
- robô
- robôs
- Rolo
- Execute
- corrida
- seguro
- mesmo
- Salvar
- cena
- segundo
- senior
- seo
- serviço
- Serviços
- Sete
- compartilhado
- Baixo
- rede de apoio social
- simplesmente
- desde
- solteiro
- siri
- local
- Locais
- Sentado
- lento
- pequeno
- So
- Software
- Alguém
- algo
- Em breve
- fonte
- falar
- Palestrantes
- falando
- fala
- específico
- discurso
- começo
- começado
- Passo
- armazenadas
- Histórias
- tal
- mesa
- TAG
- Tire
- Equipar
- A
- deles
- coisa
- Terceiro
- Através da
- tempo
- Título
- para
- também
- Trem
- treinado
- Training
- VIRAR
- carregado
- Upload
- URL
- Utilizador
- usuários
- utilidade
- vário
- versão
- via
- VÍDEOS
- Virtual
- voz
- VOZES
- W
- Esperando
- querido
- aviso
- O Quê
- qual
- enquanto
- QUEM
- precisarão
- dentro
- Word
- Atividades:
- trabalho
- seria
- escrito
- ano
- investimentos
- Youtube
- zefirnet