->
Image : Mark Hachman / IDG via Dreamstudio.ai
Tom Hanks ne m'a pas simplement appelé pour me proposer un rôle, mais ça y ressemble.
Depuis que PCWorld a commencé à couvrir la montée de diverses applications d'IA comme l'art de l'IA, j'ai fouillé dans les référentiels de code de GitHub et les liens de Reddit, où les gens publieront des ajustements à leurs propres modèles d'IA pour diverses approches.
Certains de ces modèles se retrouvent en fait sur des sites commerciaux, qui roulent leurs propres algorithmes ou en adaptent d'autres qui ont été publiés en open source. Un excellent exemple de site audio AI existant est Uberduck.ai, qui propose littéralement des centaines de modèles préprogrammés. Entrez le texte dans le champ de texte et vous pouvez demander à un Elon Musk virtuel, Bill Gates, Peggy Hill, Daffy Duck, Alex Trebek, Beavis, The Joker ou même Siri de lire vos lignes préprogrammées.
Nous avons téléchargé un faux Bill Clinton faisant l'éloge de PCWorld l'année dernière et le modèle sonne déjà plutôt bien.
Entraîner une IA à reproduire la parole implique de télécharger des échantillons de voix clairs. L'IA "apprend" comment le locuteur combine les sons avec l'objectif pour apprendre ces relations, les perfectionner et imiter les résultats. Si vous connaissez l'excellent thriller de 1992 Sneakers (avec un casting all-star de Robert Redford, Sidney Poitier et Ben Kingsley, entre autres), alors vous connaissez la scène dans laquelle les personnages doivent "déchiffrer" un mot de passe vocal biométrique en enregistrant un échantillon de la voix de la cible . C'est presque exactement la même chose.
Normalement, l'assemblage d'un bon modèle vocal peut nécessiter un peu de formation, avec de longs échantillons pour indiquer comment une personne en particulier parle. Depuis quelques jours, cependant, quelque chose de nouveau est apparu : Microsoft Vall-E, un document de recherche (avec des exemples en direct) d'une voix synthétisée qui ne nécessite que quelques secondes d'audio source pour générer une voix entièrement programmable.
Naturellement, les chercheurs en IA et d'autres groupies en IA voulaient savoir si le modèle Vall-E avait déjà été rendu public. La réponse est non, bien que vous puissiez jouer avec un autre modèle si vous le souhaitez, appelé Tortoise. (L'auteur note que ça s'appelle Tortoise parce que c'est lent, ce qui est le cas, mais ça marche.)
Entraînez votre propre voix d'IA avec Tortoise
Ce qui rend Tortoise intéressant, c'est que vous pouvez entraîner le modèle sur la voix de votre choix simplement en téléchargeant quelques clips audio. Les Page Tortue GitHub note que vous devriez avoir quelques clips d'environ une douzaine de secondes environ. Vous devrez les enregistrer en tant que fichier .WAV avec une qualité spécifique.
Comment ça fonctionne? Par le biais d'un service public dont vous n'êtes peut-être pas au courant : Google Colab. Essentiellement, Collab est un service cloud fourni par Google qui permet d'accéder à un serveur Python. Le code que vous (ou quelqu'un d'autre) écrivez peut être stocké sous forme de bloc-notes, qui peut être partagé avec les utilisateurs disposant d'un compte Google générique. Les La ressource partagée Tortoise est ici.
L'interface semble intimidante, mais ce n'est pas si mal. Vous devrez être connecté en tant qu'utilisateur Google, puis vous devrez cliquer sur "Se connecter" dans le coin supérieur droit. Un mot d'avertissement. Bien que ce Colab ne télécharge rien sur votre Google Drive, d'autres Colabs pourraient le faire. (Les fichiers audio ainsi générés sont cependant stockés dans le navigateur mais peuvent être téléchargés sur votre PC.) Sachez que vous exécutez du code que quelqu'un d'autre a écrit. Vous pouvez recevoir des messages d'erreur soit à cause de mauvaises entrées, soit parce que Google a un problème sur le back-end, comme ne pas avoir de GPU disponible. Tout cela est un peu expérimental.
Chaque bloc de code a une petite icône "jouer" qui apparaît si vous passez votre souris dessus. Vous devrez cliquer sur "jouer" sur chaque bloc de code pour l'exécuter, en attendant que chaque bloc s'exécute avant d'exécuter le suivant.
Bien que nous n'allons pas passer par des instructions détaillées sur toutes les fonctionnalités, sachez simplement que le texte rouge est modifiable par l'utilisateur, comme le texte suggéré que vous voulez que le modèle prononce. À environ sept pâtés de maisons, vous aurez la possibilité de former le modèle. Vous devrez nommer le modèle, puis télécharger les fichiers audio. Lorsque cela est terminé, sélectionnez le nouveau modèle audio dans le quatrième bloc, exécutez le code, puis configurez le texte dans le troisième bloc. Cours qui bloc de code.
Si tout se passe comme prévu, vous aurez une petite sortie audio de votre échantillon de voix. Est-ce que ça marche? Eh bien, j'ai fait un modèle de voix rapide et sale de mon collègue Gordon Mah Ung, dont le travail apparaît sur notre Le podcast Full Nerd ainsi que diverses vidéos. J'ai téléchargé un échantillon de plusieurs minutes plutôt que les courts extraits, juste pour voir si cela fonctionnerait.
Le résultat? Eh bien, ça sons réaliste, mais pas du tout comme Gordon. Il est certainement à l'abri de l'usurpation d'identité numérique pour le moment. (Ce n'est pas non plus une approbation d'une chaîne de restauration rapide.)
Mais un modèle existant que l'auteur de Tortoise a formé sur l'acteur Tom Hanks semble plutôt bien. Ce n'est pas Tom Hanks qui parle ici ! Tom a aussi fait ne sauraient m'offrir un travail, mais c'était suffisant pour tromper au moins un de mes amis.
La conclusion? C'est un peu effrayant : l'âge de croire ce que nous entendons (et voyons bientôt) touche à sa fin. Ou il l'a déjà fait.
Codes de coupon
- Contenu propulsé par le référencement et distribution de relations publiques. Soyez amplifié aujourd'hui.
- Platoblockchain. Intelligence métaverse Web3. Connaissance Amplifiée. Accéder ici.
- La source: https://www.pcworld.com/article/1473072/tom-hanks-did-not-offer-me-a-job-but-ai-sounds-like-it.html
- 1
- 2023
- 39
- a
- Description
- accès
- Compte
- actually
- adapter
- AI
- alex
- algorithmes
- Tous
- permet
- déjà
- parmi
- amp
- ainsi que
- Une autre
- répondre
- applications
- approches
- autour
- article
- artificiel
- acoustique
- auteur
- disponibles
- RETOUR
- Mal
- car
- before
- a commencé
- croire
- Projet de loi
- Bill Clinton
- Bill Gates
- Biométrique
- Bit
- Block
- Blocs
- navigateur
- bouton (dans la fenêtre de contrôle qui apparaît maintenant)
- Appelez-nous
- appelé
- carte
- Catégories
- Assurément
- chaîne
- caractères
- puce
- Selectionnez
- clair
- clips
- le cloud
- code
- collègue
- moissonneuses-batteuses
- commentaires
- commercial
- finalise
- conclusion
- contrôles
- Coin
- cours
- couvrant
- crédit
- CSS
- Date
- jours
- la description
- détaillé
- DID
- numérique
- Ne fait pas
- down
- download
- douzaine
- motivation
- chacun
- éditeur
- non plus
- Elon
- Elon Musk
- émergé
- assez
- Entrer
- erreur
- essentiellement
- Ether (ETH)
- Pourtant, la
- peut
- exemple
- exemples
- excellent
- exécuter
- existant
- faux
- familier
- Fonctionnalités:
- few
- champ
- Déposez votre dernière attestation
- Fichiers
- se concentre
- suivre
- Ancien
- anciennement
- Quatrièmement
- amis
- de
- plein
- d’étiquettes électroniques entièrement
- Portes
- générer
- génère
- obtenez
- obtention
- GitHub
- objectif
- Goes
- aller
- Bien
- GPU
- l'
- ayant
- la taille
- flotter
- Comment
- Cependant
- HTML
- HTTPS
- humain
- Des centaines
- ICON
- image
- in
- indice
- indiquer
- Des instructions
- intéressant
- Interfaces
- intimidant
- IT
- Janvier
- Emploi
- joker
- Savoir
- gros
- Nom de famille
- L'année dernière
- apprentissage
- lignes
- Gauche
- peu
- le travail
- LOOKS
- FAIT DU
- manager
- marque
- Matrice
- largeur maximale
- messages
- Microsoft
- pourrait
- minutes
- miroir
- modèle
- numériques jumeaux (digital twin models)
- Musc
- prénom
- Besoin
- Nouveauté
- nouvelles
- next
- cahier
- Notes
- code
- Offres Speciales
- ONE
- ouvert
- open source
- optimisé
- Option
- Autre
- Autres
- propre
- partie
- particulier
- Mot de Passe
- passé
- PC
- Personnes
- perfection
- personne
- personnel
- Emplacement
- prévu
- Platon
- Intelligence des données Platon
- PlatonDonnées
- Jouez
- plug-in
- Post
- Premium
- président
- assez
- primaire
- Profil
- fournit
- public
- publié
- Python
- qualité
- Lire
- en cours
- recevoir
- récent
- l'enregistrement
- Rouge
- Les relations
- libéré
- a besoin
- un article
- chercheurs
- ressource
- résultat
- Résultats
- Augmenter
- ROBERT
- systèmes de robot
- Collaboratif
- Roulent
- Courir
- pour le running
- des
- même
- Épargnez
- scène
- secondes
- supérieur
- seo
- service
- Services
- sept
- commun
- Shorts
- devrait
- simplement
- depuis
- unique
- siri
- site
- Sites
- Séance
- lent
- petit
- So
- Logiciels
- Quelqu'un
- quelque chose
- disponible
- Identifier
- parler
- Speaker
- parlant
- parle
- groupe de neurones
- discours
- Commencer
- j'ai commencé
- étapes
- stockée
- Stories
- tel
- table
- TAG
- Prenez
- Technologie
- La
- leur
- chose
- Troisièmement
- Avec
- fiable
- Titre
- à
- trop
- Train
- qualifié
- Formation
- TOUR
- téléchargé
- Téléchargement
- URL
- Utilisateur
- utilisateurs
- utilitaire
- divers
- version
- via
- Vidéos
- Salle de conférence virtuelle
- Voix
- VOIX
- W
- Attendre
- voulu
- avertissement
- Quoi
- qui
- tout en
- WHO
- sera
- dans les
- Word
- Activités:
- vos contrats
- pourra
- code écrit
- an
- Votre
- Youtube
- zéphyrnet