L'IA Tom Hanks ne m'a pas proposé de travail, mais on dirait bien qu'il l'a fait

Republié par Platon

Suiveurs: 0

L'IA Tom Hanks ne m'a pas proposé d'emploi, mais on dirait bien qu'il l'a fait | PC World

<!--

L'homme se penche sur le robot dans le miroir

Image : Mark Hachman / IDG via Dreamstudio.ai

Tom Hanks ne m'a pas simplement appelé pour me proposer un rôle, mais ça y ressemble.

Depuis que PCWorld a commencé à couvrir la montée de diverses applications d'IA comme l'art de l'IA, j'ai fouillé dans les référentiels de code de GitHub et les liens de Reddit, où les gens publieront des ajustements à leurs propres modèles d'IA pour diverses approches.

Certains de ces modèles se retrouvent en fait sur des sites commerciaux, qui roulent leurs propres algorithmes ou en adaptent d'autres qui ont été publiés en open source. Un excellent exemple de site audio AI existant est Uberduck.ai, qui propose littéralement des centaines de modèles préprogrammés. Entrez le texte dans le champ de texte et vous pouvez demander à un Elon Musk virtuel, Bill Gates, Peggy Hill, Daffy Duck, Alex Trebek, Beavis, The Joker ou même Siri de lire vos lignes préprogrammées.

Nous avons téléchargé un faux Bill Clinton faisant l'éloge de PCWorld l'année dernière et le modèle sonne déjà plutôt bien.

Voici un modèle de notre ancien président assis avec PCWorld et une collation. C'est faux, bien sûr.

Entraîner une IA à reproduire la parole implique de télécharger des échantillons de voix clairs. L'IA "apprend" comment le locuteur combine les sons avec l'objectif pour apprendre ces relations, les perfectionner et imiter les résultats. Si vous connaissez l'excellent thriller de 1992 Sneakers (avec un casting all-star de Robert Redford, Sidney Poitier et Ben Kingsley, entre autres), alors vous connaissez la scène dans laquelle les personnages doivent "déchiffrer" un mot de passe vocal biométrique en enregistrant un échantillon de la voix de la cible . C'est presque exactement la même chose.

Normalement, l'assemblage d'un bon modèle vocal peut nécessiter un peu de formation, avec de longs échantillons pour indiquer comment une personne en particulier parle. Depuis quelques jours, cependant, quelque chose de nouveau est apparu : Microsoft Vall-E, un document de recherche (avec des exemples en direct) d'une voix synthétisée qui ne nécessite que quelques secondes d'audio source pour générer une voix entièrement programmable.

Naturellement, les chercheurs en IA et d'autres groupies en IA voulaient savoir si le modèle Vall-E avait déjà été rendu public. La réponse est non, bien que vous puissiez jouer avec un autre modèle si vous le souhaitez, appelé Tortoise. (L'auteur note que ça s'appelle Tortoise parce que c'est lent, ce qui est le cas, mais ça marche.)

Entraînez votre propre voix d'IA avec Tortoise

Ce qui rend Tortoise intéressant, c'est que vous pouvez entraîner le modèle sur la voix de votre choix simplement en téléchargeant quelques clips audio. Les Page Tortue GitHub note que vous devriez avoir quelques clips d'environ une douzaine de secondes environ. Vous devrez les enregistrer en tant que fichier .WAV avec une qualité spécifique.

Comment ça fonctionne? Par le biais d'un service public dont vous n'êtes peut-être pas au courant : Google Colab. Essentiellement, Collab est un service cloud fourni par Google qui permet d'accéder à un serveur Python. Le code que vous (ou quelqu'un d'autre) écrivez peut être stocké sous forme de bloc-notes, qui peut être partagé avec les utilisateurs disposant d'un compte Google générique. Les La ressource partagée Tortoise est ici.

L'interface semble intimidante, mais ce n'est pas si mal. Vous devrez être connecté en tant qu'utilisateur Google, puis vous devrez cliquer sur "Se connecter" dans le coin supérieur droit. Un mot d'avertissement. Bien que ce Colab ne télécharge rien sur votre Google Drive, d'autres Colabs pourraient le faire. (Les fichiers audio ainsi générés sont cependant stockés dans le navigateur mais peuvent être téléchargés sur votre PC.) Sachez que vous exécutez du code que quelqu'un d'autre a écrit. Vous pouvez recevoir des messages d'erreur soit à cause de mauvaises entrées, soit parce que Google a un problème sur le back-end, comme ne pas avoir de GPU disponible. Tout cela est un peu expérimental.

Tortue de la collaboration Google — La collaboration Tortue. Cliquez sur le bouton "Se connecter" pour commencer, puis cliquez sur la petite icône "jouer" à côté de chaque bloc de code à tour de rôle.

Mark Hachman / IDG

Chaque bloc de code a une petite icône "jouer" qui apparaît si vous passez votre souris dessus. Vous devrez cliquer sur "jouer" sur chaque bloc de code pour l'exécuter, en attendant que chaque bloc s'exécute avant d'exécuter le suivant.

Bien que nous n'allons pas passer par des instructions détaillées sur toutes les fonctionnalités, sachez simplement que le texte rouge est modifiable par l'utilisateur, comme le texte suggéré que vous voulez que le modèle prononce. À environ sept pâtés de maisons, vous aurez la possibilité de former le modèle. Vous devrez nommer le modèle, puis télécharger les fichiers audio. Lorsque cela est terminé, sélectionnez le nouveau modèle audio dans le quatrième bloc, exécutez le code, puis configurez le texte dans le troisième bloc. Cours qui bloc de code.

Si tout se passe comme prévu, vous aurez une petite sortie audio de votre échantillon de voix. Est-ce que ça marche? Eh bien, j'ai fait un modèle de voix rapide et sale de mon collègue Gordon Mah Ung, dont le travail apparaît sur notre Le podcast Full Nerd ainsi que diverses vidéos. J'ai téléchargé un échantillon de plusieurs minutes plutôt que les courts extraits, juste pour voir si cela fonctionnerait.

Le résultat? Eh bien, ça sons réaliste, mais pas du tout comme Gordon. Il est certainement à l'abri de l'usurpation d'identité numérique pour le moment. (Ce n'est pas non plus une approbation d'une chaîne de restauration rapide.)

Mais un modèle existant que l'auteur de Tortoise a formé sur l'acteur Tom Hanks semble plutôt bien. Ce n'est pas Tom Hanks qui parle ici ! Tom a aussi fait ne sauraient m'offrir un travail, mais c'était suffisant pour tromper au moins un de mes amis.

La conclusion? C'est un peu effrayant : l'âge de croire ce que nous entendons (et voyons bientôt) touche à sa fin. Ou il l'a déjà fait.

Auteur : Mark Hachman, rédacteur en chef

En tant que rédacteur en chef de PCWorld, Mark se concentre, entre autres, sur l'actualité de Microsoft et la technologie des puces. Il a auparavant écrit pour PCMag, BYTE, Slashdot, eWEEK et ReadWrite.

Histoires récentes de Mark Hachman :

Codes de coupon

Contenu propulsé par le référencement et distribution de relations publiques. Soyez amplifié aujourd'hui.
Platoblockchain. Intelligence métaverse Web3. Connaissance Amplifiée. Accéder ici.
La source: https://www.pcworld.com/article/1473072/tom-hanks-did-not-offer-me-a-job-but-ai-sounds-like-it.html

Horodatage: 13 janvier 2023

Horodatage: Le 15 décembre 2023

L'IA Tom Hanks ne m'a pas proposé de travail, mais on dirait bien qu'il l'a fait

Republié par Platon

Entraînez votre propre voix d'IA avec Tortoise

Auteur : Mark Hachman, rédacteur en chef

Histoires récentes de Mark Hachman :

Codes de coupon

Plus de PC World

RIP Cortana : Microsoft dit que son application Windows AI va mourir

Testé : la technologie DirectStorage de Microsoft signale la fin des SSD SATA

Le nouvel ordinateur portable couleur e-ink de Lenovo pourrait valoir la peine d'être acheté

Le luxueux ordinateur portable XPS 13 de Dell est en vente au prix de 650 $

Nvidia lance GeForce RTX 4070 Ti, des ordinateurs portables avancés de la série RTX 40, et plus encore

Apprenez quelque chose de nouveau tous les jours avec 20 $ de réduction supplémentaires sur Headway

Le dernier Swift Edge 16 d'Acer devient plus fin, plus intelligent et moins cher

La 1 précaution de sécurité majeure que vous devez toujours activer sur un nouveau PC

Ces lampes de poche d'urgence sont en vente pour le Memorial Day

Gordon Moore, co-fondateur d'Intel et légende de l'industrie des puces, décède à 94 ans

Passez à Microsoft Office Pro 2021 à vie pour seulement 50 $

À propos de nous

Recherche verticale et Ai

Plateforme

Restez à l'affût

Compte