Vous cherchez à mettre en production des modèles complexes d'apprentissage automatique ? Le sans serveur pourrait être la réponse

Nœud source: 1573101

Série spéciale Un vieux truisme de l'apprentissage automatique stipule que plus un modèle est complexe et volumineux, plus le résultat de ses prédictions est précis - jusqu'à un certain point.

Si vous vous intéressez aux disciplines ML telles que le traitement du langage naturel, ce sont les énormes modèles BERT et GPT qui font pâlir les praticiens en matière de précision.

Cependant, l'enthousiasme s'estompe lorsqu'il s'agit d'exécuter ces modèles en production, car leur taille même transforme les déploiements en une véritable lutte. Sans parler du coût de mise en place et de maintenance de l'infrastructure nécessaire pour passer de la recherche à la production.

En lisant ceci, les fervents adeptes des tendances informatiques se souviendront peut-être maintenant de l'émergence de l'informatique sans serveur il y a quelques années.

L'approche promettait à peu près de grandes capacités informatiques qui pourraient automatiquement augmenter et diminuer pour répondre à l'évolution des demandes et maintenir les coûts bas. Cela a également permis de libérer les équipes du fardeau de s'occuper de leur infrastructure, car cela se présentait principalement sous la forme d'offres gérées.

Eh bien, le serverless n'a pas disparu depuis lors et semble être une solution presque idéale à première vue. Cependant, en creusant plus profondément, des limitations sur des éléments tels que l'occupation de la mémoire et la taille du package de déploiement empêchent d'en faire une option simple. Cependant, l'intérêt pour la combinaison de l'apprentissage sans serveur et de l'apprentissage automatique augmente. Et avec cela, le nombre de personnes travaillant sur les moyens de créer des modèles BERT et de répondre aux spécifications des fournisseurs pour faciliter les déploiements sans serveur.

Illustration de personnes travaillant à la construction d'une tête géante représentant un système d'IA

Découvrez comment renforcer la confiance dans vos applications d'IA grâce à notre conférence Web MCubed cette semaine

CONFÉRENCE PRÉCÉDENTE

Pour en savoir plus sur ces développements, nous accueillerons Marek Šuppa dans le quatrième épisode de notre série de conférences Web MCubed pour les praticiens de l'apprentissage automatique le 2 décembre. Šuppa est responsable des données chez Q&A et le fabricant d'applications de sondage Slido, où lui et quelques collègues ont utilisé le l'année dernière pour étudier les moyens de modifier les modèles d'analyse et de classification des sentiments afin qu'ils puissent être utilisés dans des environnements sans serveur - sans dégradations redoutées des performances.

Dans son exposé, Šuppa parlera un peu du cas d'utilisation de son équipe, des éléments qui l'ont poussé à envisager le sans serveur, des problèmes qu'ils ont rencontrés au cours de leurs études et des approches qu'ils ont jugées les plus prometteuses pour atteindre des niveaux de latence appropriés aux environnements de production pour leurs déploiements.

Comme d'habitude, le webdiffusion le 2 décembre commencera à 1100h1200 GMT (XNUMX CET) avec un tour d'horizon des actualités sur l'apprentissage automatique liées au développement de logiciels, ce qui vous donnera quelques minutes pour vous installer avant de plonger dans le sujet du déploiement de modèles dans des environnements sans serveur.

Nous serions ravis de vous y voir; nous vous enverrons même un rappel rapide le jour même, il vous suffit de vous inscrire ici. ®

Source : https://go.theregister.com/feed/www.theregister.com/2021/11/29/serverless_bert_solutions/

Horodatage:

Plus de Le registre