Comment l'apprentissage fédéré aide à surmonter les obstacles dans l'apprentissage automatique

Republié par Platon

Suiveurs: 0

L'apprentissage fédéré est un machine learning technique qui permet à plusieurs parties de former un modèle sans partager leurs données. Il est utilisé dans plusieurs industries, des claviers d'appareils mobiles aux soins de santé en passant par les véhicules autonomes et les plates-formes pétrolières. Il est particulièrement utile dans les situations où le partage de données est limité par la réglementation, ou est sensible ou propriétaire, car il permet aux organisations de collaborer sur des projets d'apprentissage automatique sans sacrifier la confidentialité des données. Il est également utile dans les situations où la taille des données est prohibitive, ce qui rend la centralisation des données lente et coûteuse.

L'un des principaux obstacles à l'apprentissage automatique est le besoin de grandes quantités de données. Cela peut être un défi pour les organisations qui n'ont pas accès à de grands ensembles de données ou pour celles qui travaillent avec des données sensibles qui ne peuvent pas être partagées. L'apprentissage fédéré permet à ces organisations de contribuer à un modèle partagé sans avoir à partager leurs données.

L'apprentissage fédéré peut également aider à surmonter le problème de l'homogénéité des données. Dans de nombreux cas, les modèles sont formés sur des données provenant d'un petit ensemble de sources qui ne représentent pas la population générale. Les modèles entraînés sur des ensembles de données étroits ne se généralisent pas bien et sont donc moins performants lorsqu'ils sont déployés plus largement. L'apprentissage fédéré permet de former des modèles sur un ensemble plus large et plus diversifié de sources de données sans nécessiter la centralisation des données de toutes ces sources de données, ce qui conduit à des modèles plus robustes avec de meilleures performances.

De plus, le coût des ressources de calcul dans le cloud peut constituer un obstacle à l'apprentissage automatique. La formation de modèles d'apprentissage automatique peut être intensive en calcul, nécessitant du matériel coûteux comme les unités de traitement graphique (GPU). L'utilisation d'instances cloud pour la formation peut devenir coûteuse très rapidement. L'apprentissage fédéré permet aux organisations de partager la charge de formation des modèles et d'utiliser des ressources de calcul ou des serveurs sous-utilisés qu'elles ont déjà dans leurs centres de données. Cela peut entraîner des économies de coûts importantes dans les grands processus de formation à forte intensité de calcul.

De nombreuses organisations sont également préoccupées par la création de copies redondantes d'ensembles de données volumineux. Cela peut entraîner des coûts de stockage élevés, ainsi que des coûts pour les fournisseurs de cloud pour le transfert des données entre les centres de données sur site et les comptes cloud, ou entre différents comptes cloud. L'apprentissage fédéré permet aux organisations de conserver une seule copie de leurs données et ne nécessite pas de la déplacer vers un emplacement ou un compte cloud différent afin de former des modèles avec les données.

Un autre défi qui peut limiter l'utilisation de l'apprentissage automatique est la confidentialité et contraintes réglementaires. Les données utilisées pour former des modèles peuvent contenir des informations sensibles telles que des informations personnelles identifiables (PII) ou des informations personnelles sur la santé (PHI). L'apprentissage fédéré permet aux organisations de former des modèles sans avoir à partager leurs données, ce qui peut aider à atténuer ces problèmes de confidentialité et de réglementation.

L'apprentissage fédéré est déjà utilisé dans plusieurs industries afin de libérer la puissance d'ensembles de données plus vastes et plus diversifiés sans partage de données. Par exemple, en 2021, un Algorithme d'aide à la décision COVID a été formé avec les données de 20 hôpitaux du monde entier en utilisant l'apprentissage fédéré (divulgation complète : ce projet a été dirigé par notre co-fondateur et PDG), et en 2022 un algorithme de détection de la marge du cancer du cerveau a été formé avec les données de 71 hôpitaux du monde entier. Google utilise l'apprentissage fédéré pour prédire le prochain mot tapé sur les claviers Google Android depuis 2018 (divulgation complète : avant de cofonder mon entreprise, j'ai travaillé chez Google et j'ai participé à des projets utilisant l'apprentissage fédéré).

En résumé, l'apprentissage fédéré aide à surmonter un certain nombre d'obstacles à l'apprentissage automatique, notamment le besoin de grandes quantités de données, le coût des ressources de calcul et du stockage et du transfert des données, le défi de l'homogénéité des données et les problèmes de confidentialité et de réglementation. Il permet aux organisations de collaborer sur des projets d'apprentissage automatique sans sacrifier la confidentialité des données, démocratisant l'utilisation de l'apprentissage automatique et l'accès à de grandes données de formation diverses, produisant des modèles plus robustes et plus performants.

Contenu propulsé par le référencement et distribution de relations publiques. Soyez amplifié aujourd'hui.
Platoblockchain. Intelligence métaverse Web3. Connaissance Amplifiée. Accéder ici.
La source: https://www.dataversity.net/how-federated-learning-is-helping-to-overcome-obstacles-in-machine-learning/

Horodatage: 23 janvier 2023

Plus de DATAVERSITÉ

My Career in Data Épisode 34 : Emily Washington, vice-présidente principale de la gestion des produits, Precisely – DATAVERSITY

DATAVERSITÉ

Nœud source: 2848296

Horodatage: 23 août 2023

À quoi s'attendre en 2023 : IA et technologie graphique

Cluster source:

DATAVERSITÉ

Nœud source: 1870338

Horodatage: Le 6 janvier 2023

Republié par Platon

My Career in Data Épisode 34 : Emily Washington, vice-présidente principale de la gestion des produits, Precisely – DATAVERSITY

L'importance de la science des données et de l'analyse dans le secteur financier

Démo Precisely : Confiance décisionnelle – Utiliser des approches modernes de la qualité des données pour améliorer la confiance dans les données – DATAVERSITY

Webinaire DAS : Intelligence artificielle et apprentissage automatique - Construire la bonne fondation architecturale - DATAVERSITY

Démo Denodo : gestion des données à l'épreuve du temps grâce à des architectures logiques : Data Fabric et Data Mesh

Ma carrière dans les données Épisode 59 : Peter van Jaarsveld, responsable mondial de la production, Oliver – DATAVERSITY

erwin by Quest Demo : Faire mûrir votre organisation grâce à l'intelligence des données

Ma carrière dans les données Épisode 46 : Cynthia Cain Fitzgerald, responsable universitaire, Business Intelligence Analytics, Antioch University – DATAVERSITY

À quoi s'attendre en 2023 : IA et technologie graphique

À propos de nous

Recherche verticale et Ai

Plateforme

Restez à l'affût

Compte