L'apprentissage fédéré est un machine learning technique qui permet à plusieurs parties de former un modèle sans partager leurs données. Il est utilisé dans plusieurs industries, des claviers d'appareils mobiles aux soins de santé en passant par les véhicules autonomes et les plates-formes pétrolières. Il est particulièrement utile dans les situations où le partage de données est limité par la réglementation, ou est sensible ou propriétaire, car il permet aux organisations de collaborer sur des projets d'apprentissage automatique sans sacrifier la confidentialité des données. Il est également utile dans les situations où la taille des données est prohibitive, ce qui rend la centralisation des données lente et coûteuse.
L'un des principaux obstacles à l'apprentissage automatique est le besoin de grandes quantités de données. Cela peut être un défi pour les organisations qui n'ont pas accès à de grands ensembles de données ou pour celles qui travaillent avec des données sensibles qui ne peuvent pas être partagées. L'apprentissage fédéré permet à ces organisations de contribuer à un modèle partagé sans avoir à partager leurs données.
L'apprentissage fédéré peut également aider à surmonter le problème de l'homogénéité des données. Dans de nombreux cas, les modèles sont formés sur des données provenant d'un petit ensemble de sources qui ne représentent pas la population générale. Les modèles entraînés sur des ensembles de données étroits ne se généralisent pas bien et sont donc moins performants lorsqu'ils sont déployés plus largement. L'apprentissage fédéré permet de former des modèles sur un ensemble plus large et plus diversifié de sources de données sans nécessiter la centralisation des données de toutes ces sources de données, ce qui conduit à des modèles plus robustes avec de meilleures performances.
De plus, le coût des ressources de calcul dans le cloud peut constituer un obstacle à l'apprentissage automatique. La formation de modèles d'apprentissage automatique peut être intensive en calcul, nécessitant du matériel coûteux comme les unités de traitement graphique (GPU). L'utilisation d'instances cloud pour la formation peut devenir coûteuse très rapidement. L'apprentissage fédéré permet aux organisations de partager la charge de formation des modèles et d'utiliser des ressources de calcul ou des serveurs sous-utilisés qu'elles ont déjà dans leurs centres de données. Cela peut entraîner des économies de coûts importantes dans les grands processus de formation à forte intensité de calcul.
De nombreuses organisations sont également préoccupées par la création de copies redondantes d'ensembles de données volumineux. Cela peut entraîner des coûts de stockage élevés, ainsi que des coûts pour les fournisseurs de cloud pour le transfert des données entre les centres de données sur site et les comptes cloud, ou entre différents comptes cloud. L'apprentissage fédéré permet aux organisations de conserver une seule copie de leurs données et ne nécessite pas de la déplacer vers un emplacement ou un compte cloud différent afin de former des modèles avec les données.
Un autre défi qui peut limiter l'utilisation de l'apprentissage automatique est la confidentialité et contraintes réglementaires. Les données utilisées pour former des modèles peuvent contenir des informations sensibles telles que des informations personnelles identifiables (PII) ou des informations personnelles sur la santé (PHI). L'apprentissage fédéré permet aux organisations de former des modèles sans avoir à partager leurs données, ce qui peut aider à atténuer ces problèmes de confidentialité et de réglementation.
L'apprentissage fédéré est déjà utilisé dans plusieurs industries afin de libérer la puissance d'ensembles de données plus vastes et plus diversifiés sans partage de données. Par exemple, en 2021, un Algorithme d'aide à la décision COVID a été formé avec les données de 20 hôpitaux du monde entier en utilisant l'apprentissage fédéré (divulgation complète : ce projet a été dirigé par notre co-fondateur et PDG), et en 2022 un algorithme de détection de la marge du cancer du cerveau a été formé avec les données de 71 hôpitaux du monde entier. Google utilise l'apprentissage fédéré pour prédire le prochain mot tapé sur les claviers Google Android depuis 2018 (divulgation complète : avant de cofonder mon entreprise, j'ai travaillé chez Google et j'ai participé à des projets utilisant l'apprentissage fédéré).
En résumé, l'apprentissage fédéré aide à surmonter un certain nombre d'obstacles à l'apprentissage automatique, notamment le besoin de grandes quantités de données, le coût des ressources de calcul et du stockage et du transfert des données, le défi de l'homogénéité des données et les problèmes de confidentialité et de réglementation. Il permet aux organisations de collaborer sur des projets d'apprentissage automatique sans sacrifier la confidentialité des données, démocratisant l'utilisation de l'apprentissage automatique et l'accès à de grandes données de formation diverses, produisant des modèles plus robustes et plus performants.
- Contenu propulsé par le référencement et distribution de relations publiques. Soyez amplifié aujourd'hui.
- Platoblockchain. Intelligence métaverse Web3. Connaissance Amplifiée. Accéder ici.
- La source: https://www.dataversity.net/how-federated-learning-is-helping-to-overcome-obstacles-in-machine-learning/
- 2018
- 2021
- 2022
- a
- Qui sommes-nous
- accès
- Compte
- hybrides
- à travers
- Tous
- permet
- déjà
- quantités
- ainsi que
- android
- autour
- autonome
- véhicules autonomes
- devenez
- before
- va
- Améliorée
- jusqu'à XNUMX fois
- largement
- Cancer
- ne peut pas
- les soins
- cas
- Centres
- Centralisation
- centralisée
- CEO
- challenge
- le cloud
- Co-fondateur
- collaborons
- Société
- calcul
- concerné
- Préoccupations
- contribuer
- Prix
- les économies de coûts
- Costs
- La création
- données
- les centres de données
- confidentialité des données
- ensembles de données
- partage de données
- stockage de données
- ensembles de données
- DATAVERSITÉ
- décision
- Démocratiser
- déployé
- Détection
- dispositif
- différent
- divulgation
- plusieurs
- Ne fait pas
- Ne pas
- exemple
- cher
- de
- plein
- Général
- GPU
- Matériel
- ayant
- Santé
- Soins de santé
- information sur la santé
- aider
- utile
- aider
- Haute
- les hôpitaux
- Comment
- HTTPS
- in
- Y compris
- secteurs
- d'information
- impliqué
- aide
- IT
- gros
- plus importantes
- conduire
- conduisant
- apprentissage
- LED
- LIMIT
- limité
- charge
- emplacement
- click
- machine learning
- Entrée
- maintenir
- Fabrication
- de nombreuses
- Marge
- Réduire les
- Breeze Mobile
- appareil mobile
- modèle
- numériques jumeaux (digital twin models)
- PLUS
- en mouvement
- plusieurs
- Nature
- Besoin
- next
- nombre
- obstacle
- obstacles
- Huile
- de commander
- organisations
- Overcome
- particulièrement
- les parties
- performant
- personnel
- Santé personnelle
- Personnellement
- pii
- Platon
- Intelligence des données Platon
- PlatonDonnées
- population
- power
- la confidentialité
- les process
- traitement
- Projet
- projets
- propriétaire
- fournisseurs
- vite.
- Règlement
- régulateurs
- représentent
- exigent
- Ressources
- robuste
- sacrifier
- Épargnes
- sensible
- set
- Sets
- plusieurs
- Partager
- commun
- partage
- significative
- depuis
- unique
- situations
- tailles
- lent
- petit
- Sources
- storage
- tel
- RÉSUMÉ
- Support
- Les
- le monde
- leur
- à
- Train
- qualifié
- Formation
- transférer
- Transfert
- unités
- ouvrir
- utilisé
- Utilisant
- Véhicules
- qui
- sans
- Word
- travaillé
- de travail
- world
- élastique
- zéphyrnet