Fødereret læring er en machine learning teknik, der gør det muligt for flere parter at træne en model uden at dele deres data. Det bliver brugt på tværs af flere industrier, fra mobile enhedstastaturer til sundhedspleje til autonome køretøjer til olieplatforme. Det er især nyttigt i situationer, hvor datadeling er begrænset af regulering, eller er følsomt eller proprietært, da det giver organisationer mulighed for at samarbejde om maskinlæringsprojekter uden at ofre databeskyttelse. Det er også nyttigt i situationer, hvor datastørrelserne er uoverkommelige store, hvilket gør datacentralisering langsom og dyr.
En af de største forhindringer i maskinlæring er behovet for store mængder data. Dette kan være en udfordring for organisationer, der ikke har adgang til store datasæt, eller for dem, der arbejder med følsomme data, som ikke kan deles. Fødereret læring giver disse organisationer mulighed for at bidrage til en delt model uden at skulle dele deres data.
Fødereret læring kan også hjælpe med at overvinde spørgsmålet om datahomogenitet. I mange tilfælde trænes modeller på data fra et lille sæt kilder, som ikke repræsenterer den generelle befolkning. Modeller, der er trænet på smalle datasæt, generaliserer ikke godt og klarer sig derfor dårligere, når de udrulles mere bredt. Federated learning tillader træningsmodeller på et større og mere forskelligartet sæt af datakilder uden at kræve, at data fra alle disse datakilder centraliseres, hvilket fører til mere robuste modeller med bedre ydeevne.
Derudover kan omkostningerne ved cloud compute-ressourcer være en hindring i maskinlæring. Træning af maskinlæringsmodeller kan være beregningsintensivt og kræver dyr hardware som Graphical Processing Units (GPU'er). Brug af cloud-instanser til træning kan blive dyrt meget hurtigt. Fødereret læring giver organisationer mulighed for at dele byrden af modeltræning og bruge underudnyttede computerressourcer eller servere, som de allerede har i deres datacentre. Dette kan føre til betydelige omkostningsbesparelser i store computertunge træningsprocesser.
Mange organisationer er også bekymrede for at skabe overflødige kopier af store datasæt. Dette kan øge høje lageromkostninger såvel som omkostninger for cloud-udbydere for overførsel af data mellem on-prem datacentre og cloud-konti eller mellem forskellige cloud-konti. Fødereret læring giver organisationer mulighed for at vedligeholde en enkelt kopi af deres data og kræver ikke at flytte dem til en anden placering eller skykonto for at træne modeller med dataene.
En anden udfordring, der kan begrænse brugen af maskinlæring, er privatliv og reguleringsmæssige begrænsninger. De data, der bruges til at træne modeller, kan indeholde følsomme oplysninger såsom personligt identificerbare oplysninger (PII) eller personlige helbredsoplysninger (PHI). Fødereret læring giver organisationer mulighed for at træne modeller uden at skulle dele deres data, hvilket kan hjælpe med at afbøde disse privatlivs- og lovgivningsmæssige bekymringer.
Fødereret læring bliver allerede brugt på tværs af flere industrier for at frigøre kraften i større og mere forskelligartede datasæt uden datadeling. For eksempel i 2021 a COVID beslutningsstøttealgoritme blev trænet med data fra 20 hospitaler rundt om i verden ved hjælp af fødereret læring (fuld afsløring: dette projekt blev ledet af vores medstifter og administrerende direktør), og i 2022 algoritme til påvisning af margin for hjernekræft blev trænet med data fra 71 hospitaler rundt om i verden vha. Google har brugt fødereret læring til forudsige det næste ord, der skrives på Google Android-tastaturer siden 2018 (fuld afsløring: før jeg var med til at stifte min virksomhed, arbejdede jeg hos Google og var involveret i projekter, der brugte fødereret læring).
Sammenfattende hjælper fødereret læring med at overvinde en række forhindringer inden for maskinlæring, herunder behovet for store mængder data, omkostningerne til computerressourcer og datalagring og -overførsel, udfordringen med datahomogenitet og privatlivs- og lovgivningsmæssige bekymringer. Det giver organisationer mulighed for at samarbejde om maskinlæringsprojekter uden at ofre databeskyttelse, demokratisere brugen af maskinlæring og adgang til store forskelligartede træningsdata, hvilket giver mere robuste og bedre ydende modeller.
- SEO Powered Content & PR Distribution. Bliv forstærket i dag.
- Platoblokkæde. Web3 Metaverse Intelligence. Viden forstærket. Adgang her.
- Kilde: https://www.dataversity.net/how-federated-learning-is-helping-to-overcome-obstacles-in-machine-learning/
- 2018
- 2021
- 2022
- a
- Om
- adgang
- Konto
- Konti
- tværs
- Alle
- tillader
- allerede
- beløb
- ,
- android
- omkring
- autonom
- autonome køretøjer
- bliver
- før
- være
- Bedre
- mellem
- bredt
- Kræft
- kan ikke
- hvilken
- tilfælde
- Centers
- Centralisering
- centraliseret
- Direktør
- udfordre
- Cloud
- Medstifter
- samarbejde
- selskab
- Compute
- pågældende
- Bekymringer
- bidrage
- Koste
- omkostningsbesparelser
- Omkostninger
- Oprettelse af
- data
- datacentre
- databeskyttelse
- datasæt
- datadeling
- data opbevaring
- datasæt
- DATAVERSITET
- beslutning
- demokratisering
- indsat
- Detektion
- enhed
- forskellige
- videregivelse
- forskelligartede
- Er ikke
- Dont
- eksempel
- dyrt
- fra
- fuld
- Generelt
- GPU'er
- Hardware
- have
- Helse
- Health Care
- sundhedsinformation
- hjælpe
- hjælpsom
- hjælpe
- Høj
- sygehuse
- Hvordan
- HTTPS
- in
- Herunder
- industrier
- oplysninger
- involverede
- spørgsmål
- IT
- stor
- større
- føre
- førende
- læring
- Led
- GRÆNSE
- Limited
- belastning
- placering
- maskine
- machine learning
- Main
- vedligeholde
- Making
- mange
- Margin
- afbøde
- Mobil
- mobil enhed
- model
- modeller
- mere
- flytning
- flere
- Natur
- Behov
- næste
- nummer
- hindring
- forhindringer
- Olie
- ordrer
- organisationer
- Overvind
- især
- parter
- ydeevne
- personale
- Personlig sundhed
- Personligt
- PIO
- plato
- Platon Data Intelligence
- PlatoData
- befolkning
- magt
- Beskyttelse af personlige oplysninger
- Processer
- forarbejdning
- projekt
- projekter
- proprietære
- udbydere
- hurtigt
- Regulering
- lovgivningsmæssige
- repræsentere
- kræver
- Ressourcer
- robust
- at ofre
- Besparelser
- følsom
- sæt
- sæt
- flere
- Del
- delt
- deling
- signifikant
- siden
- enkelt
- situationer
- størrelser
- langsom
- lille
- Kilder
- opbevaring
- sådan
- RESUMÉ
- support
- verdenen
- deres
- til
- Tog
- uddannet
- Kurser
- overførsel
- Overførsel
- enheder
- låse
- brug
- Ved hjælp af
- Køretøjer
- som
- uden
- ord
- arbejdede
- arbejder
- world
- hvilket giver
- zephyrnet