제휴 학습은 기계 학습 여러 당사자가 데이터를 공유하지 않고 모델을 교육할 수 있는 기술입니다. 모바일 장치 키보드에서 건강 관리, 자율 차량, 석유 굴착 장치에 이르기까지 여러 산업 분야에서 사용되고 있습니다. 데이터 공유가 규정에 의해 제한되거나 민감하거나 독점적인 상황에서 조직이 데이터 개인 정보를 희생하지 않고 기계 학습 프로젝트에서 협업할 수 있도록 하므로 특히 유용합니다. 또한 데이터 크기가 엄청나게 커서 데이터 중앙화가 느리고 비용이 많이 드는 상황에서도 유용합니다.
기계 학습의 주요 장애물 중 하나는 많은 양의 데이터가 필요하다는 것입니다. 이것은 대규모 데이터 세트에 대한 액세스 권한이 없는 조직이나 공유할 수 없는 민감한 데이터로 작업하는 조직에게는 어려운 일이 될 수 있습니다. 제휴 학습을 통해 이러한 조직은 데이터를 공유하지 않고도 공유 모델에 기여할 수 있습니다.
연합 학습은 또한 데이터 동질성 문제를 극복하는 데 도움이 될 수 있습니다. 많은 경우에 모델은 일반 인구를 나타내지 않는 작은 소스 세트의 데이터에 대해 학습됩니다. 좁은 데이터 세트에서 학습된 모델은 일반화되지 않으므로 보다 광범위하게 배포할 때 성능이 저하됩니다. 연합 학습을 사용하면 이러한 모든 데이터 소스의 데이터를 중앙 집중화할 필요 없이 더 크고 다양한 데이터 소스 세트에서 모델을 교육할 수 있으므로 더 나은 성능을 가진 더 강력한 모델로 이어집니다.
또한 클라우드 컴퓨팅 리소스 비용은 머신 러닝의 장애물이 될 수 있습니다. 머신 러닝 모델 교육은 GPU(Graphical Processing Unit)와 같은 값비싼 하드웨어가 필요한 계산 집약적일 수 있습니다. 교육에 클라우드 인스턴스를 사용하면 비용이 매우 빠르게 증가할 수 있습니다. 연합 학습을 통해 조직은 모델 교육의 부하를 공유하고 데이터 센터에 이미 보유하고 있는 활용률이 낮은 컴퓨팅 리소스 또는 서버를 사용할 수 있습니다. 이는 컴퓨팅 집약적인 대규모 교육 프로세스에서 상당한 비용 절감으로 이어질 수 있습니다.
또한 많은 조직은 대용량 데이터 세트의 중복 복사본 생성에 대해 우려하고 있습니다. 이로 인해 온프레미스 데이터 센터와 클라우드 계정 간에 또는 서로 다른 클라우드 계정 간에 데이터를 전송하는 데 드는 비용뿐만 아니라 높은 스토리지 비용이 발생할 수 있습니다. 연합 학습을 통해 조직은 데이터의 단일 복사본을 유지 관리할 수 있으며 데이터로 모델을 교육하기 위해 다른 위치나 클라우드 계정으로 이동할 필요가 없습니다.
기계 학습의 사용을 제한할 수 있는 또 다른 문제는 프라이버시와 규제 제약. 모델 학습에 사용되는 데이터에는 개인 식별 정보(PII) 또는 개인 건강 정보(PHI)와 같은 민감한 정보가 포함될 수 있습니다. 연합 학습을 통해 조직은 데이터를 공유하지 않고도 모델을 교육할 수 있으므로 이러한 개인 정보 보호 및 규제 문제를 완화하는 데 도움이 될 수 있습니다.
연합 학습은 데이터 공유 없이 더 크고 다양한 데이터 세트의 힘을 풀기 위해 이미 여러 산업에서 사용되고 있습니다. 예를 들어, 2021년 COVID 결정 지원 알고리즘 연합 학습을 사용하여 전 세계 20개 병원의 데이터로 교육을 받았으며(전체 공개: 이 프로젝트는 공동 설립자 겸 CEO가 주도함), 2022년에는 뇌암 마진 검출 알고리즘 를 사용하여 전 세계 71개 병원의 데이터로 교육을 받았습니다. Google은 연합 학습을 사용하여 입력한 다음 단어 예측 2018년부터 Google Android 키보드에서(전체 공개: 회사를 공동 설립하기 전에 저는 Google에서 근무했으며 연합 학습을 활용한 프로젝트에 참여했습니다).
요약하면 연합 학습은 대량 데이터의 필요성, 컴퓨팅 리소스 및 데이터 저장 및 전송 비용, 데이터 동질성 문제, 개인 정보 보호 및 규제 문제를 포함하여 기계 학습의 여러 장애물을 극복하는 데 도움이 됩니다. 이를 통해 조직은 데이터 프라이버시를 희생하지 않고 머신 러닝 프로젝트에서 협업할 수 있으며, 머신 러닝의 사용을 민주화하고 다양한 교육 데이터에 액세스하여 보다 강력하고 성능이 우수한 모델을 생성할 수 있습니다.
- SEO 기반 콘텐츠 및 PR 배포. 오늘 증폭하십시오.
- 플라토 블록체인. Web3 메타버스 인텔리전스. 지식 증폭. 여기에서 액세스하십시오.
- 출처: https://www.dataversity.net/how-federated-learning-is-helping-to-overcome-obstacles-in-machine-learning/
- 2018
- 2021
- 2022
- a
- 소개
- ACCESS
- 계정
- 계정
- 가로질러
- All
- 수
- 이미
- 금액
- 와
- 기계적 인조 인간
- 약
- 자발적인
- 자치 차량
- 가
- 전에
- 존재
- 더 나은
- 사이에
- 대체로
- 게자리
- 한
- 가지 경우
- 센터
- 집중
- 중앙
- 대표 이사
- 도전
- 클라우드
- 공동 설립자
- 협력
- 회사
- 계산
- 관심
- 우려 사항
- 기여하다
- 비용
- 비용 절감
- 비용
- 만들기
- 데이터
- 데이터 센터
- 데이터 프라이버시
- 데이터 세트
- 데이터 공유
- 데이터 저장
- 데이터 세트
- 데이터 버 시티
- 결정
- 민주화
- 배포
- Detection System
- 장치
- 다른
- 폭로
- 몇몇의
- 하지 않습니다
- 말라
- 예
- 비싼
- 에
- 가득 찬
- 일반
- 구글
- GPU
- 하드웨어
- 데
- 건강
- 건강
- 건강 정보
- 도움
- 도움이
- 도움이
- 높은
- 병원
- 방법
- HTTPS
- in
- 포함
- 산업
- 정보
- 참여
- 발행물
- IT
- 넓은
- 큰
- 리드
- 지도
- 배우기
- 지도
- 제한
- 제한된
- 하중
- 위치
- 기계
- 기계 학습
- 본관
- 유지하다
- 유튜브 영상을 만드는 것은
- .
- 한계
- 완화
- 모바일
- 휴대 기기
- 모델
- 모델
- 배우기
- 움직이는
- 여러
- 자연
- 필요
- 다음 것
- 번호
- 장애물
- 장애물
- 기름
- 주문
- 조직
- 극복하다
- 특별히
- 파티
- 성능
- 확인
- 개인 건강
- 몸소
- pii
- 플라톤
- 플라톤 데이터 인텔리전스
- 플라토데이터
- 인구
- 힘
- 개인 정보 보호
- 프로세스
- 처리
- 프로젝트
- 프로젝트
- 소유권
- 제공
- 빨리
- 규제
- 규정하는
- 대표
- 필요
- 자료
- 강력한
- 희생하는
- 저금
- 민감한
- 세트
- 설정
- 몇몇의
- 공유
- 공유
- 공유
- 상당한
- 이후
- 단일
- 상황
- 크기
- 느리게
- 작은
- 지우면 좋을거같음 . SM
- 저장
- 이러한
- 개요
- SUPPORT
- XNUMXD덴탈의
- 세계
- 그들의
- 에
- Train
- 훈련 된
- 트레이닝
- 이전
- 전송
- 단위
- 잠금을 해제
- 사용
- 활용
- 차량
- 어느
- 없이
- 워드
- 일
- 일하는
- 세계
- 항복
- 제퍼 넷