連合学習は、 機械学習 複数の関係者がデータを共有せずにモデルをトレーニングできるようにする手法。 モバイル デバイスのキーボードからヘルスケア、自動運転車、石油掘削装置まで、さまざまな業界で使用されています。 これは、組織がデータのプライバシーを犠牲にすることなく機械学習プロジェクトで協力できるため、データ共有が規制によって制限されている場合、または機密性や独自性がある場合に特に役立ちます。 また、データのサイズが非常に大きく、データの集中化に時間がかかり、コストがかかる状況でも役立ちます。
機械学習における主な障害の XNUMX つは、大量のデータが必要なことです。 これは、大規模なデータセットにアクセスできない組織や、共有できない機密データを扱っている組織にとっては課題となる可能性があります。 連合学習により、これらの組織はデータを共有することなく共有モデルに貢献できます。
連合学習は、データの均一性の問題を克服するのにも役立ちます。 多くの場合、モデルは、一般集団を代表しない少数のソースからのデータでトレーニングされます。 狭いデータセットでトレーニングされたモデルは一般化がうまくいかないため、より広く展開するとパフォーマンスが低下します。 フェデレーテッド ラーニングを使用すると、これらすべてのデータ ソースからのデータを一元化する必要なく、より大規模で多様なデータ ソース セットでモデルをトレーニングできるため、より優れたパフォーマンスを備えたより堅牢なモデルにつながります。
さらに、クラウド コンピューティング リソースのコストは、機械学習の障害になる可能性があります。 機械学習モデルのトレーニングは計算集約的であり、グラフィカル プロセッシング ユニット (GPU) などの高価なハードウェアが必要になる場合があります。 トレーニングにクラウド インスタンスを使用すると、すぐにコストが高くなる可能性があります。 フェデレーテッド ラーニングにより、組織はモデル トレーニングの負荷を共有し、十分に活用されていないコンピューティング リソースまたはデータ センターに既にあるサーバーを使用できます。 これにより、計算負荷の高い大規模なトレーニング プロセスの大幅なコスト削減につながる可能性があります。
多くの組織は、大規模なデータ セットの冗長コピーの作成についても懸念しています。 これにより、オンプレミスのデータセンターとクラウド アカウント間、または異なるクラウド アカウント間でデータを転送するためのクラウド プロバイダーのコストだけでなく、ストレージ コストも高くなる可能性があります。 フェデレーション ラーニングを使用すると、組織はデータの単一のコピーを維持でき、データを使用してモデルをトレーニングするために別の場所やクラウド アカウントに移動する必要がなくなります。
機械学習の使用を制限する可能性のあるもう XNUMX つの課題は、プライバシーと 規制上の制約. モデルのトレーニングに使用されるデータには、個人を特定できる情報 (PII) や個人の健康情報 (PHI) などの機密情報が含まれている場合があります。 連合学習により、組織はデータを共有することなくモデルをトレーニングできるため、これらのプライバシーや規制に関する懸念を軽減するのに役立ちます。
フェデレーテッド ラーニングは、データを共有することなく、より大規模で多様なデータセットの力を解き放つために、すでにいくつかの業界で使用されています。 たとえば、2021 年に COVID意思決定支援アルゴリズム フェデレーテッド ラーニングを使用して、世界中の 20 の病院からのデータを使用してトレーニングを受けました (完全な開示: このプロジェクトは、当社の共同創設者兼 CEO によって主導されました)。 脳腫瘍マージン検出アルゴリズム を使用して、世界中の 71 の病院からのデータでトレーニングされました。 Google はフェデレーテッド ラーニングを使用して、 次に入力された単語を予測する 2018 年以降、Google Android キーボードで使用されています (完全開示: 会社を共同設立する前は、Google で働き、フェデレーテッド ラーニングを利用したプロジェクトに携わっていました)。
要約すると、フェデレーテッド ラーニングは、大量のデータの必要性、コンピューティング リソースとデータ ストレージと転送のコスト、データの均一性の課題、プライバシーと規制に関する懸念など、機械学習における多くの障害を克服するのに役立っています。 これにより、組織はデータのプライバシーを犠牲にすることなく機械学習プロジェクトで共同作業を行うことができ、機械学習の使用と多種多様なトレーニング データへのアクセスを民主化し、より堅牢でパフォーマンスの高いモデルを生み出すことができます。
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- Platoblockchain。 Web3メタバースインテリジェンス。 知識の増幅。 こちらからアクセスしてください。
- 情報源: https://www.dataversity.net/how-federated-learning-is-helping-to-overcome-obstacles-in-machine-learning/
- 2018
- 2021
- 2022
- a
- 私たちについて
- アクセス
- アカウント
- 越えて
- すべて
- ことができます
- 既に
- 金額
- &
- アンドロイド
- 周りに
- 自律的
- 自律車両
- になる
- さ
- より良いです
- の間に
- 広く
- 癌
- これ
- 例
- センター
- 中央集権
- 集中型の
- 最高経営責任者(CEO)
- 挑戦する
- クラウド
- 共同創設者
- 協力します
- 会社
- 計算
- 心配
- 懸念事項
- 貢献する
- 費用
- コスト削減
- コスト
- 作成
- データ
- データセンター
- データプライバシー
- データセット
- データ共有
- データストレージ
- データセット
- データバーシティ
- 決定
- 民主化
- 展開
- 検出
- デバイス
- 異なります
- 開示
- 異なる
- そうではありません
- ドント
- 例
- 高価な
- から
- フル
- でログイン
- GPU
- Hardware
- 持って
- 健康
- ヘルスケア
- 健康情報
- 助けます
- 役立つ
- 助け
- ハイ
- 病院
- 認定条件
- HTTPS
- in
- 含めて
- 産業
- 情報
- 関係する
- 問題
- IT
- 大
- より大きい
- つながる
- 主要な
- 学習
- ツェッペリン
- LIMIT
- 限定的
- 負荷
- 場所
- 機械
- 機械学習
- メイン
- 維持する
- 作成
- 多くの
- マージン
- 軽減する
- モバイル
- モバイル機器
- モデル
- 他には?
- 移動する
- の試合に
- 自然
- 必要
- 次の
- 数
- 障害
- 障害
- 油
- 注文
- 組織
- 克服する
- 特に
- パーティー
- パフォーマンス
- 個人的な
- 個人の健康
- 個人的に
- 敬虔な
- プラトン
- プラトンデータインテリジェンス
- プラトデータ
- 人口
- 電力
- プライバシー
- ラボレーション
- 処理
- プロジェクト
- プロジェクト(実績作品)
- 所有権
- プロバイダ
- すぐに
- 規制
- レギュレータ
- 表す
- 必要とする
- リソース
- 堅牢な
- 犠牲にする
- 貯蓄
- 敏感な
- セッションに
- セット
- いくつかの
- シェアする
- shared
- シェアリング
- 重要
- から
- 状況
- サイズ
- 遅く
- 小さい
- ソース
- ストレージ利用料
- そのような
- 概要
- サポート
- 世界
- アプリ環境に合わせて
- 〜へ
- トレーニング
- 訓練された
- トレーニング
- 転送
- 転送
- ユニット
- アンロック
- つかいます
- 活用
- 車
- which
- 無し
- Word
- 働いていました
- ワーキング
- 世界
- 収穫
- ゼファーネット