联邦学习是一个 机器学习 允许多方在不共享数据的情况下训练模型的技术。 它被用于多个行业,从移动设备键盘到医疗保健,从自动驾驶汽车到石油钻井平台。 它在数据共享受法规限制、敏感或专有的情况下特别有用,因为它允许组织在机器学习项目上进行协作,而不会牺牲数据隐私。 它在数据量过大的情况下也很有帮助,这使得数据集中化速度缓慢且成本高昂。
机器学习的主要障碍之一是需要大量数据。 对于无法访问大型数据集的组织,或者对于那些处理无法共享的敏感数据的组织来说,这可能是一个挑战。 联邦学习允许这些组织在不必共享数据的情况下为共享模型做出贡献。
联邦学习还可以帮助克服数据同质性问题。 在许多情况下,模型是根据来自不代表一般人群的一小组来源的数据进行训练的。 在狭窄数据集上训练的模型不能很好地泛化,因此在更广泛地部署时表现不佳。 联邦学习允许在更大、更多样化的数据源集上训练模型,而不需要集中所有这些数据源的数据,从而产生更强大的模型和更好的性能。
此外,云计算资源的成本可能成为机器学习的障碍。 训练机器学习模型可能需要大量计算,需要图形处理单元 (GPU) 等昂贵的硬件。 使用云实例进行训练很快就会变得昂贵。 联邦学习允许组织分担模型训练的负载,并使用他们数据中心已有的未充分利用的计算资源或服务器。 这可以在大型计算密集型训练过程中显着节省成本。
许多组织还担心创建大型数据集的冗余副本。 这可能会增加高昂的存储成本,以及云提供商在本地数据中心和云帐户之间或不同云帐户之间传输数据的成本。 联合学习允许组织维护其数据的单个副本,并且不需要将其移动到不同的位置或云帐户以使用数据训练模型。
另一个可能限制机器学习使用的挑战是隐私和 监管限制. 用于训练模型的数据可能包含敏感信息,例如个人身份信息 (PII) 或个人健康信息 (PHI)。 联邦学习允许组织在不必共享数据的情况下训练模型,这有助于减轻这些隐私和监管问题。
联邦学习已经在多个行业中使用,以便在不共享数据的情况下释放更大、更多样化的数据集的力量。 例如,在 2021 年 COVID决策支持算法 使用联合学习对来自全球 20 家医院的数据进行了培训(全面披露:该项目由我们的联合创始人兼首席执行官领导),并在 2022 年 脑癌边缘检测算法 使用来自全球 71 家医院的数据进行训练。 谷歌一直在使用联邦学习来 预测下一个输入的单词 自 2018 年以来在谷歌 Android 键盘上使用(完全披露:在共同创立我的公司之前,我在谷歌工作并参与了利用联邦学习的项目)。
总之,联邦学习正在帮助克服机器学习中的许多障碍,包括对大量数据的需求、计算资源和数据存储和传输的成本、数据同质性的挑战以及隐私和监管问题。 它允许组织在不牺牲数据隐私的情况下就机器学习项目进行协作,使机器学习的使用民主化并访问大量不同的训练数据,从而产生更强大和性能更好的模型。
- SEO 支持的内容和 PR 分发。 今天得到放大。
- 柏拉图区块链。 Web3 元宇宙智能。 知识放大。 访问这里。
- Sumber: https://www.dataversity.net/how-federated-learning-is-helping-to-overcome-obstacles-in-machine-learning/
- 2018
- 2021
- 2022
- a
- 关于
- ACCESS
- 账号管理
- 账户
- 横过
- 所有类型
- 允许
- 已经
- 量
- 和
- 安卓
- 围绕
- 自主性
- 自主车辆
- 成为
- before
- 作为
- 更好
- 之间
- 宽广地
- 癌症预防
- 不能
- 关心
- 例
- 中心
- 集权
- 集中
- CEO
- 挑战
- 云端技术
- 联合创始人
- 合作
- 公司
- 计算
- 关心
- 关注
- 贡献
- 价格
- 节约成本
- 成本
- 创造
- data
- 数据中心
- 数据隐私
- 数据集
- 数据共享
- 数据存储
- 数据集
- 数据多样性
- 决定
- 民主化
- 部署
- 检测
- 设备
- 不同
- 泄露
- 不同
- 不会
- 别
- 例子
- 昂贵
- 止
- ,
- 其他咨询
- 谷歌
- 图形处理器
- 硬件
- 有
- 健康管理
- 卫生保健
- 健康资讯
- 帮助
- 有帮助
- 帮助
- 高
- 医院
- 创新中心
- HTTPS
- in
- 包含
- 行业
- 信息
- 参与
- 问题
- IT
- 大
- 大
- 铅
- 领导
- 学习
- 导致
- 极限
- 有限
- 加载
- 圖書分館的位置
- 机
- 机器学习
- 主要
- 保持
- 制作
- 许多
- 余量
- 减轻
- 联络号码
- 移动设备
- 模型
- 模型
- 更多
- 移动
- 多
- 自然
- 需求
- 下页
- 数
- 障碍
- 障碍
- 油
- 秩序
- 组织
- 克服
- 尤其
- 各方
- 性能
- 个人
- 个人的健康
- 亲自
- ii
- 柏拉图
- 柏拉图数据智能
- 柏拉图数据
- 人口
- 功率
- 隐私
- 过程
- 处理
- 项目
- 项目
- 所有权
- 供应商
- 很快
- 税法法规
- 监管
- 代表
- 要求
- 资源
- 健壮
- 牺牲
- 储
- 敏感
- 集
- 套数
- 几个
- Share
- 共用的,
- 共享
- 显著
- 自
- 单
- 情况
- 尺寸
- 放慢
- 小
- 来源
- 存储
- 这样
- 概要
- SUPPORT
- 世界
- 其
- 至
- 培训
- 熟练
- 产品培训
- 转让
- 传输
- 单位
- 开锁
- 使用
- 利用
- 车辆
- 这
- 也完全不需要
- Word
- 工作
- 加工
- 世界
- 生产
- 和风网