2023 年 9 月 20 日
基础模型 (FM) 标志着一个新时代的开始 机器学习(ML) 和 人工智能(AI),这导致人工智能的更快发展,可以适应广泛的下游任务并针对一系列应用程序进行微调。
随着在工作中处理数据的重要性日益增加,在企业边缘提供人工智能模型可以实现近乎实时的预测,同时遵守数据主权和隐私要求。 通过结合 IBM沃森克斯 借助边缘计算为 FM 提供数据和 AI 平台功能,企业可以在运营边缘运行 AI 工作负载以进行 FM 微调和推理。 这使企业能够在边缘扩展人工智能部署,减少部署时间和成本,并加快响应时间。
请务必查看本系列关于边缘计算的博客文章中的所有部分:
什么是基础模型?
基础模型 (FM) 在大量未标记数据上进行大规模训练,正在推动最先进的人工智能 (AI) 应用。 它们可以适应各种下游任务,并针对一系列应用进行微调。 现代人工智能模型在单一领域执行特定任务,正在让位于 FM,因为它们学习更广泛,并且跨领域和跨问题工作。 顾名思义,FM 可以成为 AI 模型许多应用的基础。
FM 解决了阻碍企业扩大人工智能采用的两个关键挑战。 首先,企业产生大量未标记数据,其中只有一小部分被标记用于AI模型训练。 其次,这种标记和注释任务极其耗费人力,通常需要主题专家 (SME) 花费数百小时的时间。 这使得跨用例扩展的成本过高,因为它需要大量的中小企业和数据专家。 通过摄取大量未标记数据并使用自监督技术进行模型训练,FM 消除了这些瓶颈,并为整个企业广泛采用人工智能开辟了道路。 每个企业中都存在大量数据,等待释放以推动洞察。
什么是大语言模型?
大型语言模型 (LLM) 是一类基础模型 (FM),由以下层组成: 神经网络 已经接受过这些大量未标记数据的培训。 他们使用自我监督学习算法来执行各种 自然语言处理(NLP) 任务的方式类似于人类使用语言的方式(见图 1)。
扩大并加速人工智能的影响
构建和部署基础模型 (FM) 有几个步骤。 其中包括数据摄取、数据选择、数据预处理、FM 预训练、针对一项或多项下游任务的模型调整、推理服务以及数据和 AI 模型治理和生命周期管理——所有这些都可以描述为 FMOP.
为了帮助实现这一切,IBM 正在为企业提供必要的工具和功能,以通过以下方式利用这些 FM 的强大功能: IBM沃森克斯,一个企业级人工智能和数据平台,旨在扩大人工智能对整个企业的影响。 IBM watsonx 由以下部分组成:
- IBM watsonx.ai 带来新的 生成式人工智能 将由 FM 和传统机器学习 (ML) 提供支持的功能集成到跨越 AI 生命周期的强大工作室中。
- IBM watsonx.data 是一个基于开放 Lakehouse 架构构建的专用数据存储,可随时随地扩展所有数据的 AI 工作负载。
- IBM watsonx.governance 是一个端到端自动化人工智能生命周期治理工具包,旨在实现负责任、透明和可解释的人工智能工作流程。
另一个关键因素是企业边缘计算的重要性日益增加,例如工业地点、制造车间、零售商店、电信边缘站点等。更具体地说,企业边缘的人工智能可以处理正在执行工作的数据。近实时分析。 企业边缘是生成大量企业数据的地方,也是人工智能可以提供有价值、及时且可操作的业务见解的地方。
在边缘提供人工智能模型服务可以实现近乎实时的预测,同时遵守数据主权和隐私要求。 这显着减少了通常与检测数据的采集、传输、转换和处理相关的延迟。 在边缘工作使我们能够保护敏感的企业数据并通过更快的响应时间降低数据传输成本。
然而,在数据(异构性、数量和监管)和有限资源(计算、网络连接、存储甚至 IT 技能)相关挑战中,扩展边缘人工智能部署并不是一件容易的事。 这些可以大致分为两类:
- 部署时间/成本: 每个部署都包含多层硬件和软件,需要在部署之前安装、配置和测试。 如今,专业服务人员可能需要长达一两周的时间才能完成安装 在每个位置 严重限制了企业在整个组织内扩展部署的速度和成本效益。
- 第二天管理: 部署的大量边缘和每个部署的地理位置通常会导致在每个位置提供本地 IT 支持来监控、维护和更新这些部署的成本过高。
边缘人工智能部署
IBM 开发了一种边缘架构,通过将集成硬件/软件 (HW/SW) 设备模型引入边缘 AI 部署来应对这些挑战。 它由几个有助于人工智能部署可扩展性的关键范例组成:
- 完整软件堆栈的基于策略的零接触配置。
- 持续监控边缘系统健康状况
- 能够管理软件/安全/配置更新并将其推送到众多边缘位置 - 所有这些都来自基于云的中央位置进行第二天管理。
分布式中心辐射架构可用于扩展边缘的企业人工智能部署,其中中央云或企业数据中心充当中心,边缘盒式设备充当边缘位置的辐射. 这种中心辐射模型跨混合云和边缘环境扩展,最好地说明了优化利用 FM 操作所需资源所需的平衡(见图 2)。
在大量未标记数据集上使用自监督技术对这些基础大型语言模型 (LLM) 和其他类型的基础模型进行预训练通常需要大量计算 (GPU) 资源,并且最好在中心执行。 几乎无限的计算资源和通常存储在云中的大量数据允许对大参数模型进行预训练,并不断提高这些基础模型的准确性。
另一方面,针对下游任务调整这些基础 FM(仅需要几十或数百个标记数据样本和推理服务)只需企业边缘的几个 GPU 即可完成。 这允许敏感的标记数据(或企业皇冠上的宝石数据)安全地保留在企业运营环境中,同时还降低了数据传输成本。
使用全栈方法将应用程序部署到边缘,数据科学家可以对模型进行微调、测试和部署。 这可以在单一环境中完成,同时缩短为最终用户提供新人工智能模型的开发生命周期。 红帽 OpenShift Data Science (RHODS) 和最近发布的红帽 OpenShift AI 等平台提供了快速开发和部署生产就绪型 AI 模型的工具。 分布式云 和边缘环境。
最后,在企业边缘为经过微调的人工智能模型提供服务,可显着减少通常与数据获取、传输、转换和处理相关的延迟。 将云中的预训练与边缘上的微调和推理分离,可以减少与任何推理任务相关的所需时间和数据移动成本,从而降低总体运营成本(见图 3)。
为了端到端地演示这一价值主张,对民用基础设施的基于视觉转换器的基础模型(使用公共和自定义行业特定数据集进行预训练)进行了微调并部署用于在三节点边缘上进行推理(发言)集群。 该软件堆栈包括红帽 OpenShift 容器平台和红帽 OpenShift 数据科学。 该边缘集群还连接到在云中运行的 Red Hat Advanced Cluster Management for Kubernetes (RHACM) 中心的实例。
零接触配置
基于策略的零接触配置是通过 Red Hat Advanced Cluster Management for Kubernetes (RHACM) 通过策略和放置标签完成的,这些标签将特定的边缘集群绑定到一组软件组件和配置。 这些软件组件扩展到整个堆栈并涵盖计算、存储、网络和 AI 工作负载,是使用各种 OpenShift 运算符安装的,提供必要的应用程序服务和 S3 Bucket(存储)。
民用基础设施的预训练基础模型 (FM) 通过红帽 OpenShift 数据科学 (RHODS) 中的 Jupyter Notebook 进行微调,使用标记数据对混凝土桥梁上发现的六种缺陷进行分类。 还使用 Triton 服务器演示了这种微调 FM 的推理服务。 此外,通过 Prometheus 将硬件和软件组件的可观测性指标聚合到云中的中央 RHACM 仪表板,可以监控该边缘系统的运行状况。 民用基础设施企业可以在其边缘位置部署这些 FM,并使用无人机图像近乎实时地检测缺陷,从而加快洞察速度并降低将大量高清数据移入和移出云的成本。
总结
结合 IBM沃森克斯 具有盒装边缘设备的基础模型 (FM) 的数据和 AI 平台功能允许企业运行 AI 工作负载,以在操作边缘进行 FM 微调和推理。 该设备可以立即处理复杂的用例,并构建了集中管理、自动化和自助服务的中心辐射框架。 边缘 FM 部署可以从几周缩短到几个小时,并具有可重复的成功、更高的弹性和安全性。
请务必查看本系列关于边缘计算的博客文章中的所有部分:
更多来自云
- :具有
- :是
- :不是
- :在哪里
- $UP
- 08
- 1
- 10
- 13
- 15%
- 20
- 2023
- 22
- 28
- 29
- 30
- 300
- 39
- 400
- 41
- 7
- 70
- 9
- a
- 关于
- 加快
- ACCESS
- 完成
- 获得
- 横过
- 行为
- 适应
- 另外
- 地址
- 地址
- 采用
- 高级
- 进步
- 广告
- AI
- 人工智能的采用
- AI模型
- 人工智能平台
- 援助
- 算法
- 所有类型
- 让
- 允许
- 还
- 中
- 量
- 量
- amp
- an
- 分析
- 分析
- 和
- 公布
- 任何
- 分析数据
- 应用领域
- 应用领域
- 的途径
- 架构
- 保健
- 排列
- 刊文
- 人造的
- 人工智能
- 人工智能(AI)
- AS
- 相关
- At
- 作者
- 自动化
- 自动化和干细胞工程
- 可使用
- 大街XNUMX号
- 背部
- 当前余额
- 银行
- 银行
- 基地
- BE
- 因为
- 成为
- 成为
- 很
- 开始
- 作为
- 相信
- 最佳
- 绑定
- 博客
- 博客文章
- 博客
- 都
- 盒子
- 桥梁
- 瞻
- 带来
- 广阔
- 宽广地
- 建筑物
- 建立
- 建
- 商业
- by
- CAN
- 能力
- 资本
- 捕获
- 碳
- 卡
- 牌
- 例
- 喵星人
- 类别
- 原因
- Center
- 中央
- 中央银行
- 中央银行数字货币
- 集中
- 链
- 挑战
- 更改
- 改变
- 查
- 选择
- 界
- CIS
- 民间
- 程
- 分类
- 清除
- 客户
- 密切
- 云端技术
- 簇
- 颜色
- 丰富多彩
- 结合
- 竞争的
- 复杂
- 复杂
- 符合
- 组件
- 计算
- 计算
- 配置
- 配置
- 已联繫
- 连接方式
- 由
- 容器
- 继续
- 控制
- 价格
- 成本
- 可以
- 覆盖
- cryptocurrency
- 的CSS
- 货币
- 习俗
- 顾客
- 客户体验
- 合作伙伴
- XNUMX月XNUMX日
- data
- 数据中心
- 数据平台
- 数据科学
- 数据科学家
- 数据集
- 日期
- 专用
- 默认
- 定义
- 交付
- 演示
- 证明
- 部署
- 部署
- 部署
- 部署
- 部署
- 描述
- 描述
- 设计
- 开发
- 发达
- 研发支持
- 数字
- 数字货币
- 数字化
- 瓦解
- 破坏性
- 干扰物
- 分布
- 区
- 域
- 域名
- 完成
- 驾驶
- 驾驶
- 无人驾驶飞机
- 每
- 易
- 生态系统
- 边缘
- 边缘计算
- ELEVATE
- 提高的
- enable
- 使
- 结束
- 端至端
- 工程师
- 工程师
- 输入
- 企业
- 企业
- 来
- 环境
- 环境中
- 时代
- 特别
- 等
- 醚(ETH)
- 甚至
- 事件
- 所有的
- 进化
- 检查
- 例子
- 执行
- 存在
- Exit 退出
- 昂贵
- 体验
- 专家
- 可解释的AI
- 说明
- 延长
- 非常
- 因素
- 高效率
- 快
- 少数
- 部分
- 数字
- 金融
- 金融机构
- 融资
- (名字)
- 地板
- 遵循
- 以下
- 字体
- 针对
- 第一线
- 发现
- 基金会
- 分数
- 骨架
- 止
- ,
- 全栈
- 此外
- 通常
- 产生
- 发电机
- 地域
- 地缘政治
- 给予
- 全球
- 全球交易
- 治理
- GPU
- 图形处理器
- 格
- 手
- 处理
- 硬件
- 帽子
- 有
- 健康管理
- 高度
- 帮助
- 帮助
- 帮助
- 高清
- 更高
- 高度
- 历史
- 主持人
- HOURS
- 创新中心
- How To
- 但是
- HTTPS
- 中心
- 人类
- 数百
- 杂交种
- 混合云
- IBM
- IBM Cloud
- 首次代币发行
- ICON
- 说明
- 图片
- 影响力故事
- 重要性
- 改进
- in
- 包括
- 包括
- 增加
- 日益
- 指数
- 产业
- 行业
- 行业中的应用:
- 行业特定
- 通货膨胀
- 拐点
- 拐点
- 影响
- 基础设施
- 倡议
- 創新
- 创新
- 输入
- 可行的洞见
- 例
- 机构
- 集成
- 房源搜索
- 固有
- 介绍
- IT
- IT支持
- 旅程
- JPG
- 跳
- Jupyter笔记本
- 只是
- 只有一个
- 不停
- 键
- Kubernetes
- 标签
- 语言
- 大
- 在很大程度上
- 潜伏
- 最新
- 层
- 领导
- 学习用品
- 学习
- 杠杆作用
- 生命周期
- 喜欢
- 无限
- Linux的
- 本地
- 当地
- 圖書分館的位置
- 地点
- 长
- 看
- 机
- 机器学习
- 制成
- 保持
- 使
- 制作
- 管理
- 颠覆性技术
- 制造业
- 许多
- 标记
- 大规模
- 主
- 问题
- 最大宽度
- 机制
- 方法
- 指标
- 分钟
- 最小化
- 分钟
- ML
- 联络号码
- 模型
- 模型
- 现代
- 现代化
- 现代化
- 显示器
- 监控
- 更多
- 运动
- 移动
- 姓名
- 旅游导航
- 近
- 必要
- 需求
- 打印车票
- 需要
- 网络
- 全新
- 下页
- NLP
- 笔记本
- 没什么
- 现在
- 数
- 众多
- of
- 提供
- 经常
- on
- 一
- 仅由
- 打开
- 打开
- 操作
- 运营
- 运营商
- 优化
- or
- 组织
- 其他名称
- 我们的
- 输出
- 最划算
- 包
- 页
- 参数
- 付款
- 支付方式
- 支付
- 演出
- 执行
- PHP
- 放置
- 平台
- 平台
- 柏拉图
- 柏拉图数据智能
- 柏拉图数据
- 插入
- 点
- 政策
- 政策
- 位置
- 可能
- 帖子
- 帖子
- 潜力
- 功率
- 强大
- 预测
- 先
- 隐私
- 私立
- 问题
- 处理
- 生产
- 所以专业
- 主张
- 提供
- 国家
- 推
- 范围
- 急速
- 阅读
- 实时的
- 最近
- 记录
- 了解
- 红色
- 红帽
- 减少
- 减少
- 减少
- 减少
- 法规
- 稳压器
- 监管
- 有关
- 去除
- 可重复的
- 要求
- 必须
- 岗位要求
- 必要条件
- 研究
- 资源
- 响应
- 提供品牌战略规划
- 响应
- 零售
- 上升
- 机器人
- 运行
- 运行
- 安然
- 同
- 可扩展性
- 鳞片
- 规模艾
- 缩放
- 科学
- 科学家
- 屏风
- 脚本
- 其次
- 安全
- 保安
- 看到
- 看到
- 选择
- 自助服务
- 敏感
- 搜索引擎优化
- 九月
- 系列
- 服务器
- 服务
- 特色服务
- 服务
- 会议
- 招生面试
- 集
- 几个
- Share
- 显示
- 显著
- 显著
- 类似
- 自
- 新加坡
- 单
- 单一环境
- 网站
- 网站
- SIX
- 技能
- 小
- EMS
- 中小企业
- 软件
- 软件组件
- 方案,
- 主权
- 太空
- 张力
- 具体的
- 特别是
- 赞助商
- 堆
- 开始
- 国家的最先进的
- 留
- 步骤
- 存储
- 商店
- 存储
- 商店
- 风暴
- 工作室
- 主题
- 成功
- 这样
- 提示
- 供应
- 供应链
- SUPPORT
- 肯定
- 系统
- 采取
- 拍摄
- 任务
- 任务
- 技术
- 专业技术
- 电信
- 坦密诺斯
- HAST
- Terraform
- 测试
- 测试
- 这
- 其
- 主题
- 那里。
- 博曼
- 他们
- Free Introduction
- 通过
- 次
- 及时
- 时
- 标题
- 至
- 今晚
- 一起
- 工具箱
- 工具
- 最佳
- 贸易
- 传统
- 培训
- 熟练
- 产品培训
- 转让
- 改造
- 转型
- 转换
- 透明
- 海卫一
- 二
- 类型
- 类型
- 释放
- 更新
- 最新动态
- 网址
- us
- 使用
- 用过的
- 用户
- 运用
- 利用
- 利用
- 有价值
- 折扣值
- 价值主张
- 各种
- 各个
- 广阔
- 通过
- 查看
- 实质上
- 体积
- 卷
- W
- 等候
- 钱包
- 是
- 波
- 方法..
- 方法
- we
- 周
- 周
- 什么是
- 什么是
- ,尤其是
- 这
- 而
- WHO
- 为什么
- 宽
- 大范围
- 中
- 女子
- WordPress
- 工作
- 工作流程
- 加工
- 将
- 书面
- 您一站式解决方案
- 和风网