Meta 的新 Segment Anything 模型已揭晓。 SAM 模型是一种为图像分割创建高质量掩码的新方法。
提醒: 图像分割是计算机视觉中的一项基本任务,旨在将图像划分为对应于不同对象或语义类别的区域,并且具有许多应用,例如对象检测、场景理解、图像编辑和视频分析。
然而,图像分割也是一个具有挑战性的问题,尤其是在处理包含多个具有不同形状、大小和外观的对象的复杂场景时。 此外,大多数现有的图像分割方法需要大量的注释数据进行训练,获取这些数据既昂贵又费时。 Meta 想用 SAM 模型解决这个问题。
SAM 模型:什么是 Meta 的新 Segment Anything 模型?
Segment Anything Model (SAM) 是一种新的强大的人工智能模型,可以高质量和高效地分割图像或视频中的任何对象。 分割是将对象与其背景或其他对象分开并创建勾勒出其形状和边界的蒙版的过程。 使用 SAM 模型,您的编辑、合成、跟踪、识别和分析任务将变得更加容易。
SAM 在几个方面不同于其他细分模型,例如:
- SAM 是可提示的,这意味着它可以接受各种输入提示,例如点或框,以指定要分割的对象。 例如,您可以在人脸周围画一个框,然后 Segment Anything Model 将为该人脸生成一个遮罩。 您还可以给出多个提示以一次分割多个对象。 SAM 模型可以处理具有遮挡、反射和阴影的复杂场景。
- SAM 在包含 11 万张图像和 1.1 亿个掩码的海量数据集上进行训练,这是迄今为止最大的分割数据集。 该数据集涵盖了广泛的对象和类别,例如动物、植物、车辆、家具、食物等。 由于其泛化能力和数据多样性,SAM 可以分割它以前从未见过的对象。
- SAM 在各种分割任务上具有很强的零样本性能。 零样本意味着 SAM 可以在不对特定任务或领域进行任何额外训练或微调的情况下分割对象。 例如,SAM 可以在没有任何先验知识或监督的情况下分割人脸、手、头发、衣服和配饰。 SAM 还可以以不同的方式分割对象,例如红外图像或深度图。
SAM 模型在各种图像分割基准上取得了令人印象深刻的结果,例如 COCO。 SAM 在多个零样本分割任务(例如分割徽标、文本、人脸或草图)上也优于或匹配先前的完全监督方法。 它展示了它在不同领域和场景中的多功能性和稳健性。
在将来:Segment Anything Model(SAM 模型)项目仍处于早期阶段。 根据 Meta 的说法,这些是 Segment Anything 模型的一些未来应用:
- 未来的 AR 眼镜可能会使用 SAM 来识别普通物体并提供有用的提醒和指示。
- SAM 有能力影响许多其他领域,例如农业和生物学。 有一天,它甚至可能使农民和科学家受益。
SAM模型可以成为计算机视觉和人工智能研究的突破口。 它展示了视觉基础模型的潜力,这些模型可以从大规模数据中学习并转移到新的任务和领域。
Segment Anything 模型(SAM 模型)特征
以下是 SAM 模型的一些功能:
- 使用 SAM 模型,用户可以通过选择要包含或忽略的单个点来快速轻松地分割对象。 边界框也可以用作模型的提示。
- 当被分割的项目存在不确定性时,SAM 模型可以生成许多有效的掩码,这是解决现实世界中分割问题的一项至关重要的技能。
- 使用 Segment Anything Model,自动对象检测和屏蔽现在变得很简单。
- 在预先计算图像嵌入后,Segment Anything Model 可以立即为任何提示提供分割掩码,从而实现与模型的实时交互。
令人印象深刻,不是吗? 那么它背后的技术是什么?
SAM 模型如何运作?
NLP 和最近的计算机视觉领域最有趣的发现之一是使用“提示”方法来使用基础模型对新数据集和任务进行零样本和少样本学习。 Meta 在这个领域找到了动力。
如果给定前景/背景点、粗框或遮罩、自由格式文本或任何其他指示图像中要分割的内容的输入,Meta AI 团队会教 Segment Anything Model 生成适当的分割遮罩。 需要适当的掩码仅意味着输出应该是提示可能涉及的事物之一的适当掩码(例如,衬衫上的一个点可以代表衬衫或穿着它的人)。 此任务用于模型预训练并指导解决一般的下游分割问题。
Meta 注意到预训练任务和交互式数据收集对模型构建施加了一定的限制。 特别是,他们的注释者需要能够在浏览器中以交互方式、实时地在 CPU 上使用 Segment Anything Model 以使其有效。 尽管必须在质量和速度之间做出一些妥协才能满足运行时要求,但他们发现直接的方法可以产生令人满意的结果。
在后端,图像编码器为图像创建独特的嵌入,而轻量级编码器可以立即将任何查询转换为嵌入向量。 然后使用轻量级解码器合并这两个数据源,以预测分割掩码。 在计算出图像嵌入后,SAM 可以在大约 50 毫秒内用一个片段响应网络浏览器中的每个查询。
SAM 对于想要轻松灵活地编辑图像和视频的创意专业人士和爱好者来说是一个有用的工具。 但首先,您需要了解如何访问和使用它。
如何使用 Segment Anything 模型(SAM 模型)?
SAM 由 Meta AI Research(前身为 Facebook AI Research)开发,可在 GitHub上. 您还可以通过以下方式在线试用 SAM 演示 或下载 1 亿个掩模和 1 万张图像的数据集 (SA-11B)。 该模型非常易于使用; 只需按照以下步骤操作:
- 下载演示或转到 Segment Anything Model 演示。
- 上传图片或在图库中选择一张。
- 添加和主题领域
- 通过添加点来遮盖区域。 选择添加区域,然后选择对象。 通过选择“删除区域”来优化蒙版,然后选择该区域。
然后随心所欲地完成任务!
有关详细信息,单击 此处.
图片提供: 元
AI 101
你是人工智能的新手吗? 您仍然可以搭乘 AI 火车! 我们创建了一个详细的 人工智能词汇表 对于最常用的 人工智能术语 并解释 人工智能基础 以及 人工智能的风险和好处. 随意使用它们。 学习 如何使用人工智能 改变游戏规则! AI模型 将改变世界。
我们审查过的人工智能工具
几乎每天都有新的工具、模型或功能出现并改变我们的生活,比如新的 OpenAI ChatGPT 插件,我们已经回顾了一些最好的:
- 文本到文本的 AI 工具
你想学吗 如何有效使用 ChatGPT? 我们为您提供了一些提示和技巧,无需切换到 聊天 GPT Plus! 当你想使用 AI 工具时,你会得到类似“ChatGPT 现在满负荷运转” 和 “1 小时内请求过多,稍后再试”. 是的,它们确实是令人讨厌的错误,但别担心; 我们知道如何修复它们。 ChatGPT 剽窃是免费的吗? 这是一个很难找到单一答案的问题。 怕抄袭的可以放心使用 人工智能剽窃检查器。 另外,您可以检查其他 人工智能聊天机器人 和 人工智能论文作者 为了更好的结果。
- 文本到图像的 AI 工具
虽然还有一些 关于人工智能生成图像的争论, 人们仍在寻找 最好的人工智能艺术生成器. 人工智能会取代设计师吗? 继续阅读并找出答案。
- 其他人工智能工具
- SEO 支持的内容和 PR 分发。 今天得到放大。
- 柏拉图区块链。 Web3 元宇宙智能。 知识放大。 访问这里。
- Sumber: https://dataconomy.com/2023/04/sam-model-meta-segment-anything-model-mask/
- :是
- $UP
- 1
- 11
- a
- 对,能力--
- Able
- 关于
- ACCESS
- 配饰
- 根据
- 实现
- 横过
- 额外
- 影响
- 后
- 农业
- AI
- 人工智能艺术
- 研究
- AI供电
- 目标
- 算法
- 已经
- 量
- 量
- 分析
- 分析
- 和
- 动物
- 回答
- 预料
- 露面
- 应用领域
- 的途径
- 方法
- 适当
- AR
- AR眼镜
- 保健
- 国家 / 地区
- 地区
- 围绕
- 艺术
- 人造的
- 人工智能
- AS
- At
- 自动化
- 可使用
- 背部
- 背景
- BE
- before
- 背后
- 作为
- 基准
- 得益
- 好处
- 最佳
- 更好
- 之间
- 亿
- 生物学
- 边界
- 盒子
- 箱
- 突破
- 浏览器
- by
- 计算
- CAN
- 可以得到
- 能力
- 容量
- 类别
- 一定
- 挑战
- 更改
- 更改
- ChatGPT
- 查
- 点击
- 衣服
- 收藏
- 常用
- 完成
- 复杂
- 妥协
- 一台
- 计算机视觉
- 施工
- 可以
- 占地面积
- 中央处理器
- 创建信息图
- 创建
- 创建
- 创造
- 创意奖学金
- 危急
- 关键
- data
- 数据集
- 日期
- 天
- 一年中的
- 处理
- 交易
- 演示
- 演示
- 深度
- 尽管
- 详细
- 检测
- 发达
- 不同
- 通过各种方式找到
- 多元化
- 域
- 域名
- 别
- 下载
- 早
- 更容易
- 容易
- 编辑
- 有效
- 只
- 效率
- 努力
- 或
- enable
- 使
- 爱好者
- 环境中
- 故障
- 特别
- 文章
- 醚(ETH)
- 甚至
- 所有的
- 每天
- 例子
- 现有
- 存在
- 说明
- 面部彩妆
- 面孔
- 农民
- 专栏
- 特征
- 部分
- 字段
- 找到最适合您的地方
- 姓氏:
- 固定
- 高度灵活
- 遵循
- 食品
- 针对
- 以前
- 发现
- 基金会
- Free
- 止
- 充分
- 根本
- 未来
- 展示墙
- 游戏
- 赌博
- 生成
- 得到
- 给
- 特定
- 眼镜
- Go
- 指南
- 头发
- 处理
- 手
- 硬
- 有
- 帮助
- 有帮助
- 高
- 高品质
- 创新中心
- How To
- HTTPS
- 人
- 鉴定
- 图片
- 图像分割
- 图片
- 征收
- 有声有色
- in
- 包括
- 说明
- 个人
- 信息
- 输入
- 说明
- 房源搜索
- 相互作用
- 互动
- 问题
- IT
- 它的
- JPG
- 保持
- 知道
- 知识
- 大
- 大规模
- 最大
- 学习用品
- 学习
- 轻巧
- 喜欢
- 限制
- 生活
- 寻找
- 许多
- 地图
- 面膜
- 面膜
- 大规模
- 最大宽度
- 手段
- 满足
- 仅仅
- 合并
- 元
- 方法
- 可能
- 百万
- 模型
- 模型
- 更多
- 此外
- 最先进的
- 动机
- MS
- 多
- 需求
- 全新
- NLP
- 小说
- 对象
- 物体检测
- 对象
- 获得
- of
- on
- 一
- 在线
- 秩序
- 其他名称
- 大纲
- 性能优于
- 产量
- 特别
- 员工
- 性能
- 人
- 工厂
- 柏拉图
- 柏拉图数据智能
- 柏拉图数据
- 点
- 点
- 持久性有机污染物
- 潜力
- 强大
- 先
- 市场问题
- 问题
- 过程
- 生产
- 专业人士
- 项目
- 正确
- 提供
- 公然
- 目的
- 质量
- 题
- 很快
- 范围
- 阅读
- 真实
- 真实的世界
- 实时的
- 现实
- 最近
- 承认
- 承认
- 减少
- 提炼
- 思考
- 关于
- 地区
- 去掉
- 更换
- 代表
- 要求
- 要求
- 必须
- 需求
- 研究
- 回应
- 成果
- 揭密
- 审查
- 革命化
- 稳健性
- s
- Sam
- 情景
- 现场
- 场景
- 科学家
- 段
- 分割
- 选择
- 分离
- 几个
- 形状
- 形状
- 应该
- 简易
- 模拟
- 单
- 尺寸
- 技能
- So
- 方案,
- 解决
- 解决
- 一些
- 来源
- 具体的
- 速度
- 步骤
- 仍
- 简单的
- 强烈
- 主题
- 这样
- 监管
- 采取
- 任务
- 任务
- 团队
- 专业技术
- 这
- 区域
- 未来
- 画廊
- 世界
- 其
- 他们
- 博曼
- 事
- 耗时的
- 秘诀
- 技巧和窍门
- 至
- 工具
- 工具
- 跟踪
- 熟练
- 产品培训
- 转让
- 改造
- 不确定
- 理解
- 独特
- 使用
- 用户
- 利用
- 各种
- 各个
- 车辆
- 视频
- 视频
- 在线会议
- 愿景
- 方法..
- 方法
- 卷筒纸
- 网页浏览器
- 井
- 什么是
- 什么是
- 这
- 而
- WHO
- 宽
- 大范围
- 将
- 也完全不需要
- 工作
- 世界
- 您一站式解决方案
- 和风网