什么是数据产品以及它们为何重要? - 数据大学

什么是数据产品以及它们为何重要? – 数据大学

源节点: 3037494

数据产品是专业工具和应用程序形式的软件,旨在支持用作服务的数据。它们可能像将数据集转换为可视化的程序一样简单直接,也可能像基于大型语言模型 (LLM) 的机器学习系统一样复杂,例如 ChatGPT。所有数据产品的共同点是它们都是通过数据的应用来实现特定的目标。

该技术的一个可能令人困惑的方面是数据产品和“数据作为产品”,它将数据工具与策略相结合,以满足特定数据消费者(无论是个人还是整个部门或组织)的需求。相比之下,数据产品作为原材料,公司可以以独特的方式组合起来实施战略,以实现其短期和长期目标。他们在个人、团队、部门、企业和整个行业层面运作。

什么是 数据产品?

人工智能和其他新兴技术使组织能够以最大化数据价值的方式从其数据资产中收集见解。数据产品是企业将数据转化为提高效率、竞争力和盈利能力的行动的手段。美国前首席数据科学家 DJ Patil 创造了这个词 ”数据柔术” 2012 年被评为“将数据转化为产品的艺术”。 

通过数据元素的巧妙应用,数据柔术允许通过利用问题本身的“重量”来解决原本棘手的迭代数据问题,就像柔术选手试图利用对手的重量来为自己谋利,利用敌人的劣势一样。使用各种技术专长正面攻击问题的标准解决问题方法往往会使问题变得复杂并且更难以解决。

数据产品的目标是通过从一开始就解决一个简单的问题来简化问题的解决:谁想要或需要这个产品?为了快速回答这个问题,开发人员采取了一些捷径,这些捷径可能会到达最终版本,或者在流程后期被更复杂的方法所取代。关键是要从简单的开始,避免在项目开始时陷入困境。

数据产品的组成部分

即使是最简单的数据产品也由多种元素组成,这些元素结合起来支持决策和解决业务问题。这些是 八个关键部件 数据产品的:

  • 资料来源 必须可靠、可实时或批量访问、与要解决的问题相关,并符合数据保护法规,例如 《通用数据保护条例》(GDPR) 和 HIPAA,以及法律和道德标准。
  • 数据管道 自动执行任何所需的数据转换(ETL,例如),可扩展以适应不断增长的数据集,包括强大的错误处理工具和数据质量检查,并且采用模块化方式以支持配置更改。
  • 数据存储 必须满足性能要求,在不中断的情况下水平和垂直扩展,应用加密和访问控制,并且在支持结构化、半结构化和非结构化数据类型时具有成本效益。
  • 数据模型和算法 提供已使用交叉验证等技术进行验证的准确见解和预测。它们需要易于利益相关者理解、计算高效且易于维护。
  •  用户界面 应该足够直观,需要最少的用户培训。它应该利用可视化并促进用户与数据的交互,包括反馈机制和多设备支持。
  • API 和端点 需要安全的授权和身份验证、每个用户或系统的 API 调用数量限制以及足够的开发人员文档。它们应该支持数据格式,例如 JSON 和 XML 以确保兼容性。
  • 监控和记录 实时允许数据产品快速识别和解决问题。管理员会收到有关性能问题和错误的警报,审计跟踪可帮助公司满足合规性要求。要监控的性能指标包括延迟、吞吐量和错误率。
  • 配套文档 包括用户手册、技术规范、API 文档、变更日志和合规性记录。

数据产品示例

数据产品最流行的示例可能是 ChatGPT,基于人工智能的免费工具,以对话方式回答简单和复杂的问题,并与用户进行对话,允许提出后续问题,承认错误,并对不准确之处提出质疑。 ChatGPT 符合数据产品的资格,因为它依赖于 非常大的文本数据集,尽管该系统比典型的数据产品复杂得多。 

然而,在目前的状态下,ChatGPT 缺乏数据产品的一个重要方面:准确性。数据产品的所有者有责任确保提供积极的用户体验,并为该产品旨在帮助解决的问题提供可靠的解决方案。这需要产品管理方面的最佳实践,以及一致且可靠地访问支持业务决策的分析。

博曼 六大类数据产品 展示该技术在日常产品中的应用:

  • 推荐引擎 Amazon、Netflix 和 TripAdvisor 等公司提供个性化响应,以增强客户参与度并提高转化率。
  • 预测分析工具 包括 FICO、LinkedIn 和 Zillow 使用的技术,这些技术可识别数据趋势并根据先进的数据挖掘和建模技术生成预测。
  • 数据API 例如 Google 地图、LinkedIn 个人资料和 IO Weather 有助于不同系统之间数据的顺畅流动。常见格式有表述性状态传输 (REST)、简单对象访问协议 (SOAP)、XML-RPC 和 JSON-RPC。
  • 实时仪表板 直观地呈现数据,并在有新信息可用时自动更新用户的屏幕。它们用于监控库存、销售和运营数据以支持业务决策。 流行的仪表板 包括 Tableau、Microsoft BI 和 Zoho Analytics。
  • 个人财务 工具 包括 授权 (以前称为“个人资本”)、Quicken 和 You Need a Budget (YNAB),所有这些都试图让个人的财务规划更加清晰和自信。
  • 可穿戴健康监测产品 Apple Watch、FitBit 和 Dexcom 的连续血糖仪等产品不仅可以通过与医疗保健提供者共享信息来跟踪脉搏率、睡眠模式和其他健康问题。

为什么数据产品很重要

数据产品 使数据消费者受益 在几个方面:

  • 他们通过使用预构建的产品更快地获得见解,而不必从头开始每个项目。
  • 数据的完整性事先经过验证,因此产品中建立了信任。
  • 实时态势感知增强了数据分析的价值。
  • 实时响应的能力支持更快地做出明智的决策。
  • 预先保证可以促进治理 数据质量 和合规性。
  • 这些产品使数据可以轻松地从不同的系统中查找和访问。

组织将数据产品视为提高效率和盈利能力的关键:

  • 数据产品有助于增强公司对积极成果的关注。
  • 它们提高组织的敏捷性并逐步交付价值。
  • 数据产品的重用可以以很少的开销实现数据价值的最大化。
  • 数据产品的适应性使得数据架构能够面向未来。
  • 关于基础数据的可信度和完整性的问题更少。
  • 业务和IT部门使用相同的语言进行沟通。

也许数据产品对组织的最大好处是它们能够 释放数据的价值 作为将物理系统、数据建模、业务流程和用例粘合在一起的粘合剂。它们取代了许多公司在数据操作中采用的零碎方法,同时还分散了数据管理。这使得底层数据可以在不同的情况和条件下即时应用,只需最少的预处理或无需预处理。 

麦肯锡表示,数据产品允许新的业务用例 实施速度加快 90% 总拥有成本下降 30%。它们还可以降低风险以及治理运营所花费的时间和金钱。

实现数据产品承诺的好处需要采用 敏捷的数据管理方法 从小处开始,快速发布,迭代并展示产品的价值。在每个版本中添加更多功能,以逐步提高产品的价值,从而刺激采用并为新产品和用例增加投资。一旦数据产品与公司的日常业务流程集成,这些工具就会开始推销自己,因为它们的价值对用户和管理者来说变得显而易见。 

图片经 Shutterstock 许可使用

时间戳记:

更多来自 数据多样性