总结
在这种开发人员代码模式中,我们将流式传输在线购物数据,并使用该数据来跟踪每个客户已添加到购物车的产品。 我们将使用scikit-learn建立k均值聚类模型,根据客户购物车的内容对其进行分组。 群集分配可用于预测要推荐的其他产品。
产品描述
我们的应用程序将在IBM CloudPak®for Data上使用IBM Streams构建。 IBM Streams提供了一个称为Streams Flows的内置IDE,它允许您直观地创建一个流应用程序。 IBM Cloud Pak for Data平台提供了额外的支持,例如与多个数据源集成,内置分析,Jupyter Notebook和机器学习。
为了构建和部署我们的机器学习模型,我们将使用IBMWatson®Studio中的Jupyter Notebook和Watson机器学习实例。 在我们的示例中,两者都在IBM Cloud Pak for Data上运行。
使用Streams Flows编辑器,我们将使用以下运算符创建一个流应用程序:
- 产生样本点击流数据的Source运算符
- 仅保留“添加到购物车”事件的Filter运算符
- 一个代码运算符,我们使用Python代码将购物车中的物品排列到一个输入数组中以进行评分
- WML部署操作员,将客户分配给集群
- 调试运算符以演示结果
自动化流程
- 用户构建和部署机器学习模型。
- 用户创建并运行IBM Streams应用程序。
- Streams Flow UI会显示实际的流式传输,过滤和评分。
说明
准备开始了吗? 的 读我 说明了以下步骤:
- 验证对Cloud Pak for Data上的IBM Streams实例的访问。
- 在Cloud Pak for Data中创建一个新项目。
- 建立并存储模型。
- 将部署空间与项目相关联。
- 部署模型。
- 创建并运行Streams Flow应用程序。
恭喜你! 此代码模式总结了 IBM Streams系列入门。 除了解释IBM Streams之外,我们还展示了如何:
- 在不编写代码的情况下创建您的第一个IBM Streams应用程序
- 构建一个Apache Kafka流媒体应用程序
- 使用Python API构建流式应用
- 使用机器学习模型对流数据进行评分
您现在应该对IBM Streams及其某些功能有基本的了解。 如果您想了解更多,请看一下 IBM Streams的流分析简介 视频系列。
来源:https://developer.ibm.com/patterns/score-streaming-data-with-a-machine-learning-model/