从Apache Kafka接收数据

源节点: 747576

这是 学习路径:IBM Streams入门.

总结

在此开发人员代码模式中,我们将引导您创建由Apache Kafka支持的流应用程序的基础,Apache Kafka是最流行的开源分布式事件流平台之一,用于创建实时数据管道和流应用。 该应用程序将在IBM CloudPak®for Data上使用IBM Streams构建。

课程描述

在这种模式下,我们将带您创建基于Apache Kafka的流应用程序的基础知识。 我们的应用程序将使用IBM Cloud Pak for Data上的IBM Streams构建。 IBM Streams提供了内置的IDE(Streams Flows),使您可以直观地创建流媒体应用程序。 IBM Cloud Pak for Data平台提供了额外的支持,例如与多个数据源集成,内置分析,Jupyter Notebook和机器学习。

对于我们的Apache Kafka服务,我们将在IBM Cloud上使用IBM Event Streams,这是在Kafka平台上构建的高吞吐量消息总线。 在以下示例中,我们将其显示为Clickstream数据的源和目标,它们是用户浏览在线购物网站时从用户点击中捕获的数据。

自动化流程

flow

  1. 用户在IBM Streams中创建流应用程序。
  2. 流应用程序通过IBM Event Streams使用Kafka服务发送/接收消息。
  3. Jupyter笔记本是从IBM Streams应用程序生成的。
  4. 用户在Jupyter Notebook中执行流应用程序。
  5. Jupyter笔记本通过IBM Event Streams访问Kafka服务以发送/接收消息。

说明

准备开始了吗? 的 读我 说明了以下步骤:

  1. 克隆仓库
  2. IBM Cloud上的Provison事件流
  3. 创建示例Kafka控制台Python应用程序
  4. 将IBM Streams服务添加到Cloud Pak for Data
  5. 在Cloud Pak for Data中创建一个新项目
  6. 在Cloud Pak中为数据创建流流
  7. 以Kafka为源创建流
  8. 使用Streams Flow选项生成笔记本
  9. 运行生成的Streams Flow笔记本

此模式是 学习路径:IBM Streams入门。 要继续该系列并了解有关IBM Streams的更多信息,请查看标题为的代码模式。 使用Python API构建流式应用.

来源:https://developer.ibm.com/patterns/add-event-streams-and-a-db-in-python-to-clickstream/

时间戳记:

更多来自 IBM开发人员