Оценка потоковых данных с помощью модели машинного обучения

Исходный узел: 747582

Это часть Путь обучения: начать работу с IBM Streams.

Обзор

В этом шаблоне кода разработчика мы будем передавать данные онлайн-покупок в потоковом режиме и использовать эти данные для отслеживания продуктов, которые каждый покупатель добавил в корзину. Мы построим модель кластеризации k-средних с помощью scikit-learn, чтобы группировать клиентов в соответствии с содержимым их тележек для покупок. Назначение кластера можно использовать для прогнозирования дополнительных рекомендуемых продуктов.

Описание

Наше приложение будет создано с использованием IBM Streams в IBM Cloud Pak® for Data. IBM Streams предоставляет встроенную среду IDE под названием Streams Flows, которая позволяет визуально создавать потоковые приложения. Платформа IBM Cloud Pak for Data обеспечивает дополнительную поддержку, такую ​​как интеграция с несколькими источниками данных, встроенная аналитика, Jupyter Notebooks и машинное обучение.

Для создания и развертывания нашей модели машинного обучения мы будем использовать Jupyter Notebook в IBM Watson® Studio и экземпляр Watson Machine Learning. В наших примерах оба работают в IBM Cloud Pak for Data.

Используя редактор Streams Flows, мы создадим потоковое приложение со следующими операторами:

  • Оператор источника, который генерирует образцы данных о посещаемости.
  • Оператор фильтра, который сохраняет только события «добавить в корзину».
  • Оператор кода, в котором мы используем код Python для упорядочивания элементов корзины покупок во входной массив для оценки.
  • Оператор развертывания WML для назначения клиента кластеру
  • Оператор отладки для демонстрации результатов

Поток

flow

  1. Пользователь создает и развертывает модель машинного обучения.
  2. Пользователь создает и запускает приложение IBM Streams.
  3. Пользовательский интерфейс Streams Flow показывает потоковую передачу, фильтрацию и оценку в действии.

инструкции

Готовы начать? В README объясняет шаги, чтобы:

  1. Проверьте доступ к своему экземпляру IBM Streams в Cloud Pak for Data.
  2. Создайте новый проект в Cloud Pak for Data.
  3. Постройте и сохраните модель.
  4. Свяжите пространство развертывания с проектом.
  5. Разверните модель.
  6. Создайте и запустите приложение Streams Flow.

Поздравляю! Этот шаблон кода завершает Начните работу с серией IBM Streams. Помимо объяснения IBM Streams, мы показали, как:

  • Создайте свое первое приложение IBM Streams без написания кода
  • Создайте приложение для потоковой передачи Apache Kafka
  • Создайте потоковое приложение с помощью Python API
  • Оценка потоковых данных с помощью модели машинного обучения

Теперь у вас должно быть фундаментальное понимание IBM Streams и некоторых его функций. Если вы хотите узнать больше, взгляните на Введение в потоковую аналитику с IBM Streams видеоряд.

Источник: https://developer.ibm.com/patterns/score-streaming-data-with-a-machine-learning-model/

Отметка времени:

Больше от Разработчик IBM