Score Streaming Data With A Machine Learning Model

Переиздано Платоном

Читают: 0

Это часть Путь обучения: начать работу с IBM Streams.

Обзор

В этом шаблоне кода разработчика мы будем передавать данные онлайн-покупок в потоковом режиме и использовать эти данные для отслеживания продуктов, которые каждый покупатель добавил в корзину. Мы построим модель кластеризации k-средних с помощью scikit-learn, чтобы группировать клиентов в соответствии с содержимым их тележек для покупок. Назначение кластера можно использовать для прогнозирования дополнительных рекомендуемых продуктов.

Описание

Наше приложение будет создано с использованием IBM Streams в IBM Cloud Pak® for Data. IBM Streams предоставляет встроенную среду IDE под названием Streams Flows, которая позволяет визуально создавать потоковые приложения. Платформа IBM Cloud Pak for Data обеспечивает дополнительную поддержку, такую как интеграция с несколькими источниками данных, встроенная аналитика, Jupyter Notebooks и машинное обучение.

Для создания и развертывания нашей модели машинного обучения мы будем использовать Jupyter Notebook в IBM Watson® Studio и экземпляр Watson Machine Learning. В наших примерах оба работают в IBM Cloud Pak for Data.

Используя редактор Streams Flows, мы создадим потоковое приложение со следующими операторами:

Оператор источника, который генерирует образцы данных о посещаемости.
Оператор фильтра, который сохраняет только события «добавить в корзину».
Оператор кода, в котором мы используем код Python для упорядочивания элементов корзины покупок во входной массив для оценки.
Оператор развертывания WML для назначения клиента кластеру
Оператор отладки для демонстрации результатов

Поток

flow

Пользователь создает и развертывает модель машинного обучения.
Пользователь создает и запускает приложение IBM Streams.
Пользовательский интерфейс Streams Flow показывает потоковую передачу, фильтрацию и оценку в действии.

инструкции

Готовы начать? В README объясняет шаги, чтобы:

Проверьте доступ к своему экземпляру IBM Streams в Cloud Pak for Data.
Создайте новый проект в Cloud Pak for Data.
Постройте и сохраните модель.
Свяжите пространство развертывания с проектом.
Разверните модель.
Создайте и запустите приложение Streams Flow.

Поздравляю! Этот шаблон кода завершает Начните работу с серией IBM Streams. Помимо объяснения IBM Streams, мы показали, как:

Создайте свое первое приложение IBM Streams без написания кода
Создайте приложение для потоковой передачи Apache Kafka
Создайте потоковое приложение с помощью Python API
Оценка потоковых данных с помощью модели машинного обучения

Теперь у вас должно быть фундаментальное понимание IBM Streams и некоторых его функций. Если вы хотите узнать больше, взгляните на Введение в потоковую аналитику с IBM Streams видеоряд.

Источник: https://developer.ibm.com/patterns/score-streaming-data-with-a-machine-learning-model/

Отметка времени: 23 ноября 2020