Assegna un punteggio ai dati in streaming con un modello di machine learning

Nodo di origine: 747582

Questo fa parte del Percorso di apprendimento: inizia con IBM Streams.

Sommario

In questo modello di codice sviluppatore, eseguiremo lo streaming dei dati sugli acquisti online e li utilizzeremo per tenere traccia dei prodotti che ciascun cliente ha aggiunto al carrello. Costruiremo un modello di clustering k-means con scikit-learn per raggruppare i clienti in base al contenuto dei loro carrelli della spesa. L'assegnazione del cluster può essere utilizzata per prevedere prodotti aggiuntivi da consigliare.

Descrizione

La nostra applicazione verrà creata utilizzando IBM Streams su IBM Cloud Pak® for Data. IBM Streams fornisce un IDE integrato, denominato Streams Flows, che consente di creare visivamente un'applicazione di streaming. La piattaforma IBM Cloud Pak for Data fornisce supporto aggiuntivo, come l'integrazione con più origini dati, analisi integrate, Jupyter Notebook e machine learning.

Per creare e distribuire il nostro modello di machine learning, utilizzeremo un Jupyter Notebook in IBM Watson® Studio e un'istanza di Watson Machine Learning. Nei nostri esempi, entrambi sono in esecuzione su IBM Cloud Pak for Data.

Utilizzando l'editor Streams Flows, creeremo un'app di streaming con i seguenti operatori:

  • Un operatore Source che genera dati clickstream di esempio
  • Un operatore Filter che mantiene solo gli eventi "aggiungi al carrello".
  • Un operatore di codice in cui usiamo il codice Python per organizzare gli articoli del carrello in un array di input per il punteggio
  • Un operatore di distribuzione WML per assegnare il cliente a un cluster
  • Un operatore Debug per dimostrare i risultati

Flow

flow

  1. L'utente crea e distribuisce un modello di machine learning.
  2. L'utente crea ed esegue un'applicazione IBM Streams.
  3. L'interfaccia utente di Streams Flow mostra lo streaming, i filtri e il punteggio in azione.

Istruzioni

Pronto per iniziare? Il README spiega i passaggi per:

  1. Verifica l'accesso alla tua istanza IBM Streams su Cloud Pak for Data.
  2. Crea un nuovo progetto in Cloud Pak for Data.
  3. Costruisci e memorizza un modello.
  4. Associa lo spazio di distribuzione al progetto.
  5. Distribuisci il modello.
  6. Crea ed esegui un'applicazione Streams Flow.

Congratulazioni! Questo modello di codice avvolge il file Inizia con la serie IBM Streams. Oltre a spiegare IBM Streams, abbiamo mostrato come:

  • Crea la tua prima app IBM Streams senza scrivere codice
  • Crea un'app di streaming Apache Kafka
  • Crea un'app di streaming utilizzando un'API Python
  • Assegna un punteggio ai dati in streaming con un modello di machine learning

Ora dovresti avere una conoscenza di base di IBM Streams e di alcune delle sue funzionalità. Se vuoi saperne di più, dai un'occhiata al Introduzione all'analisi dei flussi con IBM Streams serie di video.

Fonte: https://developer.ibm.com/patterns/score-streaming-data-with-a-machine-learning-model/

Timestamp:

Di più da Sviluppatore IBM