Estrai approfondimenti dai video

Nodo di origine: 747694

Sommario

In questo modello di codice, scopri come estrarre note diarizzate dal relatore e report approfonditi significativi utilizzando IBM® Watson™ Speech To Text, Watson Natural Language Processing e Watson Tone Analysis quando viene visualizzato un video.

Descrizione

In un mondo virtualmente connesso, rimanere concentrati sul lavoro o sull’istruzione è molto importante. Gli studi suggeriscono che molte persone perdono la concentrazione nelle riunioni virtuali dal vivo o nelle sessioni in aula virtuale dopo circa 20 minuti. Pertanto, molte riunioni e aule virtuali vengono registrate in modo che un individuo possa guardarle in seguito.

Potrebbe essere utile se queste registrazioni potessero essere analizzate e un rapporto dettagliato della riunione o della lezione fosse generato utilizzando l’intelligenza artificiale (AI). Questo modello di codice spiega come farlo. Data una registrazione video della riunione virtuale o dell'aula virtuale, spiega come estrarre l'audio da un file video utilizzando la libreria open source FFmpeg, trascrivere l'audio per ottenere note diarizzate dal relatore con linguaggio personalizzato e modelli di discorso acustico in testo, e generare un report sulla comprensione del linguaggio naturale composto da categoria, concetti, emozioni, entità, parole chiave, sentimento, frasi positive principali e nuvole di parole utilizzando un runtime Python Flask.

Dopo aver completato il modello di codice, capisci come:

  • Utilizza il servizio Watson Speech to Text per convertire la voce umana in parola scritta
  • Utilizza l'elaborazione avanzata del linguaggio naturale per analizzare il testo ed estrarre metadati da contenuti come concetti, entità, parole chiave, categorie, sentimento ed emozione
  • Sfrutta l'analisi linguistica cognitiva di Watson Tone Analyzer per identificare una varietà di toni sia a livello di frase che di documento

Flow

flow

  1. L'utente carica un file video registrato della riunione virtuale o dell'aula virtuale.
  2. La libreria FFmpeg estrae l'audio dal file video.
  3. Il servizio Watson Speech To Text trascrive l'audio per fornire un output testuale diarizzato.
  4. (Facoltativo) Il servizio Watson Language Translator traduce altre lingue in una trascrizione inglese.
  5. Watson Tone Analyser analizza la trascrizione e raccoglie le principali affermazioni positive dalla trascrizione.
  6. Watson Natural Language Understanding legge la trascrizione per identificare i punti chiave e cogliere sentimenti ed emozioni.
  7. I suggerimenti chiave e il riepilogo del video vengono presentati all'utente nell'applicazione.
  8. L'utente può scaricare gli approfondimenti testuali.

Istruzioni

Trova i passaggi dettagliati in README file. Questi passaggi spiegano come:

  1. Clonare il repository GitHub.
  2. Aggiungi le credenziali all'applicazione.
  3. Distribuire l'applicazione.
  4. Eseguire l'applicazione.

Questo modello di codice fa parte di Estrarre approfondimenti dai video con IBM Watson utilizzare una serie di casi, che mostra la soluzione sull'estrazione di approfondimenti significativi dai video utilizzando i servizi Watson Speech to Text, Watson Natural Language Processing e Watson Tone Analyzer.

Fonte: https://developer.ibm.com/patterns/extract-textual-insights-from-a-given-video/

Timestamp:

Di più da Sviluppatore IBM