Extract Insights From Videos - Plato AiStream V2.1

Neuauflage von Plato

Verfolger: 0

Zusammenfassung

In diesem Codemuster erfahren Sie, wie Sie mit IBM® Watson ™ Speech To Text, Watson Natural Language Processing und Watson Tone Analysis sprecherdiierte Notizen und aussagekräftige Insights-Berichte extrahieren, wenn Sie ein Video erhalten.

Beschreibung

In einer praktisch vernetzten Welt ist es sehr wichtig, sich auf Arbeit oder Bildung zu konzentrieren. Studien deuten darauf hin, dass viele Menschen nach etwa 20 Minuten ihren Fokus in virtuellen Live-Meetings oder virtuellen Klassenzimmersitzungen verlieren. Daher werden viele Besprechungen und virtuelle Klassenzimmer aufgezeichnet, damit eine Person sie später ansehen kann.

Es könnte hilfreich sein, wenn diese Aufzeichnungen analysiert werden könnten und mithilfe künstlicher Intelligenz (KI) ein detaillierter Bericht über das Meeting oder die Klasse erstellt wird. Dieses Codemuster erklärt, wie das geht. Anhand einer Videoaufzeichnung des virtuellen Meetings oder des virtuellen Klassenzimmers wird erläutert, wie Sie mithilfe der FFmpeg-Open-Source-Bibliothek Audio aus einer Videodatei extrahieren, das Audio transkribieren, um mit Sprechern versehene Notizen mit speziell trainierter Sprache und akustischer Sprache in Textmodelle zu erhalten. Erstellen Sie mithilfe einer Python Flask-Laufzeit einen Bericht zum Verständnis der natürlichen Sprache, der aus Kategorie, Konzepten, Emotionen, Entitäten, Schlüsselwörtern, Gefühlen, positiven Top-Sätzen und Wortwolken besteht.

Nachdem Sie das Codemuster ausgefüllt haben, wissen Sie, wie Sie:

Verwenden Sie den Watson Speech to Text-Dienst, um die menschliche Stimme in das geschriebene Wort umzuwandeln
Verwenden Sie die erweiterte Verarbeitung natürlicher Sprache, um Text zu analysieren und Metadaten aus Inhalten wie Konzepten, Entitäten, Schlüsselwörtern, Kategorien, Stimmungen und Emotionen zu extrahieren
Nutzen Sie die kognitive Sprachanalyse von Watson Tone Analyzer, um eine Vielzahl von Tönen sowohl auf Satz- als auch auf Dokumentebene zu identifizieren

Flow

flow

Der Benutzer lädt eine aufgezeichnete Videodatei des virtuellen Meetings oder des virtuellen Klassenzimmers hoch.
Die FFmpeg-Bibliothek extrahiert Audio aus der Videodatei.
Der Watson Speech To Text-Dienst transkribiert das Audio, um eine diarisierte Textausgabe zu erhalten.
(Optional) Der Watson Language Translator-Dienst übersetzt andere Sprachen in ein englisches Transkript.
Watson Tone Analyzer analysiert das Transkript und nimmt die positivsten Aussagen aus dem Transkript auf.
Watson Natural Language Understanding liest das Transkript, um wichtige Hinweise zu identifizieren und die Gefühle und Emotionen zu erfassen.
Die wichtigsten Hinweise und die Zusammenfassung des Videos werden dem Benutzer in der Anwendung angezeigt.
Der Benutzer kann die Texterkenntnisse herunterladen.

Anweisungen

Die detaillierten Schritte finden Sie in der README Datei. Diese Schritte erklären, wie man:

Klonen Sie das GitHub-Repository.
Fügen Sie der Anwendung die Anmeldeinformationen hinzu.
Stellen Sie die Anwendung bereit.
Führen Sie die Anwendung.

Dieses Codemuster ist Teil des Extrahieren von Erkenntnissen aus Videos mit IBM Watson Anwendungsfallreihen, in denen die Lösung zum Extrahieren aussagekräftiger Erkenntnisse aus Videos mithilfe der Dienste Watson Speech to Text, Watson Natural Language Processing und Watson Tone Analyzer vorgestellt wird.

Quelle: https://developer.ibm.com/patterns/extract-textual-insights-from-a-given-video/

Zeitstempel: 4. November 2020

Mehr von IBM Entwickler

Bereitstellen und Verwenden einer Multi-Framework-Deep-Learning-Plattform auf Kubernetes

Quellcluster:

IBM Entwickler

Quellknoten: 1580762

Zeitstempel: 27. März 2019

Analysieren Sie Modelle zur Vorhersage von KI-Betrug

Quellcluster:

Quellcluster:

IBM Entwickler

Quellknoten: 1573053

Zeitstempel: 19. August 2019

Extrahieren Sie Erkenntnisse aus Videos

Neuauflage von Plato

Zusammenfassung

Beschreibung

Flow

Anweisungen

Mehr von IBM Entwickler

Bereitstellen und Verwenden einer Multi-Framework-Deep-Learning-Plattform auf Kubernetes

Analysieren Sie Modelle zur Vorhersage von KI-Betrug

Erstellen Sie eine Web-App zur visuellen Interaktion mit mithilfe von maschinellem Lernen erkannten Objekten

Suchen und zählen Sie Elemente mit Objekterkennung

Verwenden Sie erweiterte Verarbeitung natürlicher Sprache und Tonanalyse, um aussagekräftige Erkenntnisse zu gewinnen

Prognostizieren Sie ein Ereignis mit Fairness, Erklärbarkeit und Robustheit

Eine Python Flask-Audiosuchanwendung

Erstellen Sie einen Assistenten zur Bewertung verschiedener Krankenversicherungspolicen

Erstellen Sie mit der Watson Assistant Phone Integration ein Callcenter der nächsten Generation

Objektverfolgung in Video mit OpenCV und Deep Learning

Stellen Sie einen Chatbot-Dialog zum Bestellen von Pizza zusammen

Über uns

Vertikale Suche & Ai

Plattform

Bleiben Sie in Verbindung

Konto