Összegzésként
Ebben a kódmintában megtudhatja, hogyan bonthat ki felszólaló naplózott jegyzeteit és értelmes betekintési jelentéseket az IBM® Watson™ Speech To Text, a Watson Natural Language Processing és a Watson Tone Analysis segítségével, ha bármilyen videót kap.
Leírás
Egy gyakorlatilag összekapcsolt világban nagyon fontos, hogy a munkára vagy az oktatásra összpontosítsunk. A tanulmányok azt mutatják, hogy sokan körülbelül 20 perc elteltével elvesztik a figyelmüket élő virtuális találkozókon vagy virtuális tantermi foglalkozásokon. Ezért sok megbeszélést és virtuális tantermet rögzítenek, hogy az egyén később megnézhesse.
Segíthet, ha ezeket a felvételeket ki lehetne elemezni, és mesterséges intelligencia (AI) segítségével részletes jelentés készülne a találkozóról vagy osztályról. Ez a kódminta elmagyarázza, hogyan kell ezt megtenni. A virtuális értekezletről vagy a virtuális tanteremről készült videofelvétel elmagyarázza, hogyan lehet hangot kinyerni egy videofájlból az FFmpeg nyílt forráskódú könyvtár használatával, átírni a hangot, hogy a hangszórók által naplózott jegyzeteket testre szabott nyelvvel és akusztikus beszéddel szöveges modellekké alakíthassunk ki, és hozzon létre egy természetes nyelvértési jelentést, amely a kategóriából, fogalmakból, érzelmekből, entitásokból, kulcsszavakból, érzelmekből, legfontosabb pozitív mondatokból és szófelhőkből áll egy Python Flask futtatókörnyezet segítségével.
A kódminta kitöltése után megérti, hogyan kell:
- A Watson Speech to Text szolgáltatás segítségével az emberi hangot írott szóvá alakíthatja
- Használjon fejlett természetes nyelvi feldolgozást szövegelemzéshez és metaadatok kinyeréséhez olyan tartalmakból, mint például fogalmak, entitások, kulcsszavak, kategóriák, érzések és érzelmek
- Használja ki a Watson Tone Analyzer kognitív nyelvi elemzést a különböző hangnemek azonosításához mind a mondat, mind a dokumentum szintjén
Folyik
- A felhasználó feltölt egy rögzített videofájlt a virtuális értekezletről vagy a virtuális tanteremről.
- Az FFmpeg könyvtár kivonja a hangot a videofájlból.
- A Watson Speech To Text szolgáltatás átírja a hangot, hogy naplózott szöveges kimenetet adjon.
- (Opcionális) A Watson Language Translator szolgáltatás más nyelveket is lefordít angol átiratra.
- A Watson Tone Analyzer elemzi az átiratot, és kiemeli a legfontosabb pozitív állításokat az átiratból.
- A Watson Natural Language Understanding elolvassa az átiratot, hogy azonosítsa a kulcsfontosságú mutatókat, és megismerje az érzéseket és érzelmeket.
- A videó kulcsfontosságú mutatói és összefoglalása az alkalmazásban látható a felhasználó számára.
- A felhasználó letöltheti a szöveges betekintést.
Utasítás
A részletes lépéseket megtalálja a README fájlt. Ezek a lépések megmagyarázzák, hogyan:
- Klónozza a GitHub adattárat.
- Adja hozzá a hitelesítő adatokat az alkalmazáshoz.
- Telepítse az alkalmazást.
- Futtassa az alkalmazást.
Ez a kódminta része a Betekintések kinyerése videókból az IBM Watson segítségével használati esetsorozat, amely bemutatja a megoldást, hogyan nyerhet értelmes betekintést a videókból a Watson Speech to Text, Watson Natural Language Processing és Watson Tone Analyzer szolgáltatások segítségével.
Forrás: https://developer.ibm.com/patterns/extract-textual-insights-from-a-given-video/