Szerezzen betekintést a videókból

Forrás csomópont: 747694

Összegzésként

Ebben a kódmintában megtudhatja, hogyan bonthat ki felszólaló naplózott jegyzeteit és értelmes betekintési jelentéseket az IBM® Watson™ Speech To Text, a Watson Natural Language Processing és a Watson Tone Analysis segítségével, ha bármilyen videót kap.

Leírás

Egy gyakorlatilag összekapcsolt világban nagyon fontos, hogy a munkára vagy az oktatásra összpontosítsunk. A tanulmányok azt mutatják, hogy sokan körülbelül 20 perc elteltével elvesztik a figyelmüket élő virtuális találkozókon vagy virtuális tantermi foglalkozásokon. Ezért sok megbeszélést és virtuális tantermet rögzítenek, hogy az egyén később megnézhesse.

Segíthet, ha ezeket a felvételeket ki lehetne elemezni, és mesterséges intelligencia (AI) segítségével részletes jelentés készülne a találkozóról vagy osztályról. Ez a kódminta elmagyarázza, hogyan kell ezt megtenni. A virtuális értekezletről vagy a virtuális tanteremről készült videofelvétel elmagyarázza, hogyan lehet hangot kinyerni egy videofájlból az FFmpeg nyílt forráskódú könyvtár használatával, átírni a hangot, hogy a hangszórók által naplózott jegyzeteket testre szabott nyelvvel és akusztikus beszéddel szöveges modellekké alakíthassunk ki, és hozzon létre egy természetes nyelvértési jelentést, amely a kategóriából, fogalmakból, érzelmekből, entitásokból, kulcsszavakból, érzelmekből, legfontosabb pozitív mondatokból és szófelhőkből áll egy Python Flask futtatókörnyezet segítségével.

A kódminta kitöltése után megérti, hogyan kell:

  • A Watson Speech to Text szolgáltatás segítségével az emberi hangot írott szóvá alakíthatja
  • Használjon fejlett természetes nyelvi feldolgozást szövegelemzéshez és metaadatok kinyeréséhez olyan tartalmakból, mint például fogalmak, entitások, kulcsszavak, kategóriák, érzések és érzelmek
  • Használja ki a Watson Tone Analyzer kognitív nyelvi elemzést a különböző hangnemek azonosításához mind a mondat, mind a dokumentum szintjén

Folyik

flow

  1. A felhasználó feltölt egy rögzített videofájlt a virtuális értekezletről vagy a virtuális tanteremről.
  2. Az FFmpeg könyvtár kivonja a hangot a videofájlból.
  3. A Watson Speech To Text szolgáltatás átírja a hangot, hogy naplózott szöveges kimenetet adjon.
  4. (Opcionális) A Watson Language Translator szolgáltatás más nyelveket is lefordít angol átiratra.
  5. A Watson Tone Analyzer elemzi az átiratot, és kiemeli a legfontosabb pozitív állításokat az átiratból.
  6. A Watson Natural Language Understanding elolvassa az átiratot, hogy azonosítsa a kulcsfontosságú mutatókat, és megismerje az érzéseket és érzelmeket.
  7. A videó kulcsfontosságú mutatói és összefoglalása az alkalmazásban látható a felhasználó számára.
  8. A felhasználó letöltheti a szöveges betekintést.

Utasítás

A részletes lépéseket megtalálja a README fájlt. Ezek a lépések megmagyarázzák, hogyan:

  1. Klónozza a GitHub adattárat.
  2. Adja hozzá a hitelesítő adatokat az alkalmazáshoz.
  3. Telepítse az alkalmazást.
  4. Futtassa az alkalmazást.

Ez a kódminta része a Betekintések kinyerése videókból az IBM Watson segítségével használati esetsorozat, amely bemutatja a megoldást, hogyan nyerhet értelmes betekintést a videókból a Watson Speech to Text, Watson Natural Language Processing és Watson Tone Analyzer szolgáltatások segítségével.

Forrás: https://developer.ibm.com/patterns/extract-textual-insights-from-a-given-video/

Időbélyeg:

Még több IBM fejlesztő