वीडियो से अंतर्दृष्टि निकालें

स्रोत नोड: 747694

सारांश

इस कोड पैटर्न में, आईबीएम® वाटसन™ स्पीच टू टेक्स्ट, वाटसन नेचुरल लैंग्वेज प्रोसेसिंग और वाटसन टोन विश्लेषण का उपयोग करके स्पीकर डायराइज्ड नोट्स और सार्थक अंतर्दृष्टि रिपोर्ट निकालने का तरीका जानें।

Description

वस्तुतः जुड़ी हुई दुनिया में, काम या शिक्षा पर ध्यान केंद्रित रहना बहुत महत्वपूर्ण है। अध्ययनों से पता चलता है कि बहुत से लोग लगभग 20 मिनट के बाद लाइव वर्चुअल मीटिंग या वर्चुअल क्लासरूम सत्र में अपना ध्यान खो देते हैं। इसलिए, कई मीटिंग और वर्चुअल क्लासरूम रिकॉर्ड किए जाते हैं ताकि एक व्यक्ति इसे बाद में देख सके।

यह मदद कर सकता है अगर इन रिकॉर्डिंग का विश्लेषण किया जा सकता है, और कृत्रिम बुद्धि (एआई) का उपयोग करके बैठक या कक्षा की विस्तृत रिपोर्ट तैयार की जाती है। यह कोड पैटर्न बताता है कि यह कैसे करना है। वर्चुअल मीटिंग या वर्चुअल क्लासरूम की वीडियो रिकॉर्डिंग को देखते हुए, यह बताता है कि FFmpeg ओपन सोर्स लाइब्रेरी का उपयोग करके वीडियो फ़ाइल से ऑडियो कैसे निकाला जाए, कस्टम-प्रशिक्षित भाषा के साथ स्पीकर-डायराइज़्ड नोट्स प्राप्त करने के लिए ऑडियो को ट्रांसक्रिप्ट करें और टेक्स्ट मॉडल के लिए ध्वनिक भाषण, और एक प्राकृतिक भाषा समझ रिपोर्ट तैयार करें जिसमें पायथन फ्लास्क रनटाइम का उपयोग करके श्रेणी, अवधारणाएं, भावना, संस्थाएं, कीवर्ड, भावना, शीर्ष सकारात्मक वाक्य और शब्द बादल शामिल हों।

कोड पैटर्न को पूरा करने के बाद, आप समझते हैं:

  • मानव आवाज को लिखित शब्द में बदलने के लिए वाटसन स्पीच टू टेक्स्ट सेवा का उपयोग करें
  • पाठ का विश्लेषण करने के लिए उन्नत प्राकृतिक भाषा प्रसंस्करण का उपयोग करें और अवधारणाओं, संस्थाओं, कीवर्ड, श्रेणियों, भावना और भावना जैसी सामग्री से मेटाडेटा निकालें।
  • उत्तोलन वाटसन टोन एनालाइज़र संज्ञानात्मक भाषाई विश्लेषण दोनों वाक्य और दस्तावेज़ स्तर पर विभिन्न प्रकार के टन की पहचान करने के लिए

फ्लो

flow

  1. उपयोगकर्ता वर्चुअल मीटिंग या वर्चुअल क्लासरूम की रिकॉर्डेड वीडियो फ़ाइल अपलोड करता है।
  2. FFmpeg लाइब्रेरी वीडियो फ़ाइल से ऑडियो निकालती है।
  3. वाटसन स्पीच टू टेक्स्ट सर्विस ऑडियो को एक डायराइज्ड टेक्स्टुअल आउटपुट देने के लिए ट्रांसक्रिप्ट करती है।
  4. (वैकल्पिक रूप से) वाटसन भाषा अनुवादक सेवा अन्य भाषाओं का अंग्रेजी प्रतिलेख में अनुवाद करती है।
  5. वाटसन टोन विश्लेषक प्रतिलेख का विश्लेषण करता है और प्रतिलेख से शीर्ष सकारात्मक बयानों को उठाता है।
  6. वाटसन नेचुरल लैंग्वेज अंडरस्टैंडिंग मुख्य बिंदुओं की पहचान करने और भावनाओं और भावनाओं को प्राप्त करने के लिए प्रतिलेख पढ़ता है।
  7. वीडियो के मुख्य संकेत और सारांश एप्लिकेशन में उपयोगकर्ता को प्रस्तुत किए जाते हैं।
  8. उपयोगकर्ता पाठ्य अंतर्दृष्टि डाउनलोड कर सकता है।

अनुदेश

में विस्तृत चरणों का पता लगाएं README फ़ाइल। वे चरण बताते हैं:

  1. GitHub रिपॉजिटरी को क्लोन करें।
  2. आवेदन में क्रेडेंशियल्स जोड़ें।
  3. आवेदन तैनात करें।
  4. एप्लिकेशन चलाएँ।

यह कोड पैटर्न का हिस्सा है आईबीएम वाटसन के साथ वीडियो से अंतर्दृष्टि निकालना केस सीरीज़ का उपयोग करें, जो वॉटसन स्पीच से टेक्स्ट, वॉटसन नेचुरल लैंग्वेज प्रोसेसिंग, और वॉटसन टोन एनालाइज़र सेवाओं का उपयोग करके वीडियो से सार्थक अंतर्दृष्टि निकालने पर समाधान दिखाता है।

स्रोत: https://developer.ibm.com/patterns/extract-textual-insights-from-a-given-video/

समय टिकट:

से अधिक आईबीएम डेवलपर