->
छवि: ड्रीमस्टूडियो.एआई के माध्यम से मार्क हैचमैन/आईडीजी
टॉम हैंक्स ने मुझे सिर्फ एक भूमिका के लिए ही नहीं बुलाया था, बल्कि यह निश्चित रूप से ऐसा लगता है।
जब से पीसीवर्ल्ड ने इसके उत्थान को कवर करना शुरू किया एआई कला जैसे विभिन्न एआई अनुप्रयोग, मैं GitHub में कोड रिपॉजिटरी और Reddit के लिंक में इधर-उधर ताक-झांक कर रहा हूं, जहां लोग विभिन्न दृष्टिकोणों के लिए अपने स्वयं के AI मॉडल में बदलाव पोस्ट करेंगे।
इनमें से कुछ मॉडल वास्तव में वाणिज्यिक साइटों पर समाप्त होते हैं, जो या तो अपने स्वयं के एल्गोरिदम को रोल करते हैं या खुले स्रोत के रूप में प्रकाशित दूसरों को अनुकूलित करते हैं। मौजूदा AI ऑडियो साइट का एक बेहतरीन उदाहरण है Uberduck.ai, जो वस्तुतः सैकड़ों प्रीप्रोग्राम्ड मॉडल पेश करता है। टेक्स्ट फ़ील्ड में टेक्स्ट दर्ज करें और आप वर्चुअल एलोन मस्क, बिल गेट्स, पैगी हिल, डैफ़ी डक, एलेक्स ट्रेबेक, बीविस, द जोकर या यहां तक कि सिरी से आपकी पूर्व-प्रोग्राम की गई पंक्तियों को पढ़ सकते हैं।
हमने पिछले साल पीसीवर्ल्ड की प्रशंसा करते हुए एक नकली बिल क्लिंटन अपलोड किया था और मॉडल पहले से ही बहुत अच्छा लग रहा है।
भाषण को पुन: प्रस्तुत करने के लिए एआई को प्रशिक्षित करने में स्पष्ट आवाज के नमूने अपलोड करना शामिल है। एआई "सीखता है" कि वक्ता उन रिश्तों को सीखने, उन्हें बेहतर बनाने और परिणामों की नकल करने के लिए लक्ष्य के साथ ध्वनियों को कैसे जोड़ता है। यदि आप 1992 की उत्कृष्ट थ्रिलर से परिचित हैं स्नीकर्स (रॉबर्ट रेडफोर्ड, सिडनी पोइटियर और बेन किंग्सले सहित अन्य कलाकारों के साथ), तो आप उस दृश्य के बारे में जानते हैं जिसमें पात्रों को लक्ष्य की आवाज का एक आवाज नमूना रिकॉर्ड करके बायोमेट्रिक वॉयस पासवर्ड को "क्रैक" करने की आवश्यकता होती है। . यह लगभग वैसी ही बात है.
आम तौर पर, एक अच्छे वॉयस मॉडल को असेंबल करने के लिए काफी प्रशिक्षण की आवश्यकता होती है, जिसमें लंबे नमूने यह दर्शाते हैं कि कोई व्यक्ति कैसे बोलता है। हालाँकि, पिछले कुछ दिनों में, कुछ नया सामने आया है: माइक्रोसॉफ्ट वॉल-ई, एक शोध पत्र (सजीव उदाहरणों के साथ) एक संश्लेषित आवाज जिसे पूरी तरह से प्रोग्राम करने योग्य आवाज उत्पन्न करने के लिए केवल कुछ सेकंड के स्रोत ऑडियो की आवश्यकता होती है।
स्वाभाविक रूप से, एआई शोधकर्ता और अन्य एआई समूह जानना चाहते थे कि क्या वॉल-ई मॉडल अभी तक जनता के लिए जारी किया गया है। उत्तर नहीं है, हालाँकि आप चाहें तो किसी अन्य मॉडल के साथ खेल सकते हैं, जिसे कछुआ कहा जाता है। (लेखक का कहना है कि इसे कछुआ कहा जाता है क्योंकि यह धीमा है, जो कि है, लेकिन यह काम करता है।)
कछुए के साथ अपनी खुद की एआई आवाज़ को प्रशिक्षित करें
जो बात कछुए को दिलचस्प बनाती है वह यह है कि आप बस कुछ ऑडियो क्लिप अपलोड करके मॉडल को अपनी पसंद की किसी भी आवाज पर प्रशिक्षित कर सकते हैं। कछुआ GitHub पृष्ठ ध्यान दें कि आपके पास लगभग एक दर्जन सेकंड की कुछ क्लिप होनी चाहिए। आपको उन्हें एक विशिष्ट गुणवत्ता के साथ .WAV फ़ाइल के रूप में सहेजना होगा।
यह कैसे काम करता है? एक सार्वजनिक उपयोगिता के माध्यम से जिसके बारे में आप नहीं जानते होंगे: गूगल कोलाब. अनिवार्य रूप से, Collab एक क्लाउड सेवा है जो Google प्रदान करता है जो Python सर्वर तक पहुंच की अनुमति देता है। जो कोड आप (या कोई और) लिखते हैं उसे एक नोटबुक के रूप में संग्रहीत किया जा सकता है, जिसे उन उपयोगकर्ताओं के साथ साझा किया जा सकता है जिनके पास सामान्य Google खाता है। कछुआ साझा संसाधन यहाँ है.
इंटरफ़ेस डराने वाला लगता है, लेकिन यह उतना बुरा नहीं है। आपको Google उपयोगकर्ता के रूप में लॉग इन करना होगा और फिर ऊपरी दाएं कोने में "कनेक्ट" पर क्लिक करना होगा। खतरे के संकेत के लिए एक शब्द ही काफी है। हालाँकि यह Colab आपके Google Drive पर कुछ भी डाउनलोड नहीं करता है, अन्य Colab हो सकता है। (हालाँकि, इससे उत्पन्न होने वाली ऑडियो फ़ाइलें ब्राउज़र में संग्रहीत होती हैं लेकिन आपके पीसी पर डाउनलोड की जा सकती हैं।) सावधान रहें कि आप वह कोड चला रहे हैं जो किसी और ने लिखा है। आपको या तो खराब इनपुट के कारण या Google के पास उपलब्ध GPU न होने जैसी पिछली समस्या के कारण त्रुटि संदेश प्राप्त हो सकते हैं। यह सब थोड़ा प्रयोगात्मक है.
कोड के प्रत्येक ब्लॉक में एक छोटा "प्ले" आइकन होता है जो तब दिखाई देता है जब आप उस पर अपना माउस घुमाते हैं। इसे चलाने के लिए आपको कोड के प्रत्येक ब्लॉक पर "प्ले" पर क्लिक करना होगा, अगला ब्लॉक चलाने से पहले प्रत्येक ब्लॉक के निष्पादित होने की प्रतीक्षा करनी होगी।
हालाँकि हम सभी सुविधाओं पर विस्तृत निर्देश नहीं दे रहे हैं, बस इस बात से अवगत रहें कि लाल पाठ उपयोगकर्ता द्वारा संशोधित किया जा सकता है, जैसे कि सुझाया गया पाठ जिसे आप मॉडल से बोलना चाहते हैं। लगभग सात ब्लॉक नीचे, आपके पास मॉडल को प्रशिक्षित करने का विकल्प होगा। आपको मॉडल को नाम देना होगा, फिर ऑडियो फ़ाइलें अपलोड करनी होंगी। जब यह पूरा हो जाए, तो चौथे ब्लॉक में नया ऑडियो मॉडल चुनें, कोड चलाएं, फिर तीसरे ब्लॉक में टेक्स्ट को कॉन्फ़िगर करें। दौड़ना कि कोड ब्लॉक।
यदि सब कुछ योजना के अनुसार हुआ, तो आपके पास अपनी नमूना आवाज का एक छोटा ऑडियो आउटपुट होगा। क्या यह काम करता है? खैर, मैंने अपने सहकर्मी गॉर्डन माह उंग का एक त्वरित और गंदा आवाज मॉडल बनाया, जिसका काम हमारे यहां दिखाई देता है फुल नर्ड पॉडकास्ट साथ ही विभिन्न वीडियो भी। मैंने छोटे स्निपेट के बजाय कई मिनट का नमूना अपलोड किया, यह देखने के लिए कि क्या यह काम करेगा।
परिणाम? असल में वह लगता है जीवंत, लेकिन गॉर्डन जैसा बिल्कुल नहीं। वह फिलहाल डिजिटल प्रतिरूपण से निश्चित रूप से सुरक्षित है। (यह किसी फास्ट-फूड श्रृंखला का समर्थन भी नहीं है।)
लेकिन एक मौजूदा मॉडल जिसे टोर्टोइज़ लेखक ने अभिनेता टॉम हैंक्स पर प्रशिक्षित किया है, बहुत अच्छा लगता है। मैं यहाँ टॉम हैंक्स नहीं बोल रहा हूँ! टॉम ने भी किया नहीं मुझे नौकरी की पेशकश करो, लेकिन यह कम से कम मेरे एक दोस्त को बेवकूफ बनाने के लिए काफी था।
निष्कर्ष? यह थोड़ा डरावना है: हम जो सुनते हैं (और जल्द ही देखते हैं) उस पर विश्वास करने का युग समाप्त हो रहा है। या यह पहले से ही है.
कूपन कोड
- एसईओ संचालित सामग्री और पीआर वितरण। आज ही प्रवर्धित हो जाओ।
- प्लेटोब्लॉकचैन। Web3 मेटावर्स इंटेलिजेंस। ज्ञान प्रवर्धित। यहां पहुंचें।
- स्रोत: https://www.pcworld.com/article/1473072/tom-hanks-did-not-offer-me-a-job-but-ai-sounds-like-it.html
- 1
- 2023
- 39
- a
- About
- पहुँच
- लेखा
- वास्तव में
- अनुकूलन
- AI
- एलेक्स
- एल्गोरिदम
- सब
- की अनुमति देता है
- पहले ही
- के बीच में
- amp
- और
- अन्य
- जवाब
- अनुप्रयोगों
- दृष्टिकोण
- चारों ओर
- लेख
- कृत्रिम
- ऑडियो
- लेखक
- उपलब्ध
- वापस
- बुरा
- क्योंकि
- से पहले
- शुरू किया
- विश्वास
- बिल
- बिल क्लिंटन
- बिल गेट्स
- बायोमेट्रिक
- बिट
- खंड
- ब्लॉक
- ब्राउज़र
- बटन
- कॉल
- बुलाया
- कार्ड
- वर्ग
- निश्चित रूप से
- श्रृंखला
- अक्षर
- टुकड़ा
- चुनें
- स्पष्ट
- क्लिप
- बादल
- कोड
- सहयोगी
- जोड़ती
- टिप्पणियाँ
- वाणिज्यिक
- पूरा करता है
- निष्कर्ष
- नियंत्रण
- कोना
- पाठ्यक्रम
- कवर
- श्रेय
- सीएसएस
- तारीख
- दिन
- विवरण
- विस्तृत
- डीआईडी
- डिजिटल
- नहीं करता है
- नीचे
- डाउनलोड
- दर्जन
- ड्राइव
- से प्रत्येक
- संपादक
- भी
- एलोन
- एलोन मस्क
- उभरा
- पर्याप्त
- दर्ज
- त्रुटि
- अनिवार्य
- ईथर (ईटीएच)
- और भी
- सब कुछ
- उदाहरण
- उदाहरण
- उत्कृष्ट
- निष्पादित
- मौजूदा
- उल्लू बनाना
- परिचित
- विशेषताएं
- कुछ
- खेत
- पट्टिका
- फ़ाइलें
- केंद्रित
- का पालन करें
- पूर्व
- पूर्व में
- चौथा
- मित्रों
- से
- पूर्ण
- पूरी तरह से
- गेट्स
- उत्पन्न
- उत्पन्न करता है
- मिल
- मिल रहा
- GitHub
- लक्ष्य
- चला जाता है
- जा
- अच्छा
- गूगल
- GPU
- महान
- होने
- ऊंचाई
- मंडराना
- कैसे
- तथापि
- एचटीएमएल
- HTTPS
- मानव
- सैकड़ों
- नायक
- की छवि
- in
- अनुक्रमणिका
- संकेत मिलता है
- निर्देश
- दिलचस्प
- इंटरफेस
- डराना
- IT
- जनवरी
- काम
- जोकर
- जानना
- बड़ा
- पिछली बार
- पिछले साल
- सीख रहा हूँ
- पंक्तियां
- लिंक
- थोड़ा
- जीना
- लग रहा है
- बनाता है
- प्रबंधक
- निशान
- मैट्रिक्स
- अधिकतम-चौड़ाई
- संदेश
- माइक्रोसॉफ्ट
- हो सकता है
- मिनट
- आईना
- आदर्श
- मॉडल
- कस्तूरी
- नाम
- आवश्यकता
- नया
- समाचार
- अगला
- नोटबुक
- नोट्स
- प्रस्ताव
- ऑफर
- ONE
- खुला
- खुला स्रोत
- अनुकूलित
- विकल्प
- अन्य
- अन्य
- अपना
- भाग
- विशेष
- पासवर्ड
- अतीत
- PC
- स्टाफ़
- ख़तम
- व्यक्ति
- स्टाफ़
- पिच
- की योजना बनाई
- प्लेटो
- प्लेटो डेटा इंटेलिजेंस
- प्लेटोडाटा
- प्ले
- लगाना
- पद
- प्रीमियम
- अध्यक्ष
- सुंदर
- प्राथमिक
- प्रोफाइल
- प्रदान करता है
- सार्वजनिक
- प्रकाशित
- अजगर
- गुणवत्ता
- पढ़ना
- पढ़ना
- प्राप्त करना
- हाल
- रिकॉर्डिंग
- लाल
- रेडिट
- रिश्ते
- रिहा
- की आवश्यकता होती है
- अनुसंधान
- शोधकर्ताओं
- संसाधन
- परिणाम
- परिणाम
- वृद्धि
- रॉबर्ट
- रोबोट
- रोबोट
- रोल
- रन
- दौड़ना
- सुरक्षित
- वही
- सहेजें
- दृश्य
- सेकंड
- वरिष्ठ
- एसईओ
- सेवा
- सेवाएँ
- सात
- साझा
- कम
- चाहिए
- केवल
- के बाद से
- एक
- सिरी
- साइट
- साइटें
- बैठक
- धीमा
- छोटा
- So
- सॉफ्टवेयर
- कोई
- कुछ
- जल्दी
- स्रोत
- बोलना
- वक्ता
- बोल रहा हूँ
- बोलता हे
- विशिष्ट
- भाषण
- प्रारंभ
- शुरू
- कदम
- संग्रहित
- कहानियों
- ऐसा
- तालिका
- टैग
- लेना
- टेक्नोलॉजी
- RSI
- लेकिन हाल ही
- बात
- तीसरा
- यहाँ
- पहर
- शीर्षक
- सेवा मेरे
- भी
- रेलगाड़ी
- प्रशिक्षित
- प्रशिक्षण
- मोड़
- अपलोड की गई
- अपलोड हो रहा है
- यूआरएल
- उपयोगकर्ता
- उपयोगकर्ताओं
- उपयोगिता
- विभिन्न
- संस्करण
- के माध्यम से
- वीडियो
- वास्तविक
- आवाज़
- आवाज
- W
- इंतज़ार कर रही
- जरूरत है
- चेतावनी
- क्या
- कौन कौन से
- जब
- कौन
- मर्जी
- अंदर
- शब्द
- काम
- कार्य
- होगा
- लिखा हुआ
- वर्ष
- आपका
- यूट्यूब
- जेफिरनेट