खुले तंत्रिका नेटवर्क: AI और web3 का प्रतिच्छेदन

स्रोत नोड: 1683067

ऋषिन शर्मा और जेक ब्रुखमैन द्वारा।

इस टुकड़े पर प्रतिक्रिया देने वाले सभी लोगों के लिए विशेष धन्यवाद, जिनमें निक याकोवेंको, डेविड पाकमैन, जान कोपेन्स, एसी, इवान फेंग, आदि सिडमैन शामिल हैं।

आदेश: "पारभासी साइबोर्ग एक भविष्य के महल में एक धातु सिंहासन पर बैठे, साइबरपंक, अत्यधिक विस्तृत, तेज रेखाएं, नीयन रोशनी"

स्रोत: एक स्थिर प्रसार खोज इंजन Lexica.art से AI-जनित छवि

तकनीकी नवाचार कभी नहीं टिकता है, और यह कृत्रिम बुद्धि के लिए विशेष रूप से सच है। पिछले कुछ वर्षों में, हमने देखा है कि गहन शिक्षण मॉडल की लोकप्रियता एआई में अग्रदूत के रूप में फिर से उभरी है। इसे . के रूप में भी जाना जाता है तंत्रिका जाल, इन मॉडलों में नोड्स की घनी परस्पर जुड़ी परतें शामिल होती हैं जो एक दूसरे के माध्यम से जानकारी पास करती हैं, मोटे तौर पर मानव मस्तिष्क के निर्माण की नकल करती हैं। 2010 के दशक की शुरुआत में, सबसे उन्नत मॉडल में लाखों पैरामीटर थे, विशिष्ट भावना विश्लेषण और वर्गीकरण के लिए उपयोग किए जाने वाले भारी पर्यवेक्षित मॉडल। आज के सबसे उन्नत मॉडल जैसे ड्रीमस्टूडियो, GPT-3, दाल-ई 2, तथा छवि एक ट्रिलियन मापदंडों के करीब पहुंच रहे हैं और जटिल और यहां तक ​​कि रचनात्मक कार्यों को पूरा कर रहे हैं जो मानव कार्य को प्रतिद्वंद्वी बनाते हैं। उदाहरण के लिए, इस ब्लॉग पोस्ट की हेडर इमेज या सारांश को लें। दोनों कृत्रिम बुद्धि द्वारा निर्मित किए गए थे। हम इन मॉडलों के सामाजिक और सांस्कृतिक निहितार्थों को देखना शुरू कर रहे हैं क्योंकि वे आकार देते हैं कि हम कैसे नई चीजें सीखते हैं, एक दूसरे के साथ बातचीत करते हैं और खुद को रचनात्मक रूप से व्यक्त करते हैं।

हालाँकि, आज के अधिकांश तकनीकी ज्ञान, प्रमुख डेटा सेट और बड़े तंत्रिका नेटवर्क को प्रशिक्षित करने की कम्प्यूटेशनल क्षमता Google और मेटा जैसी "बिग टेक" कंपनियों द्वारा बंद स्रोत और गेटेड हैं। जबकि प्रतिकृति ओपन सोर्स मॉडल जैसे जीपीटी-नियोएक्स, डेल-मेगा, तथा फूल का खिलना सहित संगठनों द्वारा नेतृत्व किया गया है स्थिरताएआई, एलेउथेरे, तथा हगिंग फ़ेस, web3 ओपन सोर्स AI को और भी अधिक सुपरचार्ज करने के लिए तैयार है।

"एआई के लिए एक वेब 3 इंफ्रास्ट्रक्चर परत ओपन सोर्स डेवलपमेंट, सामुदायिक स्वामित्व और शासन, और सार्वभौमिक पहुंच के तत्वों को पेश कर सकती है जो इन नई प्रौद्योगिकियों को विकसित करने में नए मॉडल और क्षमताएं बनाती हैं।"

इसके अलावा, एआई प्रौद्योगिकियों को अपनाने से वेब3 के लिए कई महत्वपूर्ण उपयोग के मामलों को बढ़ाया जाएगा। से जनरेटिव आर्ट एनएफटी मेटावर्सल लैंडस्केप के लिए, AI को web3 में कई उपयोग के मामले मिलेंगे। ओपन सोर्स एआई वेब3 के खुले, विकेंद्रीकृत और लोकतंत्रीकृत लोकाचार के भीतर फिट बैठता है और बिग टेक द्वारा प्रदान किए गए एआई के विकल्प का प्रतिनिधित्व करता है, जिसके जल्द ही खुलने की संभावना नहीं है।

फाउंडेशन मॉडल तंत्रिका नेटवर्क हैं जो व्यापक डेटासेट पर ऐसे कार्यों को करने के लिए प्रशिक्षित होते हैं जिनके लिए सामान्य रूप से बुद्धिमान मानव व्यवहार की आवश्यकता होती है। इन मॉडलों ने कुछ प्रभावशाली परिणाम दिए हैं।

भाषा मॉडल जैसे OpenAI's GPT-3, Google का LaMDA, तथा एनवीडिया का मेगाट्रॉन-ट्यूरिंग एनएलजी प्राकृतिक भाषा को समझने और तैयार करने, पाठ को सारांशित करने और संश्लेषित करने और यहां तक ​​कि कंप्यूटर कोड लिखें.

DALLE-2 OpenAI का है टेक्स्ट-टू-इमेज डिफ्यूजन मॉडल जो लिखित पाठ से अद्वितीय चित्र उत्पन्न कर सकता है। Google के AI डिवीजन डीपमाइंड ने 540B पैरामीटर भाषा मॉडल, PaLM सहित प्रतिस्पर्धी मॉडल तैयार किए हैं, और इमेजन, इसका अपना इमेज-जेनरेशन मॉडल है जो ड्राबेंच और COCO FID बेंचमार्क पर DALLE-2 से बेहतर प्रदर्शन करता है। इमेजेन विशेष रूप से अधिक फोटोरिअलिस्टिक परिणाम उत्पन्न करता है और इसमें वर्तनी की क्षमता होती है।

Google के जैसे सुदृढीकरण सीखने के मॉडल AlphaGo को हरा दिया है ह्यूमन गो वर्ल्ड चैंपियन नई रणनीतियों और खेल तकनीकों की खोज करते हुए जो खेल के तीन हजार साल के इतिहास में सामने नहीं आई हैं।

नवाचार के मामले में सबसे आगे बिग टेक के साथ जटिल नींव मॉडल बनाने की दौड़ पहले ही शुरू हो चुकी है। क्षेत्र की उन्नति जितनी रोमांचक है, एक महत्वपूर्ण विषय है जो चिंता का विषय है।

पिछले एक दशक में, जैसे-जैसे एआई मॉडल अधिक परिष्कृत होते गए हैं, वैसे-वैसे वे जनता के लिए भी तेजी से बंद होते गए हैं।

टेक दिग्गज इस तरह के मॉडल बनाने और डेटा और कोड को मालिकाना प्रौद्योगिकियों के रूप में बनाए रखने में भारी निवेश कर रहे हैं, जबकि मॉडल प्रशिक्षण और गणना के लिए पैमाने के लाभों की अपनी अर्थव्यवस्थाओं के माध्यम से अपने प्रतिस्पर्धी खाई को संरक्षित करते हैं।

किसी भी तीसरे पक्ष के लिए, नींव मॉडल तैयार करना तीन प्रमुख बाधाओं के साथ एक संसाधन-गहन प्रक्रिया है: डेटा, गणना, और मुद्रीकरण.

यहां हम इनमें से कुछ मुद्दों को हल करने के लिए वेब3 थीम के शुरुआती दौर को देखते हैं।

प्रभावी मॉडल बनाने के लिए लेबल किए गए डेटासेट महत्वपूर्ण हैं। एआई सिस्टम डेटासेट के उदाहरणों से सामान्यीकरण करके सीखते हैं और समय के साथ प्रशिक्षित होने पर लगातार सुधार करते हैं। हालांकि, गुणवत्ता डेटासेट संकलन और लेबलिंग के लिए कम्प्यूटेशनल संसाधनों के अलावा विशेष ज्ञान और प्रसंस्करण की आवश्यकता होती है। बड़ी टेक कंपनियों के पास अक्सर आंतरिक डेटा टीमें होती हैं जो बड़े, मालिकाना डेटासेट के साथ काम करने में विशिष्ट होती हैं और आईपी ​​सिस्टम अपने मॉडलों को प्रशिक्षित करने के लिए, और उनके डेटा के उत्पादन या वितरण तक पहुंच खोलने के लिए बहुत कम प्रोत्साहन है।

पहले से ही ऐसे समुदाय हैं जो शोधकर्ताओं के वैश्विक समुदाय के लिए मॉडल प्रशिक्षण को खुला और सुलभ बना रहे हैं। यहाँ कुछ उदाहरण हैं:

  1. आम क्रॉल, दस साल के इंटरनेट डेटा का एक सार्वजनिक भंडार, सामान्य प्रशिक्षण के लिए उपयोग किया जा सकता है। (यद्यपि अनुसंधान से पता चला कि अधिक सटीक, पारे हुए डेटासेट मॉडल के सामान्य क्रॉस-डोमेन ज्ञान और डाउनस्ट्रीम सामान्यीकरण क्षमताओं में सुधार कर सकते हैं।)
  2. लायोन एक गैर-लाभकारी संगठन है जिसका लक्ष्य बड़े पैमाने पर मशीन लर्निंग मॉडल और डेटासेट को आम जनता के लिए उपलब्ध कराना और जारी करना है LAION5B, एक 5.85 बिलियन CLIP-फ़िल्टर्ड इमेज-टेक्स्ट जोड़ी डेटासेट जो रिलीज़ होने पर दुनिया में सबसे बड़ा खुले तौर पर सुलभ इमेज-टेक्स्ट डेटासेट बन गया।
  3. एलेउथेरे एक विकेन्द्रीकृत सामूहिक है जिसने सबसे बड़े ओपन सोर्स टेक्स्ट डेटासेट में से एक को जारी किया जिसे कहा जाता है ढेर. पाइल भाषा मॉडलिंग के लिए 825.18 GiB अंग्रेजी भाषा का डेटासेट है जो 22 विभिन्न डेटा स्रोतों का उपयोग करता है।

वर्तमान में, ये समुदाय अनौपचारिक रूप से संगठित हैं और व्यापक स्वयंसेवी आधार से योगदान पर निर्भर हैं। उनके प्रयासों को सुपरचार्ज करने के लिए, टोकन पुरस्कारों का उपयोग ओपन-सोर्स डेटासेट बनाने के लिए एक तंत्र के रूप में किया जा सकता है। योगदान के आधार पर टोकन का उत्सर्जन किया जा सकता है, जैसे कि एक बड़े टेक्स्ट-इमेज डेटासेट को लेबल करना, और एक डीएओ समुदाय ऐसे दावों को मान्य कर सकता है। अंततः, बड़े मॉडल एक सामान्य पूल से टोकन जारी कर सकते हैं, और उक्त मॉडल के शीर्ष पर बने उत्पादों से डाउनस्ट्रीम राजस्व टोकन मूल्य तक अर्जित हो सकता है। इस तरह डेटासेट योगदानकर्ता अपने टोकन के माध्यम से बड़े मॉडलों में हिस्सेदारी रख सकते हैं और शोधकर्ता खुले में भवन संसाधनों का मुद्रीकरण करने में सक्षम होंगे।

बड़े मॉडलों के लिए अनुसंधान पहुंच को व्यापक बनाने और मॉडल के प्रदर्शन में सुधार के लिए अच्छी तरह से निर्मित ओपन सोर्स डेटासेट का संकलन महत्वपूर्ण है। अधिक परिष्कृत परिणामों के लिए विभिन्न प्रकार की छवियों के लिए आकार और फ़िल्टर बढ़ाकर टेक्स्ट-छवि डेटासेट का विस्तार किया जा सकता है। प्राकृतिक भाषा मॉडल के प्रशिक्षण के लिए गैर-अंग्रेज़ी डेटासेट की आवश्यकता होगी जो गैर-अंग्रेज़ी भाषी आबादी उपयोग कर सकती है। समय के साथ, हम वेब3 दृष्टिकोण का उपयोग करके इन परिणामों को बहुत तेज़ी से और अधिक खुले तौर पर प्राप्त कर सकते हैं।

बड़े पैमाने पर तंत्रिका नेटवर्क को प्रशिक्षित करने के लिए आवश्यक गणना नींव मॉडल में सबसे बड़ी बाधाओं में से एक है। पिछले एक दशक में, AI मॉडल के प्रशिक्षण में कंप्यूट की मांग बढ़ी है हर 3.4 महीने में दोगुना. इस अवधि के दौरान, एआई मॉडल छवि पहचान से सुदृढीकरण सीखने के एल्गोरिदम का उपयोग करने के लिए रणनीति के खेल में मानव चैंपियन को हराने और भाषा मॉडल को प्रशिक्षित करने के लिए ट्रांसफार्मर का उपयोग करने के लिए चले गए हैं। उदाहरण के लिए, OpenAI के GPT-3 में 175 बिलियन पैरामीटर थे और प्रशिक्षण के लिए 3,640 पेटाफ्लॉप्स-दिन लगे। यह दुनिया के सबसे तेज सुपरकंप्यूटर पर दो सप्ताह और एक मानक लैपटॉप की गणना के लिए एक सहस्राब्दी से अधिक समय लेगा। जैसे-जैसे मॉडल का आकार बढ़ता जा रहा है, गणना क्षेत्र की उन्नति में एक अड़चन बनी हुई है।

एआई सुपरकंप्यूटर को तंत्रिका नेटवर्क के प्रशिक्षण के लिए आवश्यक गणितीय संचालन करने के लिए अनुकूलित विशिष्ट हार्डवेयर की आवश्यकता होती है, जैसे कि ग्राफिक्स प्रोसेसिंग यूनिट (जीपीयू) या एप्लिकेशन-विशिष्ट एकीकृत सर्किट (एएसआईसी)। आज, इस प्रकार की गणना के लिए अनुकूलित अधिकांश हार्डवेयर को Google क्लाउड, अमेज़ॅन वेब सर्विसेज, माइक्रोसॉफ्ट एज़ूर और आईबीएम क्लाउड जैसे कुछ ओलिगोपॉलिस्टिक क्लाउड सेवा प्रदाताओं द्वारा नियंत्रित किया जाता है।

यह अगला प्रमुख चौराहा है जहां हम सार्वजनिक, खुले नेटवर्क के माध्यम से विकेन्द्रीकृत गणना आवंटन को कर्षण प्राप्त करते हुए देखते हैं। समुदाय संचालित परियोजनाओं को प्रशिक्षित करने के लिए विकेंद्रीकृत शासन का उपयोग निधि और संसाधनों के आवंटन के लिए किया जा सकता है। इसके अलावा, एक विकेन्द्रीकृत बाज़ार मॉडल को सभी भौगोलिक क्षेत्रों में खुले तौर पर पहुँचा जा सकता है ताकि कोई भी शोधकर्ता कंप्यूट संसाधनों तक पहुँच प्राप्त कर सके। एक इनाम प्रणाली की कल्पना करें जो टोकन जारी करके क्राउडफंड मॉडल प्रशिक्षण देती है। सफल क्राउडफंडिंग को उनके मॉडल के लिए प्राथमिकता की गणना प्राप्त होगी और जहां उच्च मांग है, वहां नवाचारों को आगे बढ़ाएं। उदाहरण के लिए, यदि डीएओ की ओर से बड़ी आबादी की सेवा के लिए स्पेनिश या हिंदी जीपीटी मॉडल तैयार करने की महत्वपूर्ण मांग है, तो उस डोमेन पर शोध पर ध्यान केंद्रित किया जा सकता है।

पहले से ही कंपनियां पसंद करती हैं जेनसिन गहन शिक्षण गणना के लिए वैकल्पिक, लागत-कुशल और क्लाउड-आधारित हार्डवेयर पहुंच को प्रोत्साहित करने और समन्वयित करने के लिए प्रोटोकॉल लॉन्च करने पर काम कर रहे हैं। समय के साथ, वेब3 इन्फ्रास्ट्रक्चर के साथ निर्मित एक साझा, विकेन्द्रीकृत वैश्विक कंप्यूट नेटवर्क बड़े पैमाने पर अधिक लागत-कुशल बन जाएगा और हमारी बेहतर सेवा करेगा क्योंकि हम सामूहिक रूप से कृत्रिम बुद्धिमत्ता की सीमा का पता लगाते हैं।

डेटासेट और कंप्यूट इस थीसिस को सक्षम करेंगे: ओपन सोर्स एआई मॉडल। पिछले कुछ वर्षों में, बड़े मॉडल तेजी से निजी हो गए हैं क्योंकि उनके उत्पादन के लिए आवश्यक संसाधन निवेश ने परियोजनाओं को बंद-स्रोत बनने के लिए प्रेरित किया है।

ओपनएआई लें। ओपनएआई की स्थापना 2015 में हुई थी पूरी मानवता के लाभ के लिए कृत्रिम सामान्य बुद्धि के उत्पादन के मिशन के साथ एक गैर-लाभकारी अनुसंधान प्रयोगशाला के रूप में, जो उस समय के एआई, Google और Facebook के नेताओं से बिल्कुल विपरीत है। समय के साथ, भयंकर प्रतिस्पर्धा और फंडिंग के दबाव ने पारदर्शिता और ओपन-सोर्सिंग कोड के आदर्शों को नष्ट कर दिया है क्योंकि OpenAI एक में स्थानांतरित हो गया है। फ़ायदेमंद मॉडल और एक बड़े पैमाने पर हस्ताक्षर किए Microsoft के साथ $1 बिलियन का वाणिज्यिक सौदा. इसके अलावा, हालिया विवाद ने उनके टेक्स्ट-टू-इमेज मॉडल, डेल-2, को घेर लिया है। इसकी सामान्यीकृत सेंसरशिप के लिए. (उदाहरण के लिए, DALLE-2 ने 'गन,' एक्ज़िक्यूट, 'अटैक', 'यूक्रेन' और मशहूर हस्तियों की छवियों पर प्रतिबंध लगा दिया है; इस तरह की क्रूड सेंसरशिप 'लेब्रोन जेम्स अटैकिंग द बास्केट' या 'प्रोग्रामर को क्रियान्वित करने वाले प्रोग्रामर' जैसे संकेतों को रोकती है। कोड की लाइन'।) इन मॉडलों के लिए निजी बीटा तक पहुंच में पश्चिमी उपयोगकर्ताओं के लिए एक अंतर्निहित भौगोलिक पूर्वाग्रह है, जो इन मॉडलों को बातचीत करने और सूचित करने से वैश्विक आबादी के बड़े हिस्से को काट देता है।

ऐसा नहीं है कि कृत्रिम बुद्धि का प्रसार कैसे किया जाना चाहिए: कुछ बड़ी तकनीकी कंपनियों द्वारा संरक्षित, पॉलिश और संरक्षित। जैसा कि ब्लॉकचेन के मामले में होता है, नई तकनीक को यथासंभव समान रूप से लागू किया जाना चाहिए ताकि इसके लाभ उन लोगों के बीच केंद्रित न हों जिनके पास पहुंच है। आर्टिफिशियल इंटेलिजेंस में जटिल प्रगति को विभिन्न उद्योगों, भौगोलिक क्षेत्रों और समुदायों में खुले तौर पर इस्तेमाल किया जाना चाहिए ताकि सामूहिक रूप से सबसे आकर्षक उपयोग के मामलों की खोज की जा सके और एआई के उचित उपयोग पर आम सहमति तक पहुंच सके। नींव के मॉडल को खुला रखने से यह सुनिश्चित हो सकता है कि सेंसरशिप को रोका जा सकता है और पूर्वाग्रह की सार्वजनिक दृष्टि से सावधानीपूर्वक निगरानी की जा सकती है।

सामान्यीकृत नींव मॉडल के लिए एक टोकन संरचना के साथ, योगदानकर्ताओं के एक बड़े पूल को एकत्रित करना संभव होगा जो कोड ओपन सोर्स जारी करते समय अपने काम का मुद्रीकरण कर सकते हैं। ओपन सोर्स थीसिस को ध्यान में रखकर बनाई गई ओपनएआई जैसी परियोजनाओं को प्रतिभा और संसाधनों के लिए प्रतिस्पर्धा करने के लिए एक स्टैंड-अलोन फंडेड कंपनी की ओर जाना पड़ा है। Web3 ओपन सोर्स प्रोजेक्ट्स को आर्थिक रूप से आकर्षक और आगे की प्रतिद्वंद्वी बनाने की अनुमति देता है जो कि बिग टेक द्वारा निजी निवेश के नेतृत्व में हैं। इसके अलावा, ओपन सोर्स मॉडल के शीर्ष पर उत्पादों का निर्माण करने वाले नवप्रवर्तनकर्ता इस विश्वास के साथ निर्माण कर सकते हैं कि अंतर्निहित एआई में पारदर्शिता है। इसका डाउनस्ट्रीम प्रभाव उपन्यास कृत्रिम बुद्धि उपयोग मामलों के लिए तेजी से अपनाने और बाजार में जाने का होगा। वेब3 स्पेस में, इसमें शामिल हैं सुरक्षा अनुप्रयोगों जो स्मार्ट अनुबंध कमजोरियों और रग-पुल के लिए भविष्य कहनेवाला विश्लेषण करता है, छवि जनरेटर जिसका उपयोग एनएफटी को ढालने और मेटावर्स लैंडस्केप बनाने के लिए किया जा सकता है, डिजिटल एआई व्यक्तित्व जो व्यक्तिगत स्वामित्व को संरक्षित करने के लिए ऑन-चेन मौजूद हो सकता है, और भी बहुत कुछ।

आर्टिफिशियल इंटेलिजेंस आज सबसे तेजी से आगे बढ़ने वाली तकनीकों में से एक है जिसका समग्र रूप से हमारे समाज पर व्यापक प्रभाव पड़ेगा। आज, इस क्षेत्र में बड़ी तकनीक का बोलबाला है क्योंकि प्रतिभा, डेटा में वित्तीय निवेश, और गणना स्रोत विकास को खोलने के लिए महत्वपूर्ण खंदक बनाते हैं। एआई के बुनियादी ढांचे में वेब 3 का एकीकरण यह सुनिश्चित करने के लिए एक महत्वपूर्ण कदम है कि कृत्रिम बुद्धिमत्ता प्रणाली इस तरह से बनाई गई है जो निष्पक्ष, खुली और सुलभ हो। हम पहले से ही देख रहे हैं कि खुले मॉडल ट्विटर और हगिंगफेस जैसे खुले स्थानों में तेजी से, सार्वजनिक नवाचार की स्थिति लेते हैं और क्रिप्टो इन प्रयासों को आगे बढ़ाते हुए सुपरचार्ज कर सकते हैं।

कॉइनफंड टीम एआई और क्रिप्टो के प्रतिच्छेदन की तलाश में है:

  1. अपने मिशन के मूल में खुली कृत्रिम बुद्धिमत्ता वाली टीमें
  2. ऐसे समुदाय जो एआई मॉडल बनाने में मदद करने के लिए डेटा और गणना जैसे सार्वजनिक संसाधनों को क्यूरेट कर रहे हैं
  3. उत्पाद जो रचनात्मकता, सुरक्षा और नवाचार को मुख्यधारा में लाने के लिए एआई का उपयोग कर रहे हैं

यदि आप एआई और वेब 3 के चौराहे पर एक परियोजना का निर्माण कर रहे हैं, तो कॉइनफंड पर पहुंचकर हमारे साथ चैट करें ट्विटर या ईमेल risin@coinfund.io or जेक@coinfund.io.

समय टिकट:

से अधिक कॉइनफंड