सीईओ साक्षात्कार: मास्टिस्का एआई के सुरेश सुगुमर - सेमीविकी

सीईओ साक्षात्कार: मस्तिस्का एआई के सुरेश सुगुमर - सेमीविकी

स्रोत नोड: 3003635

सुरेश सुगुमार मस्तिस्का एआईसुरेश सेमीकंडक्टर्स, आर्टिफिशियल इंटेलिजेंस, साइबर सुरक्षा, इंटरनेट-ऑफ-थिंग्स, हार्डवेयर, सॉफ्टवेयर आदि में गहरी तकनीकी विशेषज्ञता के साथ एक प्रौद्योगिकी कार्यकारी हैं। उन्होंने उद्योग में 20 साल बिताए, हाल ही में ओपन-सोर्स जीरो के लिए कार्यकारी निदेशक के रूप में कार्य किया है। टेक्नोलॉजी इनोवेशन इंस्टीट्यूट, अबू धाबी और अन्य फॉर्च्यून 500 सेमीकंडक्टर कंपनियों जैसे इंटेल, क्वालकॉम और मीडियाटेक में विभिन्न नेतृत्व भूमिकाओं में ट्रस्ट चिप विकास, जहां उन्होंने उच्च-प्रदर्शन, ऊर्जा-कुशल, पोस्ट-क्वांटम सुरक्षित, सुरक्षित शोध और विकास किया। डेटासेंटर, क्लाइंट, स्मार्टफ़ोन, नेटवर्किंग, IoT और AI/ML बाज़ारों के लिए माइक्रोचिप्स/सिस्टम-ऑन-चिप्स (SoCs)/त्वरक। उन्होंने फाल्कन एलएलएम (हगिंगफेस में #1 रैंक) में योगदान दिया और कस्टम एआई हार्डवेयर प्लेटफॉर्म के लिए प्रमुख वास्तुकार थे (रद्द - प्राथमिकताएं बदल गईं)। उनके पास 15+ अमेरिकी पेटेंट हैं और उन्होंने 20+ से अधिक सम्मेलनों में प्रकाशन/प्रस्तुति दी है।

सुरेश आरआईएससी-वी इंटरनेशनल में नेतृत्व की स्थिति में भी सक्रिय रूप से कार्यरत हैं, जहां वह आरआईएससी-वी गोपनीय कंप्यूटिंग क्षमता विकसित करने के लिए विश्वसनीय कंप्यूटिंग समूह की अध्यक्षता करते हैं और एआई/एमएल वर्कलोड के लिए आरआईएससी-वी हार्डवेयर त्वरण विकसित करने के लिए एआई/एमएल समूह की अध्यक्षता करते हैं। चैटजीपीटी प्रकार के अनुप्रयोगों में उपयोग किए जाने वाले ट्रांसफार्मर बड़े भाषा मॉडल। वह स्टार्टअप और उद्यम पूंजी फर्मों को निवेश निर्णय समर्थन, उत्पाद रणनीति, प्रौद्योगिकी उचित परिश्रम आदि पर भी सलाह देते हैं।

उन्होंने INSEAD से एमबीए, बिरला इंस्टीट्यूट ऑफ टेक्नोलॉजी एंड साइंस पिलानी से एमएस, MIT से सिस्टम इंजीनियरिंग सर्टिफिकेट, स्टैनफोर्ड से AI सर्टिफिकेट और TÜV SÜD से ऑटोमोटिव फंक्शनल सेफ्टी सर्टिफिकेट हासिल किया।

हमें अपनी कंपनी के बारे में बताएं
"मस्तिष्का ए.आई” (मस्तिष्का का संस्कृत में अर्थ है मस्तिष्क) एक एआई कंपनी है जो कल के जेनरेटिव एआई उपयोग मामलों के लिए फाउंडेशन मॉडल को अधिक कुशलता से चलाने के लिए मस्तिष्क जैसे कंप्यूटर बनाने पर केंद्रित है।

आप किन समस्याओं का समाधान कर रहे हैं?
एआई/जेनएआई के लाभों को देखते हुए, इसकी मांग बढ़ना तय है, और हमारे ग्रह पर इसके दुष्प्रभाव भी बढ़ेंगे। हम अपने ग्रह पर AI के दुष्प्रभावों को कैसे कम या बेअसर कर सकते हैं? कार्बन कैप्चर और परमाणु ऊर्जा सही दिशा में हैं। लेकिन हमें मौलिक रूप से एआई करने के तरीके पर पुनर्विचार करने की आवश्यकता है, क्या यह टन मैट्रिक्स गुणन करने का गलत तरीका है?

हमारा मस्तिष्क 10W के अंदर और नीचे समानांतर में कई कार्य सीख और कर सकता है, लेकिन ये AI सिस्टम मॉडल को प्रशिक्षित करने के लिए 10 मेगावाट की खपत क्यों करते हैं?

शायद भविष्य में न्यूरोमॉर्फिक आर्किटेक्चर और स्पाइकिंग न्यूरल नेटवर्क-आधारित ट्रांसफार्मर जैसे ऊर्जा-कुशल आर्किटेक्चर होंगे जो मानव मस्तिष्क के सबसे करीब हैं, जो 100-1000x कम ऊर्जा की खपत कर सकते हैं, जिससे एआई का उपयोग करने की लागत कम हो जाएगी, जिससे इसका लोकतंत्रीकरण होगा और हमारी बचत होगी। ग्रह.

एआई के साथ हम जिन वर्तमान चुनौतियों का सामना कर रहे हैं, वे हैं ए) उपलब्धता, बी) पहुंच, सी) सामर्थ्य, और डी) पर्यावरण सुरक्षा और उनसे निपटने के लिए कुछ सिफारिशें।

यदि हम भविष्य में अनुमान लगाते हैं, तो कुछ उपयोगी एजीआई अवधारणाओं को फिल्म "एचईआर" में प्रदर्शित किया गया है, जहां चरित्र 'सामंथा' - एक संवादी एजेंट है जो स्वाभाविक है, भावनाओं को समझता है, सहानुभूति दिखाता है, काम पर एक अद्भुत सह-पायलट है - और चलता रहता है पूरे दिन हैंडहेल्ड डिवाइस, तो हमें अभी नीचे दी गई चुनौतियों का समाधान करना पड़ सकता है।

अंक 1: एलएलएम प्रशिक्षण की लागत 150 हजार से 10+ मिलियन डॉलर तक हो सकती है, और यह केवल गहरी जेब वाले लोगों को ही एआई विकसित करने की अनुमति देता है। शीर्ष पर, अनुमान लगाने की लागत भी बहुत अधिक है (वेब ​​खोज से 10 गुना अधिक लागत)
-> हमें मानवता के लाभ के लिए एआई को लोकतांत्रिक बनाने के लिए मॉडल/हार्डवेयर की ऊर्जा दक्षता में सुधार करने की आवश्यकता है।

अंक 2: संवादात्मक एजेंटों या अनुशंसा प्रणालियों के लिए विशाल एआई मॉडल चलाने से बिजली की खपत और शीतलन के मामले में पर्यावरण पर असर पड़ता है।
-> हमें अपने ग्रह को अपने बच्चों के लिए बचाने के लिए मॉडल/हार्डवेयर की ऊर्जा दक्षता में सुधार करने की आवश्यकता है।

अंक 3: मानव मस्तिष्क सक्षम है और एक साथ कई काम कर सकता है, लेकिन मेगावाट के बजाय केवल 10 वाट की खपत करता है।
-> शायद हमें अपने दिमाग की तरह मशीनें बनानी चाहिए, न कि नियमित मैट्रिक्स मल्टीप्लायरों की तरह।

मानवता केवल स्थायी नवाचारों से ही फल-फूल सकती है, न कि नवाचार के नाम पर सभी जंगलों को काटकर और महासागरों को उबालकर। हमें अपने बच्चों और आने वाली पीढ़ियों के कल्याण के लिए अपने ग्रह की रक्षा करनी चाहिए...

आपके सबसे मजबूत अनुप्रयोग क्षेत्र कौन से हैं?
आज के जीपीयू-आधारित समाधानों की तुलना में 50-100 गुना अधिक ऊर्जा पर ट्रांसफार्मर (और भविष्य के तंत्रिका वास्तुकला) आधारित फाउंडेशन मॉडल का प्रशिक्षण और अनुमान।

आपके ग्राहकों को रात में क्या बनाए रखता है?
उन ग्राहकों के लिए समस्याएँ जो वर्तमान में अन्य उत्पादों का उपयोग करते हैं:

विशाल भाषा मॉडलों के प्रशिक्षण के लिए बिजली की खपत बहुत अधिक है, उदाहरण के लिए, 13 दिनों के लिए 390 जीपीयू पर 200बी टेक्स्ट टोकन पर 7बी पैरामीटर एलएलएम के प्रशिक्षण की लागत $151,744 है (स्रोत: हगिंगफेस न्यू ट्रेनिंग क्लस्टर सर्विस पेज - https://lnkd.in/g6Vc5cz3). और यहां तक ​​कि 100+बी मापदंडों वाले बड़े मॉडलों को प्रशिक्षित करने के लिए $10+एम का खर्च आता है। फिर हर बार नया त्वरित अनुरोध आने पर अनुमान लगाने के लिए भुगतान करें।

ठंडा करने के लिए पानी की खपत, कैलिफोर्निया विश्वविद्यालय, रिवरसाइड के शोधकर्ताओं ने चैटजीपीटी जैसी सेवा के पर्यावरणीय प्रभाव का अनुमान लगाया है, और कहते हैं कि हर बार जब आप इससे पूछते हैं तो यह 500 मिलीलीटर पानी (16 औंस पानी की बोतल के करीब) पी लेता है। 5 से 50 संकेतों या प्रश्नों के बीच की श्रृंखला। सीमा उसके सर्वर कहां स्थित हैं और मौसम के आधार पर भिन्न होती है। अनुमान में अप्रत्यक्ष जल उपयोग शामिल है जिसे कंपनियां मापती नहीं हैं - जैसे कि बिजली संयंत्रों को ठंडा करना जो डेटा केंद्रों को बिजली की आपूर्ति करते हैं। (स्रोत: https://lnkd.in/gybcxX8C)

मौजूदा उत्पादों के गैर-ग्राहकों के लिए मुद्दे:

हार्डवेयर खरीदने के लिए CAPEX वहन नहीं कर सकते
क्लाउड सेवाओं का उपयोग करने में असमर्थ
एआई में नवप्रवर्तन या उसका लाभ नहीं उठा सकते - सेवा मॉडल में अटके हुए हैं जो किसी भी प्रतिस्पर्धी लाभ को समाप्त कर देता है

प्रतिस्पर्धी परिदृश्य कैसा दिखता है और आप कैसे अंतर करते हैं?

  • प्रशिक्षण क्षेत्र में जीपीयू का दबदबा है, हालांकि विशेष एएसआईसी भी इस क्षेत्र में प्रतिस्पर्धा करते हैं
  • क्लाउड और एज अनुमान में बहुत सारे विकल्प उपलब्ध हैं

डिजिटल, एनालॉग, फोटोनिक - आप इसे नाम दें, लोग एक ही समस्या से निपटने की कोशिश कर रहे हैं।

क्या आप एआई/एमएल के लिए चिप आर्किटेक्चर की वर्तमान स्थिति पर अपने विचार साझा कर सकते हैं, यानी, आप इस समय सबसे महत्वपूर्ण रुझान और अवसरों के रूप में क्या देखते हैं?

निम्नलिखित रुझान:
प्रवृत्ति 1: 10 साल पहले, हार्डवेयर-सक्षम गहन शिक्षा फली-फूली, और अब वही हार्डवेयर प्रगति को रोक रहा है। मॉडलों को चलाने के लिए हार्डवेयर की भारी लागत और बिजली की लागत के कारण, हार्डवेयर तक पहुंच बनाना एक चुनौती बन गया है। केवल गहरी जेब वाली कंपनियां ही इन्हें वहन करने में सक्षम हैं और एकाधिकार प्राप्त कर रही हैं।

प्रवृत्ति 2: अब जब ये मॉडल मौजूद हैं, तो हमें उन्हें व्यावहारिक उद्देश्यों के लिए उपयोग करने की आवश्यकता है ताकि अनुमान लगाने का भार बढ़ जाए, जिससे एआई एक्सेलेरेटर वाले सीपीयू फिर से सुर्खियों में आ सकें।

प्रवृत्ति 3: स्टार्टअप वैकल्पिक फ़्लोटिंग पॉइंट संख्या प्रतिनिधित्व के साथ आने की कोशिश कर रहे हैं जो पारंपरिक आईईईई प्रारूप - जैसे लॉगरिदमिक और पॉज़िट-आधारित - अच्छे हैं लेकिन पर्याप्त नहीं हैं। पीपीए$ डिज़ाइन स्पेस ऑप्टिमाइज़ेशन तब विस्फोटित हो जाता है जब हम एक को ऑप्टिमाइज़ करने का प्रयास करते हैं और दूसरा असफल हो जाता है।

प्रवृत्ति 4: उद्योग एआई के सेवा-आधारित मॉडल से हटकर अपने स्वयं के परिसर में अपने निजी मॉडल की मेजबानी कर रहा है - लेकिन आपूर्ति की कमी, प्रतिबंधों आदि के कारण हार्डवेयर तक पहुंच एक चुनौती है।

वर्तमान स्थिति:
हार्डवेयर और डेटा की उपलब्धता ने 10 साल पहले एआई के विकास को बढ़ावा दिया था, अब वही हार्डवेयर इसे बाधित कर रहा है - मैं समझाता हूं

जब से सीपीयू खराब प्रदर्शन कर रहे थे और जीपीयू को एआई करने के लिए पुनर्निर्मित किया गया था, तब से कई चीजें हुईं

कंपनियां एआई/एमएल के 4 खंडों को संबोधित कर रही हैं - 1) क्लाउड ट्रेनिंग, 2) क्लाउड इंट्रेंसिंग, 3) एज इंट्रेंसिंग, और 4) एज ट्रेनिंग (गोपनीयता-संवेदनशील अनुप्रयोगों के लिए फ़ेडरेटेड लर्निंग)।
डिजिटल और एनालॉग

प्रशिक्षण पक्ष - बड़ी संख्या में कंपनियां जीपीयू, आरआईएससी-वी पर आधारित ग्राहक त्वरक, वेफर-स्केल चिप्स (850K कोर) आदि का काम कर रही हैं, जहां पारंपरिक सीपीयू की कमी है (उनका सामान्य उद्देश्य)। अनुमान पक्ष - एनएन एक्सेलेरेटर हर निर्माता से स्मार्टफोन, लैपटॉप और अन्य एज डिवाइसों में उपलब्ध हैं।

कुछ समय पहले एनालॉग मेमोरीस्टर-आधारित आर्किटेक्चर भी सामने आए थे।

हमारा मानना ​​है कि सीपीयू अनुमान लगाने में बहुत अच्छे हो सकते हैं यदि हम इसे मैट्रिक्स एक्सटेंशन जैसे त्वरण के साथ बढ़ाते हैं

चीज़ों का RISC-V पक्ष:
चीजों के आरआईएससी-वी पक्ष पर, हम ट्रांसफार्मर वर्कलोड के लिए संभावित बाधाओं को खत्म करने के लिए मैट्रिक्स संचालन और अन्य गैर-रेखीय संचालन के लिए त्वरक विकसित कर रहे हैं। वॉन न्यूमैन की बाधाओं को भी कंप्यूटिंग के करीब यादों को व्यवस्थित करके संबोधित किया जा रहा है, अंततः एआई त्वरण के साथ सीपीयू को अनुमान लगाने के लिए सही विकल्प बना दिया गया है।

अवसर:
फ़ाउंडेशन मॉडल के बाज़ार में जगह बनाने के अनूठे अवसर मौजूद हैं। उदाहरण - ओपनएआई उल्लेख कर रहा है कि वे अपनी चैटजीपीटी सेवाओं को जारी रखने के लिए पर्याप्त एआई कंप्यूट (जीपीयू) को सुरक्षित करने में सक्षम नहीं थे... और समाचारों में नियमित इंटरनेट खोज की तुलना में 10 गुना बिजली की लागत और सिस्टम को ठंडा करने के लिए 500 मिलीलीटर पानी की लागत के बारे में बताया गया है। प्रत्येक प्रश्न के लिए. यहां भरने के लिए एक बाजार है - यह विशिष्ट नहीं है, बल्कि यह संपूर्ण बाजार है जो ऊपर उल्लिखित सभी चुनौतियों से निपटने के लिए एआई का लोकतंत्रीकरण करेगा - ए) उपलब्धता, बी) पहुंच, सी) सामर्थ्य, और डी) पर्यावरणीय सुरक्षा

आप किन नई सुविधाओं/प्रौद्योगिकी पर काम कर रहे हैं?
हम ऊर्जा कुशल हार्डवेयर का लाभ उठाने के लिए, उपलब्ध खुले ढांचे का पुन: उपयोग करते हुए, न्यूरोमॉड्रफिक तकनीकों और टेलरिंग मॉडल का लाभ उठाते हुए कंप्यूटर की तरह मस्तिष्क का निर्माण कर रहे हैं।

आप अगले 12-18 महीनों में एआई/एमएल क्षेत्र के बढ़ने या बदलने की कल्पना कैसे करते हैं?
चूंकि जीपीयू की मांग कम हो गई है (लागत लगभग 30 हजार डॉलर) और दुनिया के कुछ हिस्सों को इन जीपीयू को खरीदने के लिए प्रतिबंधों का सामना करना पड़ रहा है, दुनिया के कुछ हिस्सों को लग रहा है कि वे जीपीयू तक पहुंच के बिना एआई अनुसंधान और विकास में जमे हुए हैं। वैकल्पिक हार्डवेयर प्लेटफ़ॉर्म बाज़ार पर कब्ज़ा करने जा रहे हैं।
मॉडल शायद सिकुड़ने लगेंगे - कस्टम मॉडल या यहां तक ​​कि मौलिक रूप से सूचना घनत्व भी बढ़ेगा

प्रश्न वही है लेकिन अगले 3-5 वर्षों में विकास और परिवर्तन कैसा रहेगा?
ए) एआई एक्सटेंशन वाले सीपीयू एआई अनुमान बाजार पर कब्जा कर लेंगे
बी) मॉडल फुर्तीले हो जाएंगे, और सूचना घनत्व 16% से 90% तक सुधरने पर पैरामीटर कम हो जाएंगे।
ग) ऊर्जा दक्षता में सुधार होता है, CO2 फुट प्रिंट कम हो जाता है
घ) नए आर्किटेक्चर सामने आते हैं
ई) हार्डवेयर लागत और ऊर्जा लागत कम हो जाती है जिससे छोटी कंपनियों के लिए मॉडल बनाने और प्रशिक्षित करने में प्रवेश की बाधा सस्ती हो जाती है
च) लोग एजीआई से पहले के क्षण के बारे में बात करते हैं, लेकिन मेरा बेंचमार्क फिल्म "उसके" में चित्रित सामंथा (संवादात्मक एआई) होगा.. जो शायद बड़े पैमाने पर बढ़ने की उच्च लागत को देखते हुए संभव नहीं है।

ऐसी कौन सी चुनौतियाँ हैं जो AI/ML क्षेत्र में विकास को प्रभावित या सीमित कर सकती हैं?
ए) हार्डवेयर तक पहुंच
बी) ऊर्जा लागत और शीतलन लागत और पर्यावरणीय क्षति

यह भी पढ़ें:

सीईओ साक्षात्कार: प्रैग्मैटिक के डेविड मूर

सीईओ साक्षात्कार: सैंडबॉक्स सेमीकंडक्टर की डॉ. मेघाली चोपड़ा

सीईओ साक्षात्कार: एलाइन्ड कार्बन के डॉ. जे प्रोवाइन

समय टिकट:

से अधिक सेमीविकी