الشبكات العصبية المفتوحة: تقاطع الذكاء الاصطناعي والويب 3

عقدة المصدر: 1683067

بواسطة ريشين شارما وجيك بروكمان.

شكر خاص لكل من قدم تعليقات على هذه القطعة ، بما في ذلك نيك ياكوفينكو ، وديفيد باكمان ، وجان كوبينز ، وإي سي ، وإيفان فينج ، وآدي سايدمان.

رسالة فورية: "سايبورغ نصف شفاف يجلس على عرش معدني في قلعة مستقبلية ، سايبربانك ، خطوط حادة ومفصلة للغاية ، أضواء نيون"

المصدر: صورة تم إنشاؤها بواسطة الذكاء الاصطناعي من Lexica.art ، وهو محرك بحث مستقر الانتشار

الابتكار التكنولوجي لا يهدأ أبدًا ، وهذا ينطبق بشكل خاص على الذكاء الاصطناعي. على مدى السنوات القليلة الماضية ، رأينا شعبية نماذج التعلم العميق تعود إلى الظهور كرائد في الذكاء الاصطناعي. كما يشار إلى الشبكات العصبية، تتكون هذه النماذج من طبقات كثيفة الترابط من العقد التي تمرر المعلومات من خلال بعضها البعض ، مما يحاكي تقريبًا بناء الدماغ البشري. في أوائل عام 2010 ، كانت النماذج الأكثر تقدمًا تحتوي على ملايين المعلمات ، ونماذج تخضع للإشراف الشديد تستخدم لتحليل وتصنيف المشاعر المحددة. النماذج الأكثر تقدمًا اليوم مثل استوديو الأحلام, GPT-3, DALL-E2و صورة تقترب من تريليون معلمة وتنجز مهامًا معقدة وحتى إبداعية تنافس العمل البشري. خذ ، على سبيل المثال ، صورة رأس أو ملخص منشور المدونة هذا. كلاهما تم إنتاجهما بواسطة الذكاء الاصطناعي. لقد بدأنا للتو في رؤية الآثار الاجتماعية والثقافية لهذه النماذج لأنها تشكل كيفية تعلمنا لأشياء جديدة ، والتفاعل مع بعضنا البعض ، والتعبير عن أنفسنا بشكل خلاق.

ومع ذلك ، فإن الكثير من المعرفة الفنية ومجموعات البيانات الرئيسية والقدرة الحسابية على تدريب الشبكات العصبية الكبيرة اليوم هي مصادر مغلقة ومغلقة من قبل شركات "Big Tech" مثل Google و Meta. بينما نماذج متماثلة مفتوحة المصدر مثل جي بي تي-نيوإكس, دال-ميجاو إزهار قد تصدرت من قبل المنظمات بما في ذلك الاستقرار, إليوثيرو تعانق الوجه، web3 مهيأ لشحن ذكاء اصطناعي مفتوح المصدر أكثر.

يمكن أن تقدم طبقة البنية التحتية للويب 3 للذكاء الاصطناعي عناصر لتطوير المصادر المفتوحة ، وملكية المجتمع والحوكمة ، والوصول الشامل الذي يخلق نماذج وكفاءات جديدة في تطوير هذه التقنيات الجديدة."

علاوة على ذلك ، سيتم تعزيز العديد من حالات الاستخدام الحرجة للويب 3 من خلال اعتماد تقنيات الذكاء الاصطناعي. من الفن التوليدي NFTs بالنسبة إلى المناظر الطبيعية المتقاطعة ، سيجد الذكاء الاصطناعي العديد من حالات الاستخدام في web3. يتناسب الذكاء الاصطناعي مفتوح المصدر مع الروح المفتوحة واللامركزية والديمقراطية للويب 3 ويمثل بديلاً للذكاء الاصطناعي الذي توفره شركات التكنولوجيا الكبرى ، والذي من غير المحتمل أن يتم فتحه في أي وقت قريب.

نماذج الأساس هي شبكات عصبية مدربة على مجموعات بيانات واسعة النطاق لأداء المهام التي تتطلب عادةً سلوكًا بشريًا ذكيًا. خلقت هذه النماذج بعض النتائج الرائعة.

نماذج اللغة مثل OpenAI's GPT-3, LaMDA من Googleو نفيديا ميجاترون تورينج NLG لديهم القدرة على فهم وإنتاج لغة طبيعية ، وتلخيص وتوليف النص ، وحتى كتابة كود الكمبيوتر.

DALLE-2 هي شركة OpenAI نموذج نشر النص إلى الصورة يمكنها إنتاج صور فريدة من نص مكتوب. أنتج قسم الذكاء الاصطناعي في Google DeepMind نماذج منافسة بما في ذلك PaLM ، نموذج لغة معلمة 540B ، و Imagen ، نموذج توليد الصور الخاص به الذي يتفوق على DALLE-2 على DrawBench و COCO FID Benchmarks. ينتج Imagen بشكل ملحوظ نتائج أكثر واقعية ولديه القدرة على التهجئة.

نماذج التعلم المعزز مثل نموذج جوجل AlphaGo لقد هزموا الإنسان بطل العالم أثناء اكتشاف استراتيجيات جديدة وتقنيات لعب لم تظهر في تاريخ اللعبة البالغ ثلاثة آلاف عام.

بدأ السباق لبناء نماذج أساس معقدة بالفعل مع Big Tech في طليعة الابتكار. بقدر ما هو مثير للتقدم في هذا المجال ، هناك موضوع رئيسي مثير للقلق.

على مدار العقد الماضي ، أصبحت نماذج الذكاء الاصطناعي أكثر تعقيدًا ، وأصبحت أيضًا منغلقة بشكل متزايد في وجه الجمهور.

يستثمر عمالقة التكنولوجيا بكثافة في إنتاج مثل هذه النماذج والاحتفاظ بالبيانات والرموز كتقنيات مملوكة مع الحفاظ على خندقهم التنافسي من خلال مزايا اقتصاديات الحجم لتدريب النماذج والحساب.

بالنسبة لأي طرف ثالث ، يعد إنتاج نماذج الأساس عملية كثيفة الموارد مع ثلاثة اختناقات رئيسية: بيانات حساب و تسييل.

هنا حيث نرى إنجازات مبكرة لموضوعات web3 في حل بعض هذه المشكلات.

تعتبر مجموعات البيانات المصنفة ضرورية لبناء نماذج فعالة. تتعلم أنظمة الذكاء الاصطناعي من خلال التعميم من الأمثلة الموجودة في مجموعات البيانات والتحسين المستمر أثناء تدريبها بمرور الوقت. ومع ذلك ، يتطلب تجميع مجموعة البيانات عالية الجودة ووضع العلامات معرفة ومعالجة متخصصة بالإضافة إلى الموارد الحسابية. غالبًا ما يكون لدى شركات التكنولوجيا الكبيرة فرق بيانات داخلية متخصصة في العمل مع مجموعات بيانات كبيرة مملوكة و أنظمة IP لتدريب نماذجهم ، وليس لديهم حافز يذكر لفتح الوصول إلى إنتاج أو توزيع بياناتهم.

هناك بالفعل مجتمعات تجعل التدريب النموذجي مفتوحًا ومتاحًا لمجتمع عالمي من الباحثين. وهنا بعض الأمثلة:

  1. الزحف المشترك، وهو مستودع عام لبيانات الإنترنت لمدة عشر سنوات ، يمكن استخدامه للتدريب العام. (على أية حال تظهر الأبحاث أن مجموعات البيانات الأكثر دقة والمختصرة يمكنها تحسين المعرفة العامة عبر المجالات وقدرات التعميم النهائية للنماذج.)
  2. LAION هي منظمة غير ربحية تهدف إلى إتاحة نماذج ومجموعات بيانات للتعلم الآلي على نطاق واسع لعامة الناس وإصدارها لايون 5 ب، مجموعة بيانات زوجية نصوص صور تمت تصفيتها بواسطة CLIP بقيمة 5.85 مليار والتي أصبحت عند الإصدار أكبر مجموعة بيانات نصية للصور يمكن الوصول إليها بشكل مفتوح في العالم.
  3. إليوثير هي مجموعة لامركزية أصدرت واحدة من أكبر مجموعات البيانات النصية مفتوحة المصدر التي يطلق عليها كومة. The Pile عبارة عن مجموعة بيانات باللغة الإنجليزية بحجم 825.18 جيجا بايت لنمذجة اللغة التي تستخدم 22 مصدرًا مختلفًا للبيانات.

حاليًا ، يتم تنظيم هذه المجتمعات بشكل غير رسمي وتعتمد على مساهمات من قاعدة واسعة من المتطوعين. لتكثيف جهودهم ، يمكن استخدام مكافآت الرمز المميز كآلية لإنشاء مجموعات بيانات مفتوحة المصدر. يمكن إصدار الرموز بناءً على المساهمات ، مثل وضع علامة على مجموعة بيانات صورة نصية كبيرة ، ويمكن لمجتمع DAO التحقق من صحة هذه المطالبات. في النهاية ، يمكن للنماذج الكبيرة إصدار الرموز المميزة من مجموعة مشتركة ، ويمكن أن تتراكم الإيرادات النهائية من المنتجات المبنية على أعلى النماذج المذكورة إلى قيمة الرمز المميز. بهذه الطريقة ، يمكن للمساهمين في مجموعة البيانات أن يمتلكوا حصة في النماذج الكبيرة من خلال الرموز المميزة الخاصة بهم ، وسيتمكن الباحثون من استثمار موارد البناء في العراء.

يعد تجميع مجموعات بيانات مفتوحة المصدر جيدة الإنشاء أمرًا بالغ الأهمية لتوسيع إمكانية الوصول إلى البحث للنماذج الكبيرة وتحسين أداء النموذج. يمكن توسيع مجموعات بيانات الصور النصية عن طريق زيادة الحجم والمرشحات لأنواع مختلفة من الصور للحصول على نتائج أكثر دقة. ستكون هناك حاجة إلى مجموعات البيانات غير الإنجليزية لتدريب نماذج اللغة الطبيعية التي يمكن لغير الناطقين باللغة الإنجليزية استخدامها. بمرور الوقت ، يمكننا تحقيق هذه النتائج بشكل أسرع وأكثر انفتاحًا باستخدام نهج web3.

تعد الحوسبة المطلوبة لتدريب الشبكات العصبية واسعة النطاق واحدة من أكبر الاختناقات في نماذج الأساس. على مدى العقد الماضي ، كان الطلب على الحوسبة في تدريب نماذج الذكاء الاصطناعي يتضاعف كل 3.4 شهر. خلال هذه الفترة ، انتقلت نماذج الذكاء الاصطناعي من التعرف على الصور إلى استخدام خوارزميات التعلم المعزز لهزيمة أبطال البشر في الألعاب الإستراتيجية واستخدام المحولات لتدريب نماذج اللغة. على سبيل المثال ، كان لدى GPT-3 الخاص بـ OpenAI 175 مليار معلمة واستغرق تدريب 3,640 بيتافلوبس يومًا. قد يستغرق هذا أسبوعين على أسرع كمبيوتر عملاق في العالم وأكثر من ألف عام لجهاز كمبيوتر محمول قياسي للحساب. نظرًا لأن أحجام النماذج تستمر في النمو فقط ، يظل الحساب يمثل عنق الزجاجة في تقدم المجال.

تتطلب أجهزة الكمبيوتر العملاقة التي تعمل بالذكاء الاصطناعي أجهزة معينة مُحسَّنة لأداء العمليات الحسابية اللازمة لتدريب الشبكات العصبية ، مثل وحدات معالجة الرسومات (GPU) أو الدوائر المتكاملة الخاصة بالتطبيقات (ASICs). اليوم ، يتم التحكم في معظم الأجهزة المحسّنة لهذا النوع من الحسابات بواسطة عدد قليل من مزودي الخدمات السحابية الاحتكارية مثل Google Cloud و Amazon Web Services و Microsoft Azure و IBM Cloud.

هذا هو التقاطع الرئيسي التالي حيث نرى تخصيص الحوسبة اللامركزية من خلال الشبكات العامة والمفتوحة يكتسب زخمًا. يمكن استخدام الحوكمة اللامركزية لتمويل وتخصيص الموارد لتدريب المشاريع التي يقودها المجتمع. علاوة على ذلك ، يمكن الوصول إلى نموذج السوق اللامركزي بشكل مفتوح عبر المناطق الجغرافية بحيث يمكن لأي باحث الوصول إلى موارد الحوسبة. تخيل نظام المكافآت الذي نموذج التمويل الجماعي للتدريب عن طريق إصدار الرموز. ستتلقى عمليات التمويل الجماعي الناجحة حوسبة ذات أولوية لنموذجها وتدفع الابتكارات إلى الأمام حيث يوجد طلب مرتفع. على سبيل المثال ، إذا كان هناك طلب كبير من DAO لإنتاج نموذج GPT إسباني أو هندي لخدمة قطاعات أكبر من السكان ، فيمكن أن يركز البحث على هذا المجال.

بالفعل ، مثل الشركات جينسين تعمل على إطلاق بروتوكولات لتحفيز وصول الأجهزة البديلة والفعالة من حيث التكلفة والقائمة على السحابة وتنسيقها من أجل حساب التعلم العميق. بمرور الوقت ، ستصبح شبكة الحوسبة العالمية المشتركة واللامركزية التي تم إنشاؤها باستخدام البنية التحتية للويب 3 أكثر فعالية من حيث التكلفة لتوسيع نطاقها وخدمتنا بشكل أفضل بينما نستكشف بشكل جماعي حدود الذكاء الاصطناعي.

ستعمل مجموعات البيانات والحساب على تمكين هذه الأطروحة: نماذج الذكاء الاصطناعي مفتوحة المصدر. على مدى السنوات القليلة الماضية ، أصبحت النماذج الكبيرة خاصة بشكل متزايد حيث دفع الاستثمار في الموارد اللازمة لإنتاجها المشاريع لتصبح مغلقة المصدر.

خذ أوبن إيه آي. تأسست شركة OpenAI في عام 2015 كمختبر أبحاث غير ربحي مهمته إنتاج ذكاء عام اصطناعي لصالح البشرية جمعاء ، وهو تناقض صارخ مع قادة الذكاء الاصطناعي في ذلك الوقت ، مثل جوجل وفيسبوك. بمرور الوقت ، أدت المنافسة الشرسة والضغط من أجل التمويل إلى تآكل المثل العليا للشفافية ورمز المصادر المفتوحة مع تحول OpenAI إلى نموذج للربح ووقعت على صفقة تجارية بقيمة مليار دولار مع مايكروسوفت. علاوة على ذلك ، فقد أحاط الجدل الأخير بنموذج النص إلى صورة ، DALLE-2 ، بسبب رقابتها المعممة. (على سبيل المثال ، حظرت DALLE-2 مصطلحات "بندقية" و "تنفيذ" و "هجوم" و "أوكرانيا" وصور المشاهير ؛ تمنع هذه الرقابة الفجة مطالبات مثل "ليبرون جيمس يهاجم السلة" أو "مبرمج ينفذ يحتوي الوصول إلى الإصدار التجريبي الخاص لهذه النماذج على تحيز جغرافي ضمني للمستخدمين الغربيين لقطع مساحات كبيرة من سكان العالم من التفاعل وإبلاغ هذه النماذج.

ليست هذه هي الطريقة التي ينبغي بها نشر الذكاء الاصطناعي: حراسته ، ومراقبته ، والحفاظ عليه من قبل عدد قليل من شركات التكنولوجيا الكبيرة. كما هو الحال مع blockchain ، يجب تطبيق التكنولوجيا الجديدة بشكل منصف قدر الإمكان حتى لا تتركز فوائدها بين القلائل الذين لديهم إمكانية الوصول. يجب الاستفادة من التقدم المركب في الذكاء الاصطناعي بشكل مفتوح عبر مختلف الصناعات ، والمناطق الجغرافية ، والمجتمعات لاكتشاف حالات الاستخدام الأكثر جاذبية والتوصل إلى توافق في الآراء بشأن الاستخدام العادل للذكاء الاصطناعي. يمكن أن يضمن الاحتفاظ بنماذج الأساس مفتوحة المصدر منع الرقابة ومراقبة التحيز بعناية تحت نظر الجمهور.

من خلال بنية رمزية لنماذج الأساس المعممة ، سيكون من الممكن تجميع مجموعة أكبر من المساهمين الذين يمكنهم تحقيق الدخل من عملهم أثناء إطلاق كود مفتوح المصدر. كان على مشاريع مثل OpenAI التي تم إنشاؤها مع وضع أطروحة مفتوحة المصدر في الاعتبار أن تتحول إلى شركة ممولة قائمة بذاتها للتنافس على المواهب والموارد. يسمح Web3 للمشاريع مفتوحة المصدر بأن تكون مربحة من الناحية المالية ومنافسة بشكل أكبر لتلك التي تقودها استثمارات خاصة من قبل Big Tech. علاوة على ذلك ، يمكن للمبتكرين الذين يبنون منتجات فوق نماذج مفتوحة المصدر أن يبنوا بثقة أن هناك شفافية في الذكاء الاصطناعي الأساسي. سيكون التأثير النهائي لهذا هو الاعتماد السريع والذهاب إلى السوق لحالات استخدام الذكاء الاصطناعي الجديدة. في مساحة web3 ، يتضمن ذلك التطبيقات الأمنية التي تجري تحليلات تنبؤية لثغرات العقود الذكية وسحب البساط ، مولدات الصور التي يمكن استخدامها لصك NFTs وإنشاء مناظر طبيعية metaverse ، شخصيات الذكاء الاصطناعي الرقمية يمكن أن توجد على السلسلة للحفاظ على الملكية الفردية ، وأكثر من ذلك بكثير.

الذكاء الاصطناعي هو أحد أسرع التقنيات تقدمًا اليوم والتي سيكون لها آثار هائلة على مجتمعنا ككل. اليوم ، تهيمن التكنولوجيا الكبيرة على هذا المجال حيث أن الاستثمارات المالية في المواهب والبيانات والحسابات تخلق خنادق مهمة لتطوير المصادر المفتوحة. يعد دمج web3 في طبقة البنية التحتية للذكاء الاصطناعي خطوة حاسمة يجب اتخاذها للتأكد من أن أنظمة الذكاء الاصطناعي مبنية بطريقة عادلة ومنفتحة ويمكن الوصول إليها. نحن نشهد بالفعل نماذج مفتوحة تتخذ موقفًا من الابتكار العام السريع في المساحات المفتوحة مثل Twitter و HuggingFace و crypto يمكن أن تعزز هذه الجهود للمضي قدمًا.

إليك ما يبحث عنه فريق CoinFund عند تقاطع الذكاء الاصطناعي والعملات المشفرة:

  1. فرق ذات ذكاء اصطناعي مفتوح في صميم مهمتها
  2. المجتمعات التي تنظم الموارد العامة مثل البيانات والحساب للمساعدة في بناء نماذج الذكاء الاصطناعي
  3. المنتجات التي تستخدم الذكاء الاصطناعي لجلب الإبداع والأمان والابتكار لتعميم التبني

إذا كنت تبني مشروعًا على تقاطع الذكاء الاصطناعي والويب 3 ، فتحدث معنا من خلال التواصل مع CoinFund على تويتر أو عبر البريد الالكتروني ريشين@coinfund.io or جيك@coinfund.io.

الطابع الزمني:

اكثر من صندوق العملة