تقوم Microsoft Research بتدريب الشبكات العصبية لفهم ما يقرؤونه

عقدة المصدر: 805386

قراءة الشبكات العصبية
المصدر https://www.quantamagazine.org/machines-beat-humans-on-a-reading-test-but-do-they-understand-20191017/

 

بدأت مؤخرًا رسالة إخبارية جديدة تركز على تعليم الذكاء الاصطناعي و لديها بالفعل أكثر من 50,000 مشترك. TheSequence هي رسالة إخبارية تركز على الذكاء الاصطناعي وتستغرق 5 دقائق لقراءتها (بمعنى عدم وجود ضجة أو أخبار وما إلى ذلك). الهدف هو إبقائك على اطلاع دائم بمشاريع التعلم الآلي والأوراق البحثية والمفاهيم. يرجى المحاولة بالاشتراك أدناه:

صورة

يعد فهم القراءة الآلية (MRC) نظامًا ناشئًا في مجال التعلم العميق. من وجهة نظر مفاهيمية، يركز مركز موارد المهاجرين على نماذج التعلم العميق التي يمكنها الإجابة على أسئلة ذكية حول مستندات نصية محددة. بالنسبة للبشر، يعد فهم القراءة مهارة معرفية أصلية تم تطويرها منذ الأيام الأولى للمدرسة أو حتى قبل ذلك. عندما نقرأ نصًا، فإننا نستخرج بشكل غريزي الأفكار الأساسية التي ستسمح لنا بالإجابة على الأسئلة المستقبلية حول هذا الموضوع. وفي حالة نماذج الذكاء الاصطناعي، لا تزال هذه المهارة متخلفة إلى حد كبير.

ركز الجيل الأول من تقنيات فهم اللغة الطبيعية (NLU) المعتمد على نطاق واسع في الغالب على اكتشاف النوايا والمفاهيم المرتبطة بجملة معينة. يمكننا أن نفكر في هذه النماذج باعتبارها المستوى الأول من المعرفة لتمكين القراءة والفهم. ومع ذلك، يحتاج الفهم الكامل للقراءة الآلية إلى وحدات بناء إضافية يمكنها استقراء الأسئلة وربطها بأقسام معينة من النص وبناء المعرفة من أقسام محددة من المستند.

أحد أكبر التحديات في مجال مركز موارد المهاجرين هو أن معظم النماذج تعتمد على التدريب الخاضع للإشراف باستخدام مجموعات البيانات التي لا تحتوي على المستندات فحسب، بل على الأسئلة والأجوبة المحتملة. وكما يمكنك أن تتخيل، فإن هذا النهج ليس من الصعب جدًا توسيع نطاقه فحسب، بل من المستحيل عمليًا تنفيذه في بعض المجالات التي لا تتوفر فيها البيانات ببساطة. مؤخرًا، اقترح باحثون من Microsoft طريقة مثيرة للاهتمام للتعامل مع هذا التحدي في خوارزميات MRC.

في ورقة بعنوان "شبكات تركيبية ذات مرحلتين لنقل التعلم في فهم الآلة"قدمت أبحاث مايكروسوفت تقنية تسمى شبكات التوليف ذات المرحلتين أو سينت يطبق نقل التعلم لتقليل الجهد المبذول لتدريب نموذج مركز موارد المهاجرين. سينت يمكن اعتباره نهجًا من مرحلتين لبناء المعرفة المتعلقة بنص معين. في المرحلة الأولى، سينت يتعلم نمطًا عامًا لتحديد "الأشياء المثيرة للاهتمام" المحتملة في مستند نصي. هذه هي نقاط المعرفة الرئيسية، أو الكيانات المسماة، أو المفاهيم الدلالية التي عادة ما تكون إجابات قد يسأل عنها الأشخاص. ثم، في المرحلة الثانية، يتعلم النموذج تكوين أسئلة اللغة الطبيعية حول هذه الإجابات المحتملة، في سياق المقالة.

الشيء الرائع عنه سينت هو أنه، بمجرد التدريب، يمكن تطبيق النموذج على مجال جديد، وقراءة المستندات الموجودة في المجال الجديد ثم إنشاء أسئلة وإجابات زائفة مقابل هذه المستندات. وبعد ذلك، يقوم بتكوين بيانات التدريب اللازمة لتدريب نظام MRC لهذا المجال الجديد، والذي يمكن أن يكون مرضًا جديدًا، أو دليل موظف لشركة جديدة، أو دليل منتج جديد.

يربط العديد من الأشخاص خطأً تقنية MRC مع مجال الترجمة الآلية الأكثر تطوراً. في حالة نماذج MRC مثل سينتالتحدي هو أنهم بحاجة إلى تجميع كلا السؤالين و  إجابات للوثيقة. في حين أن السؤال عبارة عن جملة لغة طبيعية بطلاقة من الناحية النحوية، فإن الإجابة غالبًا ما تكون مفهومًا دلاليًا بارزًا في الفقرة، مثل كيان مسمى، أو إجراء، أو رقم. وبما أن الإجابة لها بنية لغوية مختلفة عن السؤال، فقد يكون من الأنسب عرض الإجابات والأسئلة كنوعين مختلفين من البيانات. سينت تتجسد في تلك النظرية من خلال تحليل عملية توليد أزواج الأسئلة والأجوبة إلى خطوتين أساسيتين: توليد الإجابة المشروطة بالفقرة وتوليد السؤال المشروط بالفقرة والإجابة.


قراءة الشبكات العصبية
حقوق الصورة: Microsoft Research

 

يمكنك التفكير سينت كمدرس جيد جدًا في توليد الأسئلة من المستندات بناءً على خبرته. وعندما يتعرف على الأسئلة ذات الصلة في مجال واحد، يمكنه تطبيق نفس الأنماط على المستندات في مجال جديد. قام باحثو مايكروسوفت بتطبيق مبادئ سينت لنماذج MRC المختلفة بما في ذلك المنشورة مؤخرًا ريزونت والتي أظهرت الكثير من الأمل في جعل فهم القراءة الآلية حقيقة واقعة في المستقبل القريب.

 
أصلي. تم إعادة النشر بإذن.

هذا الموضوع ذو علاقة بـ:

المصدر: https://www.kdnuggets.com/2021/04/microsoft-research-trains-neural-networks-understand-read.html

الطابع الزمني:

اكثر من KD nuggets