إنشاء حافة معلومات مع إمكانية الوصول إلى البيانات عن طريق المحادثة

أعاد نشره أفلاطون

المتابعون: 0

الذكاء الاصطناعي للمحادثة لتحليل البيانات

الشكل 1: تمثيل تدفق Text2SQL

نظرًا لأن عالمنا أصبح عالميًا وديناميكيًا ، فإن الشركات تعتمد بشكل متزايد على البيانات لاتخاذ قرارات مستنيرة وموضوعية وفي الوقت المناسب. ومع ذلك ، اعتبارًا من الآن ، فإن إطلاق العنان للإمكانات الكاملة للبيانات التنظيمية غالبًا ما يكون امتيازًا لعدد قليل من علماء ومحللي البيانات. لا يتقن معظم الموظفين مجموعة أدوات علوم البيانات التقليدية (SQL ، Python ، R وما إلى ذلك). للوصول إلى البيانات المطلوبة ، ينتقلون عبر طبقة إضافية حيث يقوم المحللون أو فرق ذكاء الأعمال "بترجمة" نثر أسئلة الأعمال إلى لغة البيانات. إن احتمال الاحتكاك وعدم الكفاءة في هذه الرحلة مرتفع - على سبيل المثال ، قد يتم تسليم البيانات مع تأخير أو حتى عندما يصبح السؤال قديمًا بالفعل. قد تضيع المعلومات على طول الطريق عندما لا تتم ترجمة المتطلبات بدقة إلى استعلامات تحليلية. إلى جانب ذلك ، يتطلب إنشاء رؤى عالية الجودة نهجًا تكراريًا يتم تثبيطه مع كل خطوة إضافية في الحلقة. على الجانب الآخر ، تخلق هذه التفاعلات المخصصة اضطرابًا لموهبة البيانات باهظة الثمن وتشتت انتباههم عن المزيد من أعمال البيانات الاستراتيجية ، كما هو موضح في "اعترافات" عالم البيانات:

عندما كنت في Square وكان الفريق أصغر ، كان لدينا تناوب "التحليلات عند الطلب" المخيف. تم تناوبها بشكل صارم على أساس أسبوعي ، وإذا جاء دورك ، فأنت تعلم أنك ستنجز القليل جدًا من العمل "الحقيقي" في ذلك الأسبوع وتقضي معظم وقتك في الإجابة عن أسئلة مخصصة من مختلف فرق المنتجات والعمليات في شركة (قرد SQL ، أطلقنا عليها اسم). كانت هناك منافسة شديدة على أدوار المدير في فريق التحليلات وأعتقد أن هذا كان نتيجة إعفاء المديرين من هذا التناوب - لا يمكن لجائزة الحالة أن تنافس جزرة عدم القيام بعمل تحت الطلب. [1]

في الواقع ، أليس من الرائع التحدث مباشرة إلى بياناتك بدلاً من الاضطرار إلى المرور بجولات متعددة من التفاعل مع موظفي البيانات لديك؟ يتم تبني هذه الرؤية من خلال واجهات المحادثة التي تسمح للبشر بالتفاعل مع البيانات باستخدام اللغة ، وهي قناة الاتصال الأكثر بديهية وعالمية. بعد تحليل السؤال ، تقوم الخوارزمية بترميزه في شكل منطقي منظم في لغة الاستعلام المفضلة ، مثل SQL. وبالتالي ، يمكن للمستخدمين غير التقنيين الدردشة مع بياناتهم والحصول بسرعة على معلومات محددة وذات صلة وفي الوقت المناسب ، دون القيام بالانعطاف عبر فريق ذكاء الأعمال. في هذه المقالة ، سننظر في جوانب التنفيذ المختلفة لـ Text2SQL ونركز على الأساليب الحديثة مع استخدام نماذج اللغات الكبيرة (LLMs) ، والتي تحقق أفضل أداء حتى الآن (راجع [2] ؛ لإجراء مسح حول الأساليب البديلة فيما وراء LLMs ، يشار إلى القراء [3]). تم تنظيم المقالة وفقًا "للنموذج العقلي" التالي للعناصر الرئيسية التي يجب مراعاتها عند تخطيط وبناء ميزة الذكاء الاصطناعي:

الذكاء الاصطناعي للمحادثة لتحليل البيانات — الشكل 2: النموذج العقلي لميزة الذكاء الاصطناعي

لنبدأ بالنهاية في الاعتبار ونلخص القيمة - لماذا ستنشئ ميزة Text2SQL في بياناتك أو منتج التحليلات. الفوائد الرئيسية الثلاثة هي:

مستخدمي الأعمال يمكن الوصول إلى البيانات التنظيمية بطريقة مباشرة وفي الوقت المناسب.
هذا يخفف علماء ومحللي البيانات من عبء الطلبات المخصصة من مستخدمي الأعمال ويسمح لهم بالتركيز على تحديات البيانات المتقدمة.
هذا يسمح لـ الأعمال للاستفادة من بياناتها بطريقة أكثر مرونة واستراتيجية ، وتحويلها في النهاية إلى أساس متين لاتخاذ القرار.

الآن ، ما هي سيناريوهات المنتج التي قد تفكر فيها في Text2SQL؟ الإعدادات الثلاثة الرئيسية هي:

أنت تقدم أ بيانات قابلة للتطوير / منتج BI وتريد تمكين المزيد من المستخدمين من الوصول إلى بياناتهم بطريقة غير تقنية ، وبالتالي زيادة الاستخدام وقاعدة المستخدمين. كمثال ، ServiceNow لديها استعلامات البيانات المتكاملة في عرض محادثة أكبرو أطلان لديها مؤخرا أعلن عن استكشاف البيانات باللغة الطبيعية.
أنت تتطلع إلى بناء شيء ما في مساحة البيانات / الذكاء الاصطناعي لإضفاء الطابع الديمقراطي على الوصول إلى البيانات في الشركات ، وفي هذه الحالة يمكنك التفكير في MVP مع Text2SQL في الصميم. مقدمي مثل AI2SQL و Text2sql.ai بدأوا بالفعل في الدخول في هذا الفضاء.
أنت تعمل على ملف نظام BI المخصص وتريد تعظيم ودمقرطة استخدامها في الشركة الفردية.

كما سنرى في الأقسام التالية ، يتطلب Text2SQL إعدادًا مقدمًا غير بسيط. لتقدير عائد الاستثمار ، ضع في اعتبارك طبيعة القرارات التي يجب دعمها وكذلك البيانات المتاحة. يمكن أن يكون Text2SQL مكسبًا مطلقًا في البيئات الديناميكية حيث تتغير البيانات بسرعة وتستخدم بنشاط وبشكل متكرر في صنع القرار ، مثل الاستثمار والتسويق والتصنيع وصناعة الطاقة. في هذه البيئات ، تكون الأدوات التقليدية لإدارة المعرفة ثابتة للغاية ، والطرق الأكثر طلاقة للوصول إلى البيانات والمعلومات تساعد الشركات على توليد ميزة تنافسية. من حيث البيانات ، يوفر Text2SQL أكبر قيمة مع قاعدة بيانات وهي:

كبيرة ومتنامية، بحيث يمكن لـ Text2SQL الكشف عن قيمته بمرور الوقت حيث يتم الاستفادة من المزيد والمزيد من البيانات.
جودة عالية، بحيث لا يتعين على خوارزمية Text2SQL التعامل مع الضوضاء المفرطة (التناقضات والقيم الفارغة وما إلى ذلك) في البيانات. بشكل عام ، تتمتع البيانات التي يتم إنشاؤها تلقائيًا بواسطة التطبيقات بجودة واتساق أعلى من البيانات التي يتم إنشاؤها والحفاظ عليها من قبل البشر.
ناضجة معنويًا على عكس الخام ، بحيث يمكن للبشر الاستعلام عن البيانات بناءً على المفاهيم والعلاقات والمقاييس المركزية الموجودة في نموذجهم العقلي. لاحظ أنه يمكن تحقيق النضج الدلالي من خلال خطوة تحويل إضافية تتوافق مع البيانات الأولية في هيكل مفاهيمي (راجع قسم "إثراء الموجه بمعلومات قاعدة البيانات").

في ما يلي ، سنتعمق في البيانات والخوارزمية وتجربة المستخدم ، بالإضافة إلى المتطلبات غير الوظيفية ذات الصلة لميزة Text2SQL. تمت كتابة المقالة لمديري المنتجات ومصممي UX وعلماء ومهندسي البيانات الذين هم في بداية رحلة Text2SQL. بالنسبة لهؤلاء الأشخاص ، فإنه لا يوفر دليلًا للبدء فحسب ، بل يوفر أيضًا أرضية مشتركة للمعرفة للمناقشات حول الواجهات بين المنتج والتكنولوجيا والأعمال ، بما في ذلك المفاضلات ذات الصلة. إذا كنت بالفعل أكثر تقدمًا في التنفيذ ، فإن المراجع في النهاية توفر مجموعة من الغوصات العميقة لاستكشافها.

إذا كان هذا المحتوى التعليمي المتعمق مفيدًا لك ، فيمكنك ذلك اشترك في القائمة البريدية لأبحاث الذكاء الاصطناعي ليتم تنبيهنا عندما نصدر مادة جديدة.

1. البيانات

يبدأ أي مسعى للتعلم الآلي بالبيانات ، لذلك سنبدأ بتوضيح هيكل بيانات الإدخال والهدف التي يتم استخدامها أثناء التدريب والتنبؤ. في جميع أنحاء المقالة ، سوف نستخدم تدفق Text2SQL من الشكل 1 كتمثيل قيد التشغيل ، وسنسلط الضوء على المكونات والعلاقات المدروسة حاليًا باللون الأصفر.

1.1 شكل وهيكل البيانات

عادة ، يتكون زوج الإدخال والمخرج الأولي من Text2SQL من سؤال اللغة الطبيعية واستعلام SQL المقابل ، على سبيل المثال:

سؤال"اذكر اسم وعدد المتابعين لكل مستخدم ".

استعلام SQL:

حدد اسم المتابعين من user_profiles

في مساحة بيانات التدريب ، يكون التعيين بين الأسئلة واستعلامات SQL متعددًا:

يمكن تعيين استعلام SQL للعديد من الأسئلة المختلفة في اللغة الطبيعية ؛ على سبيل المثال ، يمكن التعبير عن دلالات الاستعلام أعلاه من خلال: "أرني أسماء وأعداد المتابعين لكل مستخدم"،"كم عدد المتابعين لكل مستخدم؟"الخ
تعد بنية SQL متعددة الاستخدامات ، ويمكن تمثيل كل سؤال تقريبًا في SQL بطرق متعددة. أبسط مثال على ذلك هو ترتيب مختلف لجمل WHERE. في موقف أكثر تقدمًا ، سيعرف كل من أجرى تحسين استعلام SQL أن العديد من الطرق تؤدي إلى نفس النتيجة ، وقد يكون للاستعلامات المكافئة لغويًا بنية مختلفة تمامًا.

يعد التجميع اليدوي لبيانات التدريب لـ Text2SQL مملاً بشكل خاص. لا يتطلب الأمر فقط إتقان SQL من جانب المعلق ، بل يتطلب أيضًا مزيدًا من الوقت لكل مثال أكثر من المهام اللغوية العامة مثل تحليل المشاعر وتصنيف النص. لضمان كمية كافية من أمثلة التدريب ، يمكن استخدام زيادة البيانات - على سبيل المثال ، يمكن استخدام LLM لإنشاء إعادة صياغة لنفس السؤال. [3] يوفر مسحًا أكثر اكتمالاً لتقنيات زيادة بيانات Text2SQL.

1.2 إثراء الموجه بمعلومات قاعدة البيانات

Text2SQL عبارة عن خوارزمية في الواجهة بين البيانات غير المهيكلة والمنظمة. للحصول على الأداء الأمثل ، يجب أن يكون كلا النوعين من البيانات موجودًا أثناء التدريب والتنبؤ. على وجه التحديد ، يجب أن تعرف الخوارزمية على قاعدة البيانات التي تم الاستعلام عنها وأن تكون قادرة على صياغة الاستعلام بطريقة يمكن تنفيذها على قاعدة البيانات. يمكن أن تشمل هذه المعرفة:

أعمدة وجداول قاعدة البيانات
العلاقات بين الجداول (مفاتيح خارجية)
محتوى قاعدة البيانات

هناك خياران لدمج معرفة قاعدة البيانات: من ناحية أخرى ، يمكن أن تقتصر بيانات التدريب على أمثلة مكتوبة لقاعدة بيانات محددة ، وفي هذه الحالة يتم تعلم المخطط مباشرة من استعلام SQL وتعيينه إلى السؤال. يسمح إعداد قاعدة البيانات الفردية هذا بتحسين الخوارزمية لقاعدة بيانات فردية و / أو شركة. ومع ذلك ، فإنه يقضي على أي طموحات تتعلق بقابلية التوسع ، نظرًا لأن النموذج يحتاج إلى ضبط دقيق لكل عميل أو قاعدة بيانات. بدلاً من ذلك ، في إعداد قواعد البيانات المتعددة ، يمكن توفير مخطط قاعدة البيانات كجزء من الإدخال ، مما يسمح للخوارزمية بـ "التعميم" على مخططات قاعدة البيانات الجديدة غير المرئية. بينما ستحتاج تمامًا إلى اتباع هذا النهج إذا كنت تريد استخدام Text2SQL في العديد من قواعد البيانات المختلفة ، ضع في اعتبارك أنه يتطلب جهدًا هندسيًا سريعًا كبيرًا. بالنسبة لأي قاعدة بيانات أعمال معقولة ، فإن تضمين المعلومات الكاملة في الموجه سيكون غير فعال للغاية وربما مستحيلًا بسبب قيود الطول الفوري. وبالتالي ، يجب أن تكون الوظيفة المسؤولة عن الصياغة السريعة ذكية بما يكفي لاختيار مجموعة فرعية من معلومات قاعدة البيانات الأكثر "فائدة" لسؤال معين ، والقيام بذلك لقواعد البيانات التي يحتمل أن تكون غير مرئية.

أخيرًا ، تلعب بنية قاعدة البيانات دورًا مهمًا. في تلك السيناريوهات حيث يكون لديك تحكم كافٍ في قاعدة البيانات ، يمكنك جعل حياة نموذجك أسهل من خلال السماح له بالتعلم من بنية بديهية. كقاعدة عامة ، كلما كانت قاعدة بياناتك تعكس كيف يتحدث مستخدمو الأعمال عن الأعمال التجارية ، كلما كان نموذجك أفضل وأسرع يمكن أن يتعلم منه. وبالتالي ، ضع في اعتبارك تطبيق تحويلات إضافية على البيانات ، مثل تجميع البيانات المنسقة أو المشتتة بطريقة أخرى في جداول عريضة أو قبو بيانات ، وتسمية الجداول والأعمدة بطريقة واضحة وغير غامضة ، إلخ. جميع المعارف التجارية التي يمكنك ترميزها مسبقًا ستقلل عبء التعلم الاحتمالي على نموذجك ويساعدك على تحقيق نتائج أفضل.

2. خوارزمية

Text2SQL هو نوع من ملفات الاعراب الدلالي - ربط النصوص بالتمثيلات المنطقية. وبالتالي ، فإن الخوارزمية ليس عليها فقط "تعلم" اللغة الطبيعية ، ولكن أيضًا التمثيل المستهدف - في حالتنا ، SQL. على وجه التحديد ، يجب أن يكتسب وأجزاء المعرفة التالية:

بناء جملة SQL ودلالاتها
هيكل قاعدة البيانات
فهم اللغة الطبيعية (NLU)
رسم الخرائط بين استعلامات اللغة الطبيعية و SQL (نحوي ومعجمي ودلالي)

2.1 حل المتغيرات اللغوية في المدخلات

عند الإدخال ، يكمن التحدي الرئيسي لـ Text2SQL في مرونة اللغة: كما هو موضح في قسم تنسيق البيانات وهيكلها ، يمكن إعادة صياغة السؤال نفسه بعدة طرق مختلفة. بالإضافة إلى ذلك ، في سياق المحادثة الواقعية ، يتعين علينا التعامل مع عدد من القضايا مثل الأخطاء الإملائية والنحوية ، والمدخلات غير المكتملة والغامضة ، والمدخلات متعددة اللغات ، إلخ.

تقترب LLM مثل نماذج GPT و T5 و CodeX من حل هذا التحدي. التعلم من كميات هائلة من النصوص المتنوعة ، يتعلمون كيفية التعامل مع عدد كبير من الأنماط والمخالفات اللغوية. في النهاية ، يصبحون قادرين على التعميم على الأسئلة المتشابهة لغويًا على الرغم من وجود أشكال سطحية مختلفة. يمكن تطبيق LLMs خارج الصندوق (بدون طلقة) أو بعد الضبط الدقيق. السابق ، رغم أنه مريح ، يؤدي إلى دقة أقل. يتطلب الأخير مزيدًا من المهارة والعمل ، ولكن يمكن أن يزيد الدقة بشكل كبير.

من حيث الدقة ، كما هو متوقع ، فإن أفضل النماذج أداءً هي أحدث طرازات عائلة GPT بما في ذلك طرازات CodeX. في أبريل 2023 ، أدى GPT-4 إلى زيادة كبيرة في الدقة بأكثر من 5٪ مقارنة بأحدث التقنيات السابقة وحقق دقة قدرها 85.3٪ (على مقياس "التنفيذ بالقيم"). [4] في معسكر المصادر المفتوحة ، ركزت المحاولات الأولية لحل لغز Text2SQL على نماذج التشفير التلقائي مثل BERT ، والتي تتفوق في مهام NLU. [5 ، 6 ، 7] ومع ذلك ، وسط الضجيج حول الذكاء الاصطناعي التوليدي ، تركز الأساليب الحديثة على نماذج الانحدار التلقائي مثل طراز T5. تم تدريب T5 مسبقًا باستخدام التعلم متعدد المهام وبالتالي يتكيف بسهولة مع المهام اللغوية الجديدة ، بما في ذلك. المتغيرات المختلفة للتحليل الدلالي. ومع ذلك ، فإن النماذج الانحدارية الذاتية لها عيب جوهري عندما يتعلق الأمر بمهام التحليل الدلالي: فهي تحتوي على مساحة إخراج غير مقيدة ولا توجد حواجز حماية دلالية من شأنها تقييد إنتاجها ، مما يعني أنها يمكن أن تصبح مبدعة بشكل مذهل في سلوكها. في حين أن هذه أشياء رائعة لإنشاء محتوى حر ، إلا أنها مصدر إزعاج لمهام مثل Text2SQL حيث نتوقع إخراجًا مستهدفًا مقيدًا ومنظمًا جيدًا.

2.2 التحقق من صحة الاستعلام والتحسين

لتقييد ناتج LLM ، يمكننا تقديم آليات إضافية للتحقق من صحة الاستعلام وتحسينه. يمكن تنفيذ ذلك كخطوة تحقق إضافية ، كما هو مقترح في نظام PICARD. [8] يستخدم PICARD محلل SQL يمكنه التحقق مما إذا كان استعلام SQL الجزئي يمكن أن يؤدي إلى استعلام SQL صالح بعد الإكمال. في كل خطوة إنشاء بواسطة LLM ، يتم رفض الرموز المميزة التي من شأنها إبطال الاستعلام ، ويتم الاحتفاظ بالرموز الصالحة ذات الاحتمالية الأعلى. نظرًا لكونه حتميًا ، فإن هذا النهج يضمن صحة SQL بنسبة 100٪ طالما أن المحلل اللغوي يراقب قواعد SQL الصحيحة. كما أنه يفصل التحقق من صحة الاستعلام عن الجيل ، مما يسمح بالحفاظ على كلا المكونين بشكل مستقل عن بعضهما البعض وترقية وتعديل LLM.

نهج آخر هو دمج المعرفة الهيكلية ومعرفة SQL مباشرة في LLM. على سبيل المثال ، تستخدم Graphix [9] طبقات مدركة للرسم البياني لإدخال معرفة SQL منظمة في نموذج T5. نظرًا للطبيعة الاحتمالية لهذا النهج ، فإنه يحيز النظام نحو الاستعلامات الصحيحة ، ولكنه لا يوفر ضمانًا للنجاح.

أخيرًا ، يمكن استخدام LLM كعامل متعدد الخطوات يمكنه التحقق من الاستعلام وتحسينه بشكل مستقل. [10] باستخدام خطوات متعددة في موجه سلسلة الأفكار ، يمكن تكليف الوكيل بالتفكير في صحة استفساراته وتحسين أي عيوب. إذا كان لا يزال من الممكن تنفيذ الاستعلام الذي تم التحقق من صحته ، يمكن تمرير تتبع الاستثناء SQL إلى العامل كتعليقات إضافية للتحسين.

بالإضافة إلى هذه الأساليب الآلية التي تحدث في الخلفية ، من الممكن أيضًا إشراك المستخدم أثناء عملية التحقق من الاستعلام. سوف نصف هذا بمزيد من التفصيل في القسم الخاص بتجربة المستخدم.

تقييم 2.3

لتقييم خوارزمية Text2SQL الخاصة بنا ، نحتاج إلى إنشاء مجموعة بيانات اختبار (التحقق من الصحة) وتشغيل الخوارزمية عليها وتطبيق مقاييس التقييم ذات الصلة على النتيجة. ستعتمد مجموعة البيانات الساذجة المقسمة إلى بيانات تدريب وتطوير وتحقق من الصحة على أزواج أسئلة واستعلام وتؤدي إلى نتائج دون المستوى الأمثل. قد يتم الكشف عن استفسارات التحقق من الصحة للنموذج أثناء التدريب وتؤدي إلى رؤية مفرطة في التفاؤل حول مهارات التعميم. أ تقسيم على أساس الاستعلام، حيث يتم تقسيم مجموعة البيانات بحيث لا يظهر أي استعلام أثناء التدريب وأثناء التحقق من الصحة ، يوفر نتائج أكثر صدقًا.

فيما يتعلق بمقاييس التقييم ، ما يهمنا في Text2SQL هو عدم إنشاء استعلامات مطابقة تمامًا للمعيار الذهبي. هذا "مطابقة تامة للسلسلة" الطريقة صارمة للغاية وستؤدي إلى العديد من السلبيات الخاطئة ، نظرًا لأن استعلامات SQL المختلفة يمكن أن تؤدي إلى نفس مجموعة البيانات التي تم إرجاعها. بدلاً من ذلك ، نريد تحقيق نسبة عالية الدقة الدلالية وتقييم ما إذا كانت طلبات البحث المتوقعة و "المعيار الذهبي" ستعيد دائمًا نفس مجموعات البيانات. هناك ثلاثة مقاييس للتقييم تقترب من هذا الهدف:

دقة المطابقة الدقيقة: يتم تقسيم استعلامات SQL المُنشأة والمستهدفة إلى مكوناتها ، وتتم مقارنة المجموعات الناتجة من أجل الهوية. [11] يتمثل العيب هنا في أنه يفسر فقط اختلافات الطلبات في استعلام SQL ، ولكن ليس للاختلافات النحوية الأكثر وضوحًا بين الاستعلامات المكافئة لغويًا.
دقة التنفيذ: تتم مقارنة مجموعات البيانات الناتجة عن استعلامات SQL المُنشأة والمستهدفة من أجل الهوية. مع الحظ الجيد ، لا يزال بإمكان الاستعلامات ذات الدلالات المختلفة اجتياز هذا الاختبار على طبعة قاعدة بيانات معينة. على سبيل المثال ، بافتراض وجود قاعدة بيانات يزيد عمر جميع المستخدمين فيها عن 30 عامًا ، فإن الاستعلامين التاليين سيعرضان نتائج متطابقة على الرغم من وجود دلالات مختلفة:
حدد * من المستخدم
حدد * من المستخدم حيث العمر> 30
دقة مجموعة الاختبار: دقة مجموعة الاختبار هي نسخة أكثر تقدمًا وأقل تساهلاً لدقة التنفيذ. لكل استعلام ، يتم إنشاء مجموعة ("مجموعة اختبار") من قواعد البيانات التي يتم تمييزها بدرجة كبيرة فيما يتعلق بالمتغيرات والشروط والقيم في الاستعلام. بعد ذلك ، يتم اختبار دقة التنفيذ في كل من قواعد البيانات هذه. بينما يتطلب هذا المقياس جهدًا إضافيًا لتصميم جيل مجموعة الاختبار ، فإن هذا المقياس يقلل بشكل كبير من مخاطر الإيجابيات الزائفة في التقييم.[12]

3. تجربة المستخدم

لا تسمح الحالة الحالية لـ Text2SQL بدمج سلس تمامًا في أنظمة الإنتاج - بدلاً من ذلك ، من الضروري إدارة توقعات وسلوك المستخدم بفعالية ، والذي يجب أن يكون دائمًا على دراية بأنه يتفاعل معه نظام ذكاء اصطناعي.

3.1 إدارة الفشل

يمكن أن تفشل Text2SQL في وضعين ، يجب أن يتم اكتشافهما بطرق مختلفة:

أخطاء SQL: الاستعلام الذي تم إنشاؤه غير صالح - إما أن SQL غير صالح ، أو لا يمكن تنفيذه على قاعدة بيانات معينة بسبب عيوب معجمية أو دلالية. في هذه الحالة ، لا يمكن إرجاع أي نتيجة للمستخدم.
الأخطاء الدلالية: الاستعلام الذي تم إنشاؤه صحيح ولكنه لا يعكس دلالات السؤال ، مما يؤدي إلى إرجاع مجموعة بيانات خاطئة.

يعتبر الوضع الثاني صعبًا بشكل خاص لأن مخاطر "الإخفاقات الصامتة" - الأخطاء التي لا يكتشفها المستخدم - مرتفعة. لن يكون لدى المستخدم النموذجي الوقت ولا المهارة الفنية للتحقق من صحة الاستعلام و / أو البيانات الناتجة. عند استخدام البيانات في صنع القرار في العالم الحقيقي ، يمكن أن يكون لهذا النوع من الفشل عواقب وخيمة. لتجنب ذلك ، من الأهمية بمكان تثقيف المستخدمين وإنشاء الدرابزين على مستوى الأعمال التي تحد من التأثير المحتمل ، مثل فحوصات البيانات الإضافية للقرارات ذات التأثير الأكبر. من ناحية أخرى ، يمكننا أيضًا استخدام واجهة المستخدم لإدارة التفاعل بين الإنسان والآلة ومساعدة المستخدم على اكتشاف الطلبات ذات المشكلات وتحسينها.

3.2 التفاعل بين الإنسان والآلة

يمكن للمستخدمين الانخراط في نظام الذكاء الاصطناعي الخاص بك بدرجات مختلفة من الشدة. يمكن أن يؤدي المزيد من التفاعل لكل طلب إلى نتائج أفضل ، ولكنه يؤدي أيضًا إلى إبطاء سيولة تجربة المستخدم. إلى جانب التأثير السلبي المحتمل للاستعلامات والنتائج الخاطئة ، ضع في اعتبارك أيضًا مدى تحفيز المستخدمين لديك لتقديم تعليقات ذهابًا وإيابًا من أجل الحصول على نتائج أكثر دقة والمساعدة أيضًا في تحسين المنتج على المدى الطويل.

الطريقة الأسهل والأقل جاذبية هي العمل بدرجات الثقة. في حين أن الحساب الساذج للثقة كمتوسط احتمالات الرموز التي تم إنشاؤها هو مفرط في التبسيط ، يمكن استخدام طرق أكثر تقدمًا مثل التعليقات اللفظية. [13] يمكن عرض الثقة في الواجهة وإبرازها بتنبيه صريح في حالة انخفاضها بشكل خطير. بهذه الطريقة ، تقع مسؤولية المتابعة المناسبة في "العالم الحقيقي" - سواء كان ذلك رفضًا أو قبولًا أو فحصًا إضافيًا للبيانات - على عاتق المستخدم الخاص بك. في حين أن هذا رهان آمن بالنسبة لك كمورد ، فإن نقل هذا العمل إلى المستخدم يمكن أن يقلل أيضًا من قيمة منتجك.

الاحتمال الثاني هو إشراك المستخدم في حوار توضيحي في حالة الاستفسارات منخفضة الثقة أو الغامضة أو المشبوهة. على سبيل المثال ، قد يقترح نظامك تصحيحات إملائية أو نحوية للمدخلات ويطلب إزالة الغموض عن كلمات معينة أو تراكيب نحوية. قد يسمح أيضًا للمستخدم بالمطالبة بشكل استباقي بالتصحيحات في الاستعلام: [14]

المستعمل: أرني مهام جون في هذا السباق السريع.

مساعد: هل ترغب في رؤية المهام التي أنشأها جون ، أم المهام التي يعمل عليها؟

المستعمل: المهام التي أنشأها جون

مساعد: حسنًا ، إليك معرّفات المهام:

المستعمل: شكرًا ، أود أيضًا أن أرى المزيد من المعلومات حول المهام. يرجى أيضا الفرز حسب الاستعجال.

مساعد: بالتأكيد ، إليك المهام جنبًا إلى جنب مع الأوصاف القصيرة والمكلفين والمواعيد النهائية ، مرتبة حسب الموعد النهائي.

أخيرًا ، لتسهيل فهم المستخدم للاستعلامات ، يمكن لنظامك أيضًا توفير إعادة صياغة نصية واضحة للاستعلام ومطالبة المستخدم إما بتأكيده أو تصحيحه. [15]

4. المتطلبات غير الوظيفية

في هذا القسم ، نناقش المتطلبات غير الوظيفية المحددة لـ Text2SQL بالإضافة إلى المفاضلات بينهما. سنركز على المتطلبات الستة التي تبدو أكثر أهمية للمهمة: الدقة وقابلية التوسع والسرعة وقابلية الشرح والخصوصية والقدرة على التكيف بمرور الوقت.

4.1 الدقة

بالنسبة إلى Text2SQL ، فإن متطلبات الدقة عالية. أولاً ، يتم تطبيق Text2SQL عادةً في إعداد محادثة حيث يتم إجراء التنبؤات واحدة تلو الأخرى. وبالتالي ، فإن "قانون الأعداد الكبيرة" الذي يساعد عادةً على موازنة الخطأ في التنبؤات المجمعة ، لا يساعد. ثانيًا ، تعد الصلاحية النحوية والمعجمية شرطًا "صعبًا": يجب على النموذج إنشاء استعلام SQL جيد التكوين ، ومن المحتمل أن يكون مع بناء جملة ودلالات معقدة ، وإلا لا يمكن تنفيذ الطلب على قاعدة البيانات. وإذا سارت الأمور على ما يرام وتمكن من تنفيذ الاستعلام ، فلا يزال من الممكن أن يحتوي على أخطاء دلالية ويؤدي إلى مجموعة بيانات تم إرجاعها بشكل خاطئ (راجع القسم 3.1 إدارة الفشل).

4.2 قابلية التوسع

تتمثل اعتبارات قابلية التوسع الرئيسية في ما إذا كنت تريد تطبيق Text2SQL على قاعدة بيانات واحدة أو عدة قواعد بيانات - وفي الحالة الأخيرة ، ما إذا كانت مجموعة قواعد البيانات معروفة ومغلقة. إذا كانت الإجابة بنعم ، فسيكون لديك وقت أسهل حيث يمكنك تضمين المعلومات حول قواعد البيانات هذه أثناء التدريب. ومع ذلك ، في سيناريو منتج قابل للتطوير - سواء كان تطبيق Text2SQL مستقل أو تكاملًا في منتج بيانات موجود - يجب أن تتعامل الخوارزمية مع أي مخطط قاعدة بيانات جديد سريعًا. لا يمنحك هذا السيناريو أيضًا الفرصة لتحويل بنية قاعدة البيانات لجعلها أكثر سهولة للتعلم (رابط!). كل هذا يؤدي إلى مقايضة كبيرة مع الدقة ، وهو ما قد يفسر أيضًا سبب عدم تمكن موفري Text2SQL الحاليين الذين يقدمون استعلامًا مخصصًا لقواعد البيانات الجديدة من تحقيق اختراق كبير للسوق.

سرعة شنومكس

نظرًا لأن طلبات Text2SQL ستتم معالجتها عادةً عبر الإنترنت في محادثة ، فإن جانب السرعة مهم لإرضاء المستخدم. على الجانب الإيجابي ، غالبًا ما يدرك المستخدمون حقيقة أن طلبات البيانات يمكن أن تستغرق وقتًا معينًا وتظهر الصبر المطلوب. ومع ذلك ، يمكن تقويض هذه النية الحسنة من خلال إعداد الدردشة ، حيث يتوقع المستخدمون دون وعي سرعة محادثة شبيهة بالبشر. قد يكون لطرق تحسين القوة الغاشمة مثل تقليل حجم النموذج تأثير غير مقبول على الدقة ، لذلك ضع في اعتبارك تحسين الاستدلال لتلبية هذا التوقع.

4.4 التفسير والشفافية

في الحالة المثالية ، يمكن للمستخدم متابعة كيفية إنشاء الاستعلام من النص ، والاطلاع على التعيين بين كلمات أو تعبيرات محددة في السؤال واستعلام SQL وما إلى ذلك. وهذا يسمح بالتحقق من الاستعلام وإجراء أي تعديلات عند التفاعل مع النظام . إلى جانب ذلك ، يمكن للنظام أيضًا أن يوفر إعادة صياغة نصية صريحة للاستعلام ويطلب من المستخدم إما تأكيده أو تصحيحه.

خصوصية 4.5

يمكن عزل وظيفة Text2SQL عن تنفيذ الاستعلام ، لذلك يمكن إبقاء معلومات قاعدة البيانات التي تم إرجاعها غير مرئية. ومع ذلك ، فإن السؤال المهم هو مقدار المعلومات حول قاعدة البيانات التي يتم تضمينها في الموجه. الخيارات الثلاثة (عن طريق تقليل مستوى الخصوصية) هي:

لا توجد معلومات
مخطط قاعدة البيانات
محتوى قاعدة البيانات

يتم تداول الخصوصية بدقة - فكلما قل تقييدك في تضمين معلومات مفيدة في المطالبة ، كانت النتائج أفضل.

4.6 القدرة على التكيف مع مرور الوقت

لاستخدام Text2SQL بطريقة دائمة ، تحتاج إلى التكيف مع انحراف البيانات ، أي التوزيع المتغير للبيانات التي يتم تطبيق النموذج عليها. على سبيل المثال ، لنفترض أن البيانات المستخدمة في الضبط الأولي تعكس سلوك الاستعلام البسيط للمستخدمين عند بدء استخدام نظام ذكاء الأعمال. مع مرور الوقت ، تصبح احتياجات المستخدمين من المعلومات أكثر تعقيدًا وتتطلب استعلامات أكثر تعقيدًا ، والتي تطغى على نموذجك الساذج. إلى جانب ذلك ، فإن أهداف أو استراتيجية تغيير الشركة قد تنجرف أيضًا وتوجه احتياجات المعلومات نحو مناطق أخرى من قاعدة البيانات. أخيرًا ، يتمثل التحدي الخاص بـ Text2SQL في انحراف قاعدة البيانات. مع توسيع قاعدة بيانات الشركة ، تشق الأعمدة والجداول الجديدة غير المرئية طريقها إلى الموجه. بينما يمكن لخوارزميات Text2SQL المصممة لتطبيق قواعد البيانات المتعددة معالجة هذه المشكلة بشكل جيد ، إلا أنها يمكن أن تؤثر بشكل كبير على دقة نموذج قاعدة البيانات الفردية. يتم حل كل هذه المشكلات بشكل أفضل من خلال مجموعة بيانات مضبوطة تعكس سلوك المستخدمين الحالي في العالم الحقيقي. وبالتالي ، من الأهمية بمكان تسجيل أسئلة المستخدم والنتائج ، بالإضافة إلى أي تعليقات مرتبطة يمكن جمعها من الاستخدام. بالإضافة إلى ذلك ، يمكن تطبيق خوارزميات التجميع الدلالي ، على سبيل المثال باستخدام حفلات الزفاف أو نمذجة الموضوع ، لاكتشاف التغييرات الأساسية طويلة المدى في سلوك المستخدم واستخدامها كمصدر إضافي للمعلومات لتحسين مجموعة بيانات الضبط الدقيق.

وفي الختام

دعنا نلخص النقاط الرئيسية للمقال:

تسمح Text2SQL بتنفيذ الوصول إلى البيانات بشكل بديهي وديمقراطي في الأعمال التجارية ، وبالتالي تعظيم قيمة البيانات المتاحة.
تتكون بيانات Text2SQL من أسئلة عند الإدخال واستعلامات SQL عند الإخراج. التعيين بين الأسئلة واستعلامات SQL هو متعدد إلى متعدد.
من المهم توفير معلومات حول قاعدة البيانات كجزء من الموجه. بالإضافة إلى ذلك ، يمكن تحسين بنية قاعدة البيانات لتسهيل تعلم الخوارزمية وفهمها.
فيما يتعلق بالمدخلات ، يتمثل التحدي الرئيسي في التباين اللغوي لأسئلة اللغة الطبيعية ، والتي يمكن التعامل معها باستخدام LLMs التي تم تدريبها مسبقًا على مجموعة متنوعة من أنماط النص المختلفة
يجب أن يكون ناتج Text2SQL استعلام SQL صالحًا. يمكن دمج هذا القيد عن طريق "حقن" معرفة SQL في الخوارزمية ؛ بدلاً من ذلك ، باستخدام نهج تكراري ، يمكن التحقق من الاستعلام وتحسينه في خطوات متعددة.
نظرًا للتأثير الكبير المحتمل لـ "الإخفاقات الصامتة" التي تعيد بيانات خاطئة لاتخاذ القرار ، فإن إدارة الفشل هي الشغل الشاغل في واجهة المستخدم.
بطريقة "زيادة" ، يمكن للمستخدمين المشاركة بنشاط في التحقق التكراري وتحسين استعلامات SQL. في حين أن هذا يجعل التطبيق أقل سلاسة ، فإنه يقلل أيضًا من معدلات الفشل ، ويسمح للمستخدمين باستكشاف البيانات بطريقة أكثر مرونة ويخلق إشارات قيمة لمزيد من التعلم.
المتطلبات الرئيسية غير الوظيفية التي يجب مراعاتها هي الدقة وقابلية التوسع والسرعة وقابلية الشرح والخصوصية والقدرة على التكيف بمرور الوقت. تتكون المفاضلات الرئيسية بين الدقة من ناحية ، وقابلية التوسع والسرعة والخصوصية من ناحية أخرى.