يعد تحسين كيفية اكتشاف المستخدمين للمحتوى الجديد أمرًا بالغ الأهمية لزيادة مشاركة المستخدم ورضاه على منصات الوسائط. البحث عن الكلمات الرئيسية وحده يواجه تحديات في التقاط الدلالات ونية المستخدم، مما يؤدي إلى نتائج تفتقر إلى السياق ذي الصلة؛ على سبيل المثال، العثور على موعد ليلي أو أفلام تحت عنوان عيد الميلاد. يمكن أن يؤدي هذا إلى انخفاض معدلات الاحتفاظ إذا لم يتمكن المستخدمون من العثور على المحتوى الذي يريدونه بشكل موثوق. ومع ذلك، مع نماذج اللغات الكبيرة (LLMs)، هناك فرصة لحل هذه التحديات الدلالية ونوايا المستخدم. من خلال الجمع بين التضمين التي تلتقط الدلالات باستخدام تقنية تسمى الجيل المعزز للاسترجاع (RAG)، يمكنك إنشاء إجابات أكثر صلة بناءً على السياق المسترجع من مصادر البيانات الخاصة بك.
في هذا المنشور، نعرض لك كيفية إنشاء روبوت محادثة للأفلام بشكل آمن من خلال تنفيذ RAG باستخدام بياناتك الخاصة قواعد المعرفة For أمازون بيدروك. نحن نستخدم مجموعة بيانات IMDb وBox Office Mojo لمحاكاة كتالوج لعملاء الوسائط والترفيه ولعرض كيف يمكنك بناء حل RAG الخاص بك في بضع خطوات فقط.
حل نظرة عامة
• IMDb و Box Office Mojo Movies / TV / OTT توفر حزمة البيانات المرخصة مجموعة واسعة من البيانات الوصفية الترفيهية ، بما في ذلك أكثر من 1.6 مليار تصنيف مستخدم ؛ قروض لأكثر من 13 مليون من أعضاء الطاقم وطاقم العمل ؛ 10 ملايين فيلم وتليفزيون وترفيه ؛ وبيانات شباك التذاكر العالمية من أكثر من 60 دولة. يقوم العديد من عملاء وسائل الإعلام والترفيه في AWS بترخيص بيانات IMDb من خلال تبادل بيانات AWS لتحسين اكتشاف المحتوى وزيادة تفاعل العملاء والاحتفاظ بهم.
مقدمة إلى قواعد المعرفة لأمازون بيدروك
لتزويد LLM بمعلومات ملكية محدثة، تستخدم المؤسسات RAG، وهي تقنية تتضمن جلب البيانات من مصادر بيانات الشركة وإثراء الموجه بتلك البيانات لتقديم استجابات أكثر دقة وذات صلة. تتيح قواعد المعرفة الخاصة بـ Amazon Bedrock إمكانية RAG المُدارة بالكامل والتي تسمح لك بتخصيص استجابات LLM ببيانات الشركة السياقية وذات الصلة. تعمل قواعد المعرفة على أتمتة سير عمل RAG الشامل، بما في ذلك الاستيعاب والاسترجاع والتعزيز السريع والاستشهادات، مما يلغي الحاجة إلى كتابة تعليمات برمجية مخصصة لدمج مصادر البيانات وإدارة الاستعلامات. تعمل قواعد المعرفة الخاصة بـ Amazon Bedrock أيضًا على تمكين المحادثات متعددة الأدوار حتى يتمكن LLM من الإجابة على استفسارات المستخدم المعقدة بالإجابة الصحيحة.
نستخدم الخدمات التالية كجزء من هذا الحل:
نسير من خلال الخطوات عالية المستوى التالية:
- المعالجة المسبقة لبيانات IMDb لإنشاء مستندات من كل سجل فيلم وتحميل البيانات إلى ملف خدمة تخزين أمازون البسيطة دلو (أمازون S3).
- إنشاء قاعدة معرفية.
- مزامنة قاعدة المعرفة الخاصة بك مع مصدر البيانات الخاص بك.
- استخدم قاعدة المعرفة للإجابة على الاستفسارات الدلالية حول كتالوج الأفلام.
المتطلبات الأساسية المسبقة
تتطلب بيانات IMDb المستخدمة في هذا المنشور ترخيص محتوى تجاريًا واشتراكًا مدفوعًا في حزمة ترخيص IMDb وBox Office Mojo Movies/TV/OTT على AWS Data Exchange. للاستعلام عن الترخيص والحصول على بيانات العينة، تفضل بزيارة Developer.imdb.com. للوصول إلى مجموعة البيانات، راجع توصية الطاقة والبحث باستخدام الرسم البياني للمعرفة IMDb - الجزء 1 واتبع الوصول إلى بيانات IMDb والقسم الخاص به.
المعالجة المسبقة لبيانات IMDb
قبل أن نقوم بإنشاء قاعدة معرفية، نحتاج إلى معالجة مجموعة بيانات IMDb مسبقًا وتحويلها إلى ملفات نصية وتحميلها إلى حاوية S3. في هذه المقالة، نقوم بمحاكاة كتالوج العملاء باستخدام مجموعة بيانات IMDb. نحن نأخذ 10,000 فيلم مشهور من مجموعة بيانات IMDb للكتالوج ونبني مجموعة البيانات.
استخدم ما يلي مفكرة لإنشاء مجموعة البيانات بمعلومات إضافية مثل أسماء الممثلين والمخرجين والمنتجين. نستخدم الكود التالي لإنشاء ملف واحد لفيلم يحتوي على جميع المعلومات المخزنة في الملف في نص غير منظم يمكن فهمه بواسطة LLM:
بعد حصولك على البيانات بتنسيق .txt، يمكنك تحميل البيانات إلى Amazon S3 باستخدام الأمر التالي:
قم بإنشاء قاعدة معارف IMDb
أكمل الخطوات التالية لإنشاء قاعدة المعرفة الخاصة بك:
- في وحدة تحكم Amazon Bedrock، اختر قاعدة المعرفة في جزء التنقل.
- اختار إنشاء قاعدة المعرفة.
- في حالة اسم قاعدة المعرفة، أدخل
imdb
. - في حالة وصف قاعدة المعرفة، أدخل وصفًا اختياريًا، مثل قاعدة المعرفة لاستيعاب بيانات imdb وتخزينها.
- في حالة أذونات IAM، حدد إنشاء دور خدمة جديد واستخدامه، ثم أدخل اسمًا لدور الخدمة الجديد.
- اختار التالى.
- في حالة اسم مصدر البيانات، أدخل
imdb-s3
. - في حالة S3 URI، أدخل S3 URI الذي قمت بتحميل البيانات إليه.
- في مجلة الإعدادات المتقدمة – اختيارية القسم ل استراتيجية التقطيع، اختر لا تقطيع.
- اختار التالى.
تمكنك قواعد المعرفة من تقسيم مستنداتك إلى أجزاء أصغر لتسهيل معالجة المستندات الكبيرة. في حالتنا، قمنا بالفعل بتقسيم البيانات إلى مستند أصغر حجمًا (واحد لكل فيلم).
- في مجلة قاعدة بيانات المتجهات القسم، حدد إنشاء متجر ناقلات جديد بسرعة.
ستقوم Amazon Bedrock تلقائيًا بإنشاء مجموعة بحث متجهة مُدارة بالكامل OpenSearch Serverless وتكوين الإعدادات لتضمين مصادر البيانات الخاصة بك باستخدام Titan Embedding G1 - نموذج تضمين النص المختار.
- اختار التالى.
- راجع إعداداتك واختر إنشاء قاعدة المعرفة.
مزامنة بياناتك مع قاعدة المعرفة
الآن بعد أن قمت بإنشاء قاعدة المعرفة الخاصة بك، يمكنك مزامنة قاعدة المعرفة مع بياناتك.
- على وحدة تحكم Amazon Bedrock، انتقل إلى قاعدة المعرفة الخاصة بك.
- في مجلة مصدر البيانات القسم، اختر مزامنة.
بعد مزامنة مصدر البيانات، تصبح جاهزًا للاستعلام عن البيانات.
تحسين البحث باستخدام النتائج الدلالية
أكمل الخطوات التالية لاختبار الحل وتحسين بحثك باستخدام النتائج الدلالية:
- على وحدة تحكم Amazon Bedrock، انتقل إلى قاعدة المعرفة الخاصة بك.
- حدد قاعدة المعرفة الخاصة بك واختر اختبار قاعدة المعرفة.
- اختار اختر النموذج، و اختار الأنثروبي كلود v2.1.
- اختار التقديم.
أنت الآن جاهز للاستعلام عن البيانات.
يمكننا أن نطرح بعض الأسئلة الدلالية، مثل "اقترح علي بعض الأفلام التي تحمل موضوع عيد الميلاد".
تحتوي استجابات قاعدة المعرفة على اقتباسات يمكنك استكشافها للتأكد من صحة الاستجابة وواقعيتها.
يمكنك أيضًا التعمق في أي معلومات تحتاجها من هذه الأفلام. في المثال التالي، نسأل "من أخرج الكابوس قبل عيد الميلاد؟"
يمكنك أيضًا طرح المزيد من الأسئلة المحددة المتعلقة بالأنواع والتقييمات، مثل "أرني أفلام الرسوم المتحركة الكلاسيكية ذات التقييمات الأكبر من 7؟"
قم بتعزيز قاعدة معارفك مع الوكلاء
وكلاء شركة أمازون بيدروك تساعدك على أتمتة المهام المعقدة. يمكن للوكلاء تقسيم استعلام المستخدم إلى مهام أصغر واستدعاء واجهات برمجة التطبيقات المخصصة أو قواعد المعرفة لتكملة المعلومات لتشغيل الإجراءات. باستخدام وكلاء Amazon Bedrock، يمكن للمطورين دمج الوكلاء الأذكياء في تطبيقاتهم، مما يؤدي إلى تسريع تسليم التطبيقات التي تعمل بالذكاء الاصطناعي وتوفير أسابيع من وقت التطوير. مع الوكلاء، يمكنك زيادة قاعدة معارفك عن طريق إضافة المزيد من الوظائف مثل التوصيات من تخصيص أمازون للحصول على توصيات خاصة بالمستخدم أو تنفيذ إجراءات مثل تصفية الأفلام بناءً على احتياجات المستخدم.
وفي الختام
في هذا المنشور، أظهرنا كيفية إنشاء روبوت محادثة للأفلام باستخدام Amazon Bedrock في بضع خطوات للإجابة على البحث الدلالي وتجارب المحادثة استنادًا إلى بياناتك الخاصة ومجموعة البيانات المرخصة من IMDb وBox Office Mojo Movies/TV/OTT. في المنشور التالي، سنتناول عملية إضافة المزيد من الوظائف إلى الحل الخاص بك باستخدام وكلاء Amazon Bedrock. للبدء في استخدام قواعد المعرفة على Amazon Bedrock، راجع قواعد المعرفة لأمازون بيدروك.
حول المؤلف
غوراف ريلي هو أحد كبار علماء البيانات في مركز ابتكارات الذكاء الاصطناعي التوليدي، حيث يعمل مع عملاء AWS عبر قطاعات مختلفة لتسريع استخدامهم لخدمات الذكاء الاصطناعي التوليدية وخدمات AWS السحابية لحل تحديات أعمالهم.
ديفيا بهارجافي هي إحدى كبار العلماء التطبيقيين في مركز ابتكار الذكاء الاصطناعي التوليدي، حيث تقوم بحل مشكلات الأعمال ذات القيمة العالية لعملاء AWS باستخدام أساليب الذكاء الاصطناعي التوليدي. وهي تعمل على فهم واسترجاع الصور/الفيديو، والرسم البياني المعرفي لنماذج اللغة الكبيرة وحالات استخدام الإعلانات المخصصة.
سورين جونتورو هو عالم بيانات يعمل في مركز ابتكارات الذكاء الاصطناعي التوليدي، حيث يعمل مع العديد من عملاء AWS لحل مشكلات الأعمال ذات القيمة العالية. وهو متخصص في بناء خطوط تعلم التعلم باستخدام نماذج اللغات الكبيرة، بشكل أساسي من خلال Amazon Bedrock وخدمات AWS السحابية الأخرى.
فيديا ساجار رافيباتي هو مدير العلوم في Geneative AI Innovation Center، حيث يستفيد من خبرته الواسعة في الأنظمة الموزعة واسعة النطاق وشغفه بالتعلم الآلي لمساعدة عملاء AWS عبر مختلف قطاعات الصناعة على تسريع اعتماد الذكاء الاصطناعي والسحابة.
- محتوى مدعوم من تحسين محركات البحث وتوزيع العلاقات العامة. تضخيم اليوم.
- PlatoData.Network Vertical Generative Ai. تمكين نفسك. الوصول هنا.
- أفلاطونايستريم. ذكاء Web3. تضخيم المعرفة. الوصول هنا.
- أفلاطون كربون، كلينتك ، الطاقة، بيئة، شمسي، إدارة المخلفات. الوصول هنا.
- أفلاطون هيلث. التكنولوجيا الحيوية وذكاء التجارب السريرية. الوصول هنا.
- المصدر https://aws.amazon.com/blogs/machine-learning/build-a-movie-chatbot-for-tv-ott-platforms-using-retrieval-augmented-generation-in-amazon-bedrock/
- :لديها
- :يكون
- :أين
- 10 مليون دولار
- 000
- 1
- 10
- 100
- 11
- 118
- 12
- 13
- 360
- 385
- 60
- 7
- a
- من نحن
- تسريع
- تسريع
- الوصول
- دقيق
- في
- الإجراءات
- الجهات الفاعلة
- مضيفا
- إضافي
- تبني
- دعاية
- عملاء
- AI
- AI-بالطاقة
- الكل
- يسمح
- وحده
- سابقا
- أيضا
- أمازون
- أمازون ويب سيرفيسز
- an
- و
- إجابة
- الأجوبة
- أي وقت
- واجهات برمجة التطبيقات
- التطبيقات
- تطبيقي
- التطبيقات
- هي
- AS
- تطلب
- At
- زيادة
- المعزز
- أتمتة
- تلقائيا
- AWS
- قاعدة
- على أساس
- BE
- قبل
- مليار
- صندوق
- شباك التذاكر
- استراحة
- نساعدك في بناء
- ابني
- الأعمال
- by
- دعوة
- تسمى
- CAN
- قدرة
- أسر
- اسر
- حقيبة
- الحالات
- الأقسام
- مركز
- التحديات
- chatbot
- اختار
- اختيار
- عيد الميلاد
- كلاسيكي
- سحابة
- اعتماد السحابة
- الخدمات السحابية
- الكود
- مجموعة شتاء XNUMX
- الجمع بين
- تجاري
- حول الشركة
- مجمع
- كنسولات
- تحتوي على
- محتوى
- سياق الكلام
- قريني
- تحادثي
- المحادثات
- تصحيح
- دولة
- زوجان
- خلق
- خلق
- الشكر والتقدير
- طاقم العمل
- حرج
- على
- زبون
- إشراك العملاء
- العملاء
- تصميم
- البيانات
- تبادل البيانات
- عالم البيانات
- التاريخ
- نقل
- التوصيل
- وصف
- تفاصيل
- المطورين
- التطوير التجاري
- مختلف
- توجه
- مدير المدارس
- الإدارة
- اكتشف
- اكتشاف
- وزعت
- الانظمة الموزعة
- وثيقة
- وثائق
- إلى أسفل
- قيادة
- القضاء
- تضمين
- تمكين
- النهائي إلى نهاية
- اشتباك
- إثراء
- أدخل
- ترفيه
- الأثير (ETH)
- كل
- مثال
- تبادل
- الخبره في مجال الغطس
- خبرة
- اكتشف
- قليل
- قم بتقديم
- ملفات
- تصفية
- العثور على
- اتباع
- متابعيك
- في حالة
- شكل
- تبدأ من
- تماما
- وظيفة
- g1
- توليد
- جيل
- توليدي
- الذكاء الاصطناعي التوليدي
- الأنواع
- دولار فقط واحصل على خصم XNUMX% على جميع
- العالمية
- Go
- رسم بياني
- أكبر
- يملك
- he
- مساعدة
- رفيع المستوى
- له
- كيفية
- كيفية
- لكن
- HTML
- HTTP
- HTTPS
- if
- تحقيق
- تحسن
- in
- بما فيه
- القيمة الاسمية
- العالمية
- info
- معلومات
- الابتكار
- استعلم
- دمج
- ذكي
- نية
- إلى
- ينطوي
- IT
- JPG
- م
- المعرفة
- نقص
- لغة
- كبير
- على نطاق واسع
- قيادة
- قيادة
- تعلم
- روافع
- حقوق الملكية الفكرية
- مرخص
- الترخيص
- مثل
- ماجستير في القانون
- محلي
- موقع
- خفض
- آلة
- آلة التعلم
- جعل
- إدارة
- تمكن
- مدير
- كثير
- me
- الوسائط
- الأعضاء
- البيانات الوصفية
- طرق
- مليون
- ML
- نموذج
- عارضات ازياء
- موجو
- الأكثر من ذلك
- فيلم
- أفلام
- الاسم
- أسماء
- التنقل
- قائمة الإختيارات
- حاجة
- إحتياجات
- جديد
- التالي
- ليل
- of
- Office
- on
- ONE
- الفرصة
- or
- المنظمات
- أخرى
- لنا
- على مدى
- الخاصة
- صفقة
- صفحة
- مدفوع
- خبز
- جزء
- شغف
- مسار
- إلى
- أداء
- مخصصه
- منصات التداول
- أفلاطون
- الذكاء افلاطون البيانات
- أفلاطون داتا
- مؤامرة
- الرائج
- منشور
- الملصق
- في المقام الأول
- مشاكل
- عملية المعالجة
- منتج
- المنتجين
- الملكية
- ويوفر
- الاستفسارات
- سؤال
- الأسئلة المتكررة
- خرقة
- نطاق
- الأجور
- تصنيف
- تقييمات
- استعداد
- نوصي
- توصية مجاناً
- ساندي خ. ميليك
- سجل
- الرجوع
- ذات صلة
- ذات الصلة
- التقارير
- يتطلب
- استجابة
- ردود
- النتائج
- استبقاء
- استرجاع
- عائد أعلى
- النوع
- صف
- تشغيل
- رضا
- إنقاذ
- علوم
- عالم
- بحث
- القسم
- آمن
- شرائح
- حدد
- دلالات الألفاظ
- دلالات
- كبير
- Serverless
- الخدمة
- خدمات
- إعدادات
- هي
- اطلاق النار
- إظهار
- عرض
- أظهرت
- الاشارات
- محاكاة
- عزباء
- مقاس
- الأصغر
- So
- حل
- حل
- يحل
- بعض
- مصدر
- مصادر
- تتخصص
- محدد
- بدأت
- خطوات
- تخزين
- متجر
- تخزين
- صريح
- اشتراك
- هذه
- ملحق
- المزامنة.
- أنظمة
- أخذ
- المهام
- تقنية
- تجربه بالعربي
- نص
- من
- أن
- •
- المعلومات
- من مشاركة
- منهم
- تحت عنوان
- then
- هناك.
- تشبه
- هم
- عبر
- الوقت
- عملاق
- عناوين
- إلى
- tv
- فهم
- فهم
- غير منظم
- حديث جديد
- تم التحميل
- URI
- URL
- تستخدم
- مستعمل
- مستخدم
- المستخدمين
- استخدام
- مختلف
- كبير
- القطاعات
- قم بزيارتنا
- W
- سير
- تريد
- وكان
- we
- الويب
- خدمات ويب
- أسابيع
- واسع
- مدى واسع
- سوف
- مع
- سير العمل
- عامل
- أعمال
- اكتب
- X
- عام
- لصحتك!
- حل متجر العقارات الشامل الخاص بك في جورجيا
- زفيرنت