अमेज़ॅन सेजमेकर जम्पस्टार्ट से तैनात एलएलएम के लिए मॉनिटर एंबेडिंग ड्रिफ्ट | अमेज़ॅन वेब सेवाएँ

प्लेटो द्वारा पुनर्प्रकाशित

अनुयायियों: 0

जेनरेटिव एआई वर्कलोड के लिए सबसे उपयोगी एप्लिकेशन पैटर्न में से एक रिट्रीवल ऑगमेंटेड जेनरेशन (आरएजी) है। आरएजी पैटर्न में, हम एम्बेडिंग पर समानता खोज करके इनपुट प्रॉम्प्ट से संबंधित संदर्भ सामग्री के टुकड़े पाते हैं। एंबेडिंग पाठ के मुख्य भाग में सूचना सामग्री को कैप्चर करती है, जिससे प्राकृतिक भाषा प्रसंस्करण (एनएलपी) मॉडल को संख्यात्मक रूप में भाषा के साथ काम करने की अनुमति मिलती है। एंबेडिंग केवल फ़्लोटिंग पॉइंट संख्याओं के वेक्टर हैं, इसलिए हम तीन महत्वपूर्ण प्रश्नों के उत्तर देने में सहायता के लिए उनका विश्लेषण कर सकते हैं: क्या हमारा संदर्भ डेटा समय के साथ बदल रहा है? क्या उपयोगकर्ता जो प्रश्न पूछ रहे हैं वे समय के साथ बदल रहे हैं? और अंततः, हमारा संदर्भ डेटा पूछे जाने वाले प्रश्नों को कितनी अच्छी तरह कवर कर रहा है?

इस पोस्ट में, आप एम्बेडिंग वेक्टर विश्लेषण और एम्बेडिंग बहाव के संकेतों का पता लगाने के लिए कुछ विचारों के बारे में जानेंगे। क्योंकि एम्बेडिंग सामान्य रूप से एनएलपी मॉडल और विशेष रूप से जेनरेटिव एआई समाधानों के लिए डेटा का एक महत्वपूर्ण स्रोत है, हमें यह मापने का एक तरीका चाहिए कि क्या हमारी एम्बेडिंग समय के साथ बदल रही है (बहती है)। इस पोस्ट में, आप बड़े भाषा मॉडल (एलएलएमएस) के साथ क्लस्टरिंग तकनीक का उपयोग करके एम्बेडिंग वैक्टर पर बहाव का पता लगाने का एक उदाहरण देखेंगे। अमेज़न SageMaker जम्पस्टार्ट. आप दिए गए दो उदाहरणों के माध्यम से भी इन अवधारणाओं का पता लगाने में सक्षम होंगे, जिसमें एक एंड-टू-एंड नमूना एप्लिकेशन या, वैकल्पिक रूप से, एप्लिकेशन का एक सबसेट शामिल है।

आरएजी का अवलोकन

RSI आरएजी पैटर्न आपको बाहरी स्रोतों, जैसे पीडीएफ दस्तावेज़, विकी लेख, या कॉल ट्रांसक्रिप्ट से ज्ञान प्राप्त करने देता है, और फिर उस ज्ञान का उपयोग एलएलएम को भेजे गए निर्देश संकेत को बढ़ाने के लिए करता है। यह एलएलएम को प्रतिक्रिया उत्पन्न करते समय अधिक प्रासंगिक जानकारी का संदर्भ देने की अनुमति देता है। उदाहरण के लिए, यदि आप एलएलएम से चॉकलेट चिप कुकीज बनाने का तरीका पूछते हैं, तो इसमें आपकी अपनी रेसिपी लाइब्रेरी से जानकारी शामिल हो सकती है। इस पैटर्न में, रेसिपी टेक्स्ट को एक एम्बेडिंग मॉडल का उपयोग करके एम्बेडिंग वैक्टर में परिवर्तित किया जाता है, और एक वेक्टर डेटाबेस में संग्रहीत किया जाता है। आने वाले प्रश्नों को एम्बेडिंग में बदल दिया जाता है, और फिर वेक्टर डेटाबेस संबंधित सामग्री को खोजने के लिए एक समानता खोज चलाता है। फिर प्रश्न और संदर्भ डेटा एलएलएम के लिए प्रॉम्प्ट में चला जाता है।

आइए बनाए गए एम्बेडिंग वैक्टरों पर करीब से नज़र डालें और उन वैक्टरों पर ड्रिफ्ट विश्लेषण कैसे करें।

एम्बेडिंग वैक्टर पर विश्लेषण

एम्बेडिंग वेक्टर हमारे डेटा का संख्यात्मक प्रतिनिधित्व हैं इसलिए इन वैक्टर का विश्लेषण हमारे संदर्भ डेटा में अंतर्दृष्टि प्रदान कर सकता है जिसका उपयोग बाद में बहाव के संभावित संकेतों का पता लगाने के लिए किया जा सकता है। एम्बेडिंग वेक्टर एन-आयामी स्थान में एक आइटम का प्रतिनिधित्व करते हैं, जहां एन अक्सर बड़ा होता है। उदाहरण के लिए, इस पोस्ट में प्रयुक्त GPT-J 6B मॉडल, 4096 आकार के वेक्टर बनाता है। बहाव को मापने के लिए, मान लें कि हमारा एप्लिकेशन संदर्भ डेटा और आने वाले संकेतों दोनों के लिए एम्बेडिंग वैक्टर को कैप्चर करता है।

हम प्रिंसिपल कंपोनेंट एनालिसिस (पीसीए) का उपयोग करके आयाम में कमी करके शुरुआत करते हैं। पीसीए डेटा में अधिकांश भिन्नताओं को संरक्षित करते हुए आयामों की संख्या को कम करने का प्रयास करता है। इस मामले में, हम उन आयामों की संख्या खोजने का प्रयास करते हैं जो 95% विचरण को संरक्षित करते हैं, जो दो मानक विचलन के भीतर कुछ भी कैप्चर करना चाहिए।

फिर हम क्लस्टर केंद्रों के एक सेट की पहचान करने के लिए K-मीन्स का उपयोग करते हैं। के-मीन्स बिंदुओं को एक साथ समूहों में समूहित करने का प्रयास करता है ताकि प्रत्येक क्लस्टर अपेक्षाकृत कॉम्पैक्ट हो और क्लस्टर एक दूसरे से यथासंभव दूर हों।

हम निम्नलिखित चित्र में दिखाए गए क्लस्टरिंग आउटपुट के आधार पर निम्नलिखित जानकारी की गणना करते हैं:

पीसीए में आयामों की संख्या जो 95% विचरण की व्याख्या करती है
प्रत्येक क्लस्टर केंद्र, या केन्द्रक का स्थान

इसके अतिरिक्त, हम प्रत्येक क्लस्टर में नमूनों के अनुपात (उच्च या निम्न) को देखते हैं, जैसा कि निम्नलिखित आंकड़े में दिखाया गया है।

अंत में, हम इस विश्लेषण का उपयोग निम्नलिखित की गणना करने के लिए करते हैं:

इनेरशिया - जड़ता क्लस्टर सेंट्रोइड्स के लिए वर्ग दूरी का योग है, जो मापता है कि के-मीन्स का उपयोग करके डेटा को कितनी अच्छी तरह क्लस्टर किया गया था।
सिल्हूट स्कोर - सिल्हूट स्कोर क्लस्टर के भीतर स्थिरता के सत्यापन के लिए एक उपाय है, और -1 से 1 तक होता है। 1 के करीब मान का मतलब है कि क्लस्टर में बिंदु उसी क्लस्टर में अन्य बिंदुओं के करीब हैं और दूर हैं अन्य समूहों के बिंदु. सिल्हूट स्कोर का एक दृश्य प्रतिनिधित्व निम्नलिखित चित्र में देखा जा सकता है।

हम समय-समय पर स्रोत संदर्भ डेटा और संकेतों दोनों के लिए एम्बेडिंग के स्नैपशॉट के लिए इस जानकारी को कैप्चर कर सकते हैं। इस डेटा को कैप्चर करने से हमें एम्बेडिंग ड्रिफ्ट के संभावित संकेतों का विश्लेषण करने की अनुमति मिलती है।

एम्बेडिंग बहाव का पता लगाना

समय-समय पर, हम डेटा के स्नैपशॉट के माध्यम से क्लस्टरिंग जानकारी की तुलना कर सकते हैं, जिसमें संदर्भ डेटा एम्बेडिंग और प्रॉम्प्ट एम्बेडिंग शामिल हैं। सबसे पहले, हम क्लस्टरिंग कार्य से एम्बेडिंग डेटा, जड़ता और सिल्हूट स्कोर में 95% भिन्नता को समझाने के लिए आवश्यक आयामों की संख्या की तुलना कर सकते हैं। जैसा कि आप निम्न तालिका में देख सकते हैं, बेसलाइन की तुलना में, एम्बेडिंग के नवीनतम स्नैपशॉट को भिन्नता को समझाने के लिए 39 और आयामों की आवश्यकता होती है, जो दर्शाता है कि हमारा डेटा अधिक बिखरा हुआ है। जड़ता बढ़ गई है, जो दर्शाता है कि नमूने कुल मिलाकर अपने क्लस्टर केंद्रों से बहुत दूर हैं। इसके अतिरिक्त, सिल्हूट स्कोर कम हो गया है, जो दर्शाता है कि क्लस्टर अच्छी तरह से परिभाषित नहीं हैं। त्वरित डेटा के लिए, यह संकेत दे सकता है कि सिस्टम में आने वाले प्रश्नों के प्रकार अधिक विषयों को कवर कर रहे हैं।

आगे, निम्नलिखित आंकड़े में, हम देख सकते हैं कि समय के साथ प्रत्येक क्लस्टर में नमूनों का अनुपात कैसे बदल गया है। यह हमें दिखा सकता है कि क्या हमारा नया संदर्भ डेटा मोटे तौर पर पिछले सेट के समान है, या नए क्षेत्रों को कवर करता है।

अंत में, हम देख सकते हैं कि क्या क्लस्टर केंद्र घूम रहे हैं, जो क्लस्टर में जानकारी में बहाव दिखाएगा, जैसा कि निम्नलिखित तालिका में दिखाया गया है।

आने वाले प्रश्नों के लिए संदर्भ डेटा कवरेज

हम यह भी मूल्यांकन कर सकते हैं कि हमारा संदर्भ डेटा आने वाले प्रश्नों के साथ कितनी अच्छी तरह मेल खाता है। ऐसा करने के लिए, हम प्रत्येक प्रॉम्प्ट एम्बेडिंग को एक संदर्भ डेटा क्लस्टर में निर्दिष्ट करते हैं। हम प्रत्येक प्रॉम्प्ट से उसके संबंधित केंद्र तक की दूरी की गणना करते हैं, और उन दूरियों के माध्य, माध्यिका और मानक विचलन को देखते हैं। हम उस जानकारी को संग्रहीत कर सकते हैं और देख सकते हैं कि यह समय के साथ कैसे बदलती है।

निम्नलिखित आंकड़ा समय के साथ प्रॉम्प्ट एम्बेडिंग और संदर्भ डेटा केंद्रों के बीच की दूरी का विश्लेषण करने का एक उदाहरण दिखाता है।

जैसा कि आप देख सकते हैं, प्रारंभिक आधार रेखा और नवीनतम स्नैपशॉट के बीच शीघ्र एम्बेडिंग और संदर्भ डेटा केंद्रों के बीच माध्य, मध्य और मानक विचलन दूरी के आँकड़े कम हो रहे हैं। यद्यपि दूरी के पूर्ण मूल्य की व्याख्या करना कठिन है, हम यह निर्धारित करने के लिए रुझानों का उपयोग कर सकते हैं कि संदर्भ डेटा और आने वाले प्रश्नों के बीच अर्थ ओवरलैप समय के साथ बेहतर या बदतर हो रहा है या नहीं।

नमूना आवेदन

पिछले अनुभाग में चर्चा किए गए प्रायोगिक परिणामों को इकट्ठा करने के लिए, हमने एक नमूना एप्लिकेशन बनाया जो सेजमेकर जम्पस्टार्ट के माध्यम से तैनात और होस्ट किए गए एम्बेडिंग और जेनरेशन मॉडल का उपयोग करके आरएजी पैटर्न को लागू करता है। अमेज़न SageMaker वास्तविक समय समापनबिंदु।

एप्लिकेशन के तीन मुख्य घटक हैं:

हम एक इंटरैक्टिव प्रवाह का उपयोग करते हैं, जिसमें लैंगचेन का उपयोग करके आरएजी ऑर्केस्ट्रेशन परत के साथ संयुक्त संकेतों को कैप्चर करने के लिए एक उपयोगकर्ता इंटरफ़ेस शामिल है।
डेटा प्रोसेसिंग प्रवाह पीडीएफ दस्तावेजों से डेटा निकालता है और एम्बेडिंग बनाता है जो संग्रहीत हो जाता है अमेज़न ओपन सर्च सर्विस. हम इनका उपयोग एप्लिकेशन के अंतिम एम्बेडिंग ड्रिफ्ट विश्लेषण घटक में भी करते हैं।
एंबेडिंग्स को कैद कर लिया गया है अमेज़न सरल भंडारण सेवा (अमेज़ॅन S3) के माध्यम से अमेज़न Kinesis डेटा Firehose, और हम इसका एक संयोजन चलाते हैं एडब्ल्यूएस गोंद एम्बेडिंग विश्लेषण करने के लिए नौकरियों और ज्यूपिटर नोटबुक को निकालें, बदलें और लोड करें।

निम्नलिखित चित्र एंड-टू-एंड आर्किटेक्चर को दर्शाता है।

पूरा नमूना कोड यहां उपलब्ध है GitHub. प्रदान किया गया कोड दो अलग-अलग पैटर्न में उपलब्ध है:

स्ट्रीमलिट फ्रंटएंड के साथ नमूना पूर्ण-स्टैक एप्लिकेशन - यह एक एंड-टू-एंड एप्लिकेशन प्रदान करता है, जिसमें संकेतों को कैप्चर करने के लिए स्ट्रीमलाइट का उपयोग करने वाला एक उपयोगकर्ता इंटरफ़ेस, आरएजी ऑर्केस्ट्रेशन परत के साथ संयुक्त, लैंगचेन का उपयोग करना शामिल है। अमेज़ॅन इलास्टिक कंटेनर सेवा (अमेज़ॅन ईसीएस) के साथ AWS फरगेट
बैकएंड अनुप्रयोग - उन लोगों के लिए जो पूर्ण एप्लिकेशन स्टैक को तैनात नहीं करना चाहते हैं, आप वैकल्पिक रूप से केवल बैकएंड को तैनात करना चुन सकते हैं AWS क्लाउड डेवलपमेंट किट (एडब्ल्यूएस सीडीके) स्टैक, और फिर लैंगचेन का उपयोग करके आरएजी ऑर्केस्ट्रेशन करने के लिए प्रदान की गई ज्यूपिटर नोटबुक का उपयोग करें

प्रदान किए गए पैटर्न बनाने के लिए, निम्नलिखित अनुभागों में कई पूर्वापेक्षाएँ विस्तृत हैं, जो जेनरेटिव और टेक्स्ट एम्बेडिंग मॉडल को तैनात करने से शुरू होती हैं और फिर अतिरिक्त पूर्वापेक्षाओं पर आगे बढ़ती हैं।

सेजमेकर जम्पस्टार्ट के माध्यम से मॉडल तैनात करें

दोनों पैटर्न एक एम्बेडिंग मॉडल और जेनरेटिव मॉडल की तैनाती मानते हैं। इसके लिए, आप सेजमेकर जम्पस्टार्ट से दो मॉडल तैनात करेंगे। पहला मॉडल, GPT-J 6B, एम्बेडिंग मॉडल के रूप में उपयोग किया जाता है और दूसरा मॉडल, Falcon-40b, टेक्स्ट जेनरेशन के लिए उपयोग किया जाता है।

आप इनमें से प्रत्येक मॉडल को सेजमेकर जम्पस्टार्ट के माध्यम से तैनात कर सकते हैं एडब्ल्यूएस प्रबंधन कंसोल, अमेज़ॅन सैजमेकर स्टूडियो, या प्रोग्रामेटिक रूप से। अधिक जानकारी के लिए देखें जम्पस्टार्ट फाउंडेशन मॉडल का उपयोग कैसे करें. परिनियोजन को सरल बनाने के लिए, आप इसका उपयोग कर सकते हैं नोटबुक प्रदान की गई सेजमेकर जम्पस्टार्ट द्वारा स्वचालित रूप से बनाई गई नोटबुक से प्राप्त। यह नोटबुक मॉडलों को सेजमेकर जम्पस्टार्ट एमएल हब से खींचती है और उन्हें दो अलग-अलग सेजमेकर रीयल-टाइम एंडपॉइंट्स पर तैनात करती है।

नमूना नोटबुक में एक सफाई अनुभाग भी है। उस अनुभाग को अभी तक न चलाएं, क्योंकि यह अभी तैनात किए गए अंतिम बिंदुओं को हटा देगा। आप वॉकथ्रू के अंत में सफाई पूरी कर लेंगे।

अंतिम बिंदुओं के सफल परिनियोजन की पुष्टि करने के बाद, आप पूर्ण नमूना एप्लिकेशन को परिनियोजित करने के लिए तैयार हैं। हालाँकि, यदि आप केवल बैकएंड और विश्लेषण नोटबुक की खोज में अधिक रुचि रखते हैं, तो आप वैकल्पिक रूप से केवल उसे ही तैनात कर सकते हैं, जो अगले भाग में शामिल है।

विकल्प 1: केवल बैकएंड एप्लिकेशन परिनियोजित करें

यह पैटर्न आपको केवल बैकएंड समाधान को तैनात करने और ज्यूपिटर नोटबुक का उपयोग करके समाधान के साथ इंटरैक्ट करने की अनुमति देता है। यदि आप पूर्ण फ्रंटएंड इंटरफ़ेस नहीं बनाना चाहते हैं तो इस पैटर्न का उपयोग करें।

.. पूर्वापेक्षाएँ

आपके पास निम्नलिखित पूर्वापेक्षाएँ होनी चाहिए:

एक सेजमेकर जंपस्टार्ट मॉडल एंडपॉइंट तैनात किया गया - जैसा कि पहले बताया गया है, सेजमेकर जम्पस्टार्ट का उपयोग करके मॉडलों को सेजमेकर रीयल-टाइम एंडपॉइंट पर तैनात करें
परिनियोजन पैरामीटर - निम्नलिखित रिकॉर्ड करें:
- पाठ मॉडल समापनबिंदु नाम - सेजमेकर जम्पस्टार्ट के साथ तैनात टेक्स्ट जेनरेशन मॉडल का समापन बिंदु नाम
- एंबेडिंग मॉडल समापन बिंदु नाम - सेजमेकर जम्पस्टार्ट के साथ तैनात एम्बेडिंग मॉडल का समापन बिंदु नाम

AWS CDK का उपयोग करके संसाधन तैनात करें

AWS CDK स्टैक को परिनियोजित करने के लिए पिछले अनुभाग में नोट किए गए परिनियोजन पैरामीटर का उपयोग करें। AWS CDK इंस्टालेशन के बारे में अधिक जानकारी के लिए देखें AWS CDK के साथ शुरुआत करना.

सुनिश्चित करें कि डॉकर स्थापित है और वर्कस्टेशन पर चल रहा है जिसका उपयोग AWS CDK परिनियोजन के लिए किया जाएगा। को देखें डॉकर प्राप्त करें अतिरिक्त मार्गदर्शन के लिए।

$ cd pattern1-rag/cdk
$ cdk deploy BackendStack --exclusively
    -c textModelEndpointName=<Enter the SageMaker Endpoint Name for the Text generation model> 
    -c embeddingsModelEndpointName=<Enter the SageMaker Endpoint Name for the Text embeddings model>

वैकल्पिक रूप से, आप नामक फ़ाइल में संदर्भ मान दर्ज कर सकते हैं cdk.context.json में pattern1-rag/cdk निर्देशिका और चलाएँ cdk deploy BackendStack --exclusively.

परिनियोजन आउटपुट प्रिंट करेगा, जिनमें से कुछ की नोटबुक चलाने के लिए आवश्यकता होगी। इससे पहले कि आप प्रश्न और उत्तर देना शुरू करें, संदर्भ दस्तावेज़ एम्बेड करें, जैसा कि अगले भाग में दिखाया गया है।

संदर्भ दस्तावेज़ एम्बेड करें

इस आरएजी दृष्टिकोण के लिए, संदर्भ दस्तावेजों को पहले टेक्स्ट एम्बेडिंग मॉडल के साथ एम्बेड किया जाता है और एक वेक्टर डेटाबेस में संग्रहीत किया जाता है। इस समाधान में, एक अंतर्ग्रहण पाइपलाइन बनाई गई है जो पीडीएफ दस्तावेज़ों को ग्रहण करती है।

An अमेज़ॅन इलास्टिक कम्प्यूट क्लाउड (अमेज़ॅन EC2) उदाहरण पीडीएफ दस्तावेज़ अंतर्ग्रहण और एक के लिए बनाया गया है अमेज़ॅन इलास्टिक फ़ाइल सिस्टम (अमेज़ॅन ईएफएस) फ़ाइल सिस्टम पीडीएफ दस्तावेज़ों को सहेजने के लिए ईसी2 इंस्टेंस पर लगाया गया है। एक एडब्ल्यूएस डेटासिंक ईएफएस फ़ाइल सिस्टम पथ में पाए गए पीडीएफ दस्तावेजों को लाने और टेक्स्ट एम्बेडिंग प्रक्रिया शुरू करने के लिए उन्हें एस 3 बाल्टी में अपलोड करने के लिए कार्य हर घंटे चलाया जाता है। यह प्रक्रिया संदर्भ दस्तावेज़ों को एम्बेड करती है और एम्बेडिंग को ओपनसर्च सेवा में सहेजती है। यह बाद के विश्लेषण के लिए किनेसिस डेटा फ़ायरहोज़ के माध्यम से एक एम्बेडिंग संग्रह को S3 बकेट में भी सहेजता है।

संदर्भ दस्तावेज़ों को ग्रहण करने के लिए, निम्नलिखित चरणों को पूरा करें:

बनाए गए नमूना EC2 इंस्टेंस आईडी को पुनः प्राप्त करें (AWS CDK आउटपुट देखें)। JumpHostId) और का उपयोग करके कनेक्ट करें सत्र प्रबंधक, की क्षमता एडब्ल्यूएस सिस्टम मैनेजर. निर्देशों के लिए, देखें AWS सिस्टम मैनेजर सत्र प्रबंधक के साथ अपने लिनक्स इंस्टेंस से कनेक्ट करें.
निर्देशिका पर जाएँ /mnt/efs/fs1, जो कि वह जगह है जहां ईएफएस फ़ाइल सिस्टम माउंट किया गया है, और एक फ़ोल्डर बनाएं जिसे कहा जाता है ingest:
```
$ cd /mnt/efs/fs1
$ mkdir ingest && cd ingest
```
इसमें अपना संदर्भ पीडीएफ दस्तावेज़ जोड़ें ingest निर्देशिका.

एम्बेडिंग प्रक्रिया शुरू करने के लिए इस निर्देशिका में पाई गई सभी फ़ाइलों को Amazon S3 पर अपलोड करने के लिए DataSync कार्य कॉन्फ़िगर किया गया है।

डेटासिंक कार्य प्रति घंटे के शेड्यूल पर चलता है; आपके द्वारा जोड़े गए पीडीएफ दस्तावेज़ों के लिए एम्बेडिंग प्रक्रिया तुरंत शुरू करने के लिए आप वैकल्पिक रूप से मैन्युअल रूप से कार्य शुरू कर सकते हैं।

कार्य शुरू करने के लिए, AWS CDK आउटपुट से कार्य आईडी ढूंढें DataSyncTaskID और कार्य प्रारंभ करें डिफ़ॉल्ट के साथ.

एम्बेडिंग बनने के बाद, आप ज्यूपिटर नोटबुक के माध्यम से आरएजी प्रश्न और उत्तर देना शुरू कर सकते हैं, जैसा कि अगले भाग में दिखाया गया है।

ज्यूपिटर नोटबुक का उपयोग करके प्रश्न और उत्तर देना

निम्नलिखित चरणों को पूरा करें:

AWS CDK आउटपुट से SageMaker नोटबुक इंस्टेंस नाम पुनर्प्राप्त करें NotebookInstanceName और SageMaker कंसोल से JupyterLab से कनेक्ट करें।
निर्देशिका पर जाएँ fmops/full-stack/pattern1-rag/notebooks/.
नोटबुक खोलें और चलाएं query-llm.ipynb RAG का उपयोग करके प्रश्न और उत्तर देने के लिए नोटबुक उदाहरण में।

का उपयोग अवश्य करें conda_python3 नोटबुक के लिए कर्नेल.

यह पैटर्न पूर्ण-स्टैक एप्लिकेशन के लिए आवश्यक अतिरिक्त शर्तों को प्रावधान किए बिना बैकएंड समाधान का पता लगाने के लिए उपयोगी है। अगला अनुभाग आपके जेनरेटिव एआई एप्लिकेशन के साथ इंटरैक्ट करने के लिए एक यूजर इंटरफेस प्रदान करने के लिए फ्रंटएंड और बैकएंड दोनों घटकों सहित एक पूर्ण-स्टैक एप्लिकेशन के कार्यान्वयन को शामिल करता है।

विकल्प 2: स्ट्रीमलिट फ्रंटएंड के साथ पूर्ण-स्टैक नमूना एप्लिकेशन को तैनात करें

यह पैटर्न आपको प्रश्न और उत्तर के लिए उपयोगकर्ता फ्रंटएंड इंटरफ़ेस के साथ समाधान तैनात करने की अनुमति देता है।

.. पूर्वापेक्षाएँ

नमूना एप्लिकेशन को तैनात करने के लिए, आपके पास निम्नलिखित शर्तें होनी चाहिए:

सेजमेकर जंपस्टार्ट मॉडल एंडपॉइंट तैनात किया गया - दिए गए नोटबुक का उपयोग करके, जैसा कि पिछले अनुभाग में बताया गया है, सेजमेकर जम्पस्टार्ट का उपयोग करके मॉडल को अपने सेजमेकर रीयल-टाइम एंडपॉइंट पर तैनात करें।
अमेज़ॅन रूट 53 होस्टेड ज़ोन - बनाओ अमेज़ॅन रूट 53 सार्वजनिक होस्ट किया गया क्षेत्र इस समाधान के लिए उपयोग करने के लिए. आप मौजूदा रूट 53 सार्वजनिक होस्टेड ज़ोन का भी उपयोग कर सकते हैं, जैसे example.com.
AWS प्रमाणपत्र प्रबंधक प्रमाणपत्र - प्रावधान ए AWS प्रमाणपत्र प्रबंधक (एसीएम) रूट 53 होस्टेड ज़ोन डोमेन नाम और इसके लागू उपडोमेन के लिए टीएलएस प्रमाणपत्र, जैसे example.com और *.example.com सभी उपडोमेन के लिए. निर्देशों के लिए, देखें सार्वजनिक प्रमाणपत्र का अनुरोध. इस प्रमाणपत्र का उपयोग HTTPS को कॉन्फ़िगर करने के लिए किया जाता है अमेज़न CloudFront और मूल लोड बैलेंसर।
परिनियोजन पैरामीटर - निम्नलिखित रिकॉर्ड करें:
- फ्रंटएंड एप्लिकेशन कस्टम डोमेन नाम - एक कस्टम डोमेन नाम जिसका उपयोग फ्रंटएंड नमूना एप्लिकेशन तक पहुंचने के लिए किया जाता है। प्रदान किए गए डोमेन नाम का उपयोग फ्रंटएंड क्लाउडफ्रंट वितरण की ओर इशारा करते हुए रूट 53 डीएनएस रिकॉर्ड बनाने के लिए किया जाता है; उदाहरण के लिए, app.example.com.
- लोड बैलेंसर मूल कस्टम डोमेन नाम - क्लाउडफ्रंट वितरण लोड बैलेंसर मूल के लिए उपयोग किया जाने वाला एक कस्टम डोमेन नाम। प्रदान किए गए डोमेन नाम का उपयोग मूल लोड बैलेंसर की ओर इशारा करते हुए रूट 53 डीएनएस रिकॉर्ड बनाने के लिए किया जाता है; उदाहरण के लिए, app-lb.example.com.
- रूट 53 होस्टेड ज़ोन आईडी - प्रदान किए गए कस्टम डोमेन नामों को होस्ट करने के लिए रूट 53 होस्टेड ज़ोन आईडी; उदाहरण के लिए, ZXXXXXXXXYYYYYYYYY.
- रूट 53 होस्टेड ज़ोन का नाम - प्रदान किए गए कस्टम डोमेन नामों को होस्ट करने के लिए रूट 53 होस्टेड ज़ोन का नाम; उदाहरण के लिए, example.com.
- एसीएम प्रमाणपत्र एआरएन - एसीएम प्रमाणपत्र का एआरएन प्रदान किए गए कस्टम डोमेन के साथ उपयोग किया जाएगा।
- पाठ मॉडल समापनबिंदु नाम - सेजमेकर जम्पस्टार्ट के साथ तैनात टेक्स्ट जेनरेशन मॉडल का समापन बिंदु नाम।
- एंबेडिंग मॉडल समापन बिंदु नाम - सेजमेकर जम्पस्टार्ट के साथ तैनात एम्बेडिंग मॉडल का समापन बिंदु नाम।

AWS CDK का उपयोग करके संसाधन तैनात करें

AWS CDK स्टैक को परिनियोजित करने के लिए पूर्वापेक्षाओं में आपके द्वारा नोट किए गए परिनियोजन पैरामीटर का उपयोग करें। अधिक जानकारी के लिए देखें AWS CDK के साथ शुरुआत करना.

सुनिश्चित करें कि डॉकर स्थापित है और वर्कस्टेशन पर चल रहा है जिसका उपयोग AWS CDK परिनियोजन के लिए किया जाएगा।

$ cd pattern1-rag/cdk
$ cdk deploy --all -c appCustomDomainName=<Enter Custom Domain Name to be used for Frontend App> 
    -c loadBalancerOriginCustomDomainName=<Enter Custom Domain Name to be used for Load Balancer Origin> 
    -c customDomainRoute53HostedZoneID=<Enter Route53 Hosted Zone ID for the Custom Domain being used> 
    -c customDomainRoute53HostedZoneName=<Enter Route53 Hostedzone Name> 
    -c customDomainCertificateArn=<Enter ACM Certificate ARN for Custom Domains provided> 
    -c textModelEndpointName=<Enter the SageMaker Endpoint Name for the Text generation model> 
    -c embeddingsModelEndpointName=<Enter the SageMaker Endpoint Name for the Text embeddings model>

पूर्ववर्ती कोड में, -c इनपुट पर प्रदान की गई आवश्यक शर्तों के रूप में एक संदर्भ मान का प्रतिनिधित्व करता है। वैकल्पिक रूप से, आप नामक फ़ाइल में संदर्भ मान दर्ज कर सकते हैं cdk.context.json में pattern1-rag/cdk निर्देशिका और चलाएँ cdk deploy --all.

ध्यान दें कि हम फ़ाइल में क्षेत्र निर्दिष्ट करते हैं bin/cdk.ts. ALB एक्सेस लॉग को कॉन्फ़िगर करने के लिए एक निर्दिष्ट क्षेत्र की आवश्यकता होती है। आप तैनाती से पहले इस क्षेत्र को बदल सकते हैं।

परिनियोजन स्ट्रीमलिट एप्लिकेशन तक पहुंचने के लिए यूआरएल का प्रिंट आउट लेगा। इससे पहले कि आप प्रश्न और उत्तर देना शुरू करें, आपको संदर्भ दस्तावेज़ एम्बेड करने होंगे, जैसा कि अगले भाग में दिखाया गया है।

संदर्भ दस्तावेज़ एम्बेड करें

आरएजी दृष्टिकोण के लिए, संदर्भ दस्तावेजों को पहले टेक्स्ट एम्बेडिंग मॉडल के साथ एम्बेड किया जाता है और एक वेक्टर डेटाबेस में संग्रहीत किया जाता है। इस समाधान में, एक अंतर्ग्रहण पाइपलाइन बनाई गई है जो पीडीएफ दस्तावेज़ों को ग्रहण करती है।

जैसा कि हमने पहले परिनियोजन विकल्प में चर्चा की है, पीडीएफ दस्तावेज़ अंतर्ग्रहण के लिए एक उदाहरण EC2 इंस्टेंस बनाया गया है और PDF दस्तावेज़ों को सहेजने के लिए EC2 इंस्टेंस पर एक EFS फ़ाइल सिस्टम लगाया गया है। ईएफएस फ़ाइल सिस्टम पथ में पाए गए पीडीएफ दस्तावेजों को लाने और टेक्स्ट एम्बेडिंग प्रक्रिया शुरू करने के लिए उन्हें एस 3 बाल्टी में अपलोड करने के लिए हर घंटे एक डेटासिंक कार्य चलाया जाता है। यह प्रक्रिया संदर्भ दस्तावेज़ों को एम्बेड करती है और एम्बेडिंग को ओपनसर्च सेवा में सहेजती है। यह बाद के विश्लेषण के लिए किनेसिस डेटा फ़ायरहोज़ के माध्यम से एक एम्बेडिंग संग्रह को S3 बकेट में भी सहेजता है।

संदर्भ दस्तावेज़ों को ग्रहण करने के लिए, निम्नलिखित चरणों को पूरा करें:

बनाए गए नमूना EC2 इंस्टेंस आईडी को पुनः प्राप्त करें (AWS CDK आउटपुट देखें)। JumpHostId) और सत्र प्रबंधक का उपयोग करके कनेक्ट करें।
निर्देशिका पर जाएँ /mnt/efs/fs1, जो कि वह जगह है जहां ईएफएस फ़ाइल सिस्टम माउंट किया गया है, और एक फ़ोल्डर बनाएं जिसे कहा जाता है ingest:
```
$ cd /mnt/efs/fs1
$ mkdir ingest && cd ingest
```
इसमें अपना संदर्भ पीडीएफ दस्तावेज़ जोड़ें ingest निर्देशिका.

डेटासिंक कार्य प्रति घंटे के शेड्यूल पर चलता है। आपके द्वारा जोड़े गए पीडीएफ दस्तावेजों के लिए एम्बेडिंग प्रक्रिया तुरंत शुरू करने के लिए आप वैकल्पिक रूप से कार्य को मैन्युअल रूप से शुरू कर सकते हैं।

कार्य शुरू करने के लिए, AWS CDK आउटपुट से कार्य आईडी ढूंढें DataSyncTaskID और कार्य प्रारंभ करें डिफ़ॉल्ट के साथ.

प्रश्न और उत्तर

संदर्भ दस्तावेज़ एम्बेड किए जाने के बाद, आप स्ट्रीमलिट एप्लिकेशन तक पहुंचने के लिए यूआरएल पर जाकर आरएजी प्रश्न और उत्तर शुरू कर सकते हैं। एक अमेज़ॅन कॉग्निटो प्रमाणीकरण परत का उपयोग किया जाता है, इसलिए इसे एप्लिकेशन तक पहली बार पहुंच के लिए AWS CDK (उपयोगकर्ता पूल नाम के लिए AWS CDK आउटपुट देखें) के माध्यम से तैनात अमेज़ॅन कॉग्निटो उपयोगकर्ता पूल में एक उपयोगकर्ता खाता बनाने की आवश्यकता होती है। Amazon Cognito उपयोगकर्ता बनाने के निर्देशों के लिए, देखें AWS प्रबंधन कंसोल में एक नया उपयोगकर्ता बनाना.

एंबेड बहाव विश्लेषण

इस अनुभाग में, हम आपको दिखाते हैं कि पहले संदर्भ डेटा एम्बेडिंग और शीघ्र एम्बेडिंग की आधार रेखा बनाकर और फिर समय के साथ एम्बेडिंग का एक स्नैपशॉट बनाकर बहाव विश्लेषण कैसे करें। यह आपको बेसलाइन एम्बेडिंग की तुलना स्नैपशॉट एम्बेडिंग से करने की अनुमति देता है।

संदर्भ डेटा और प्रॉम्प्ट के लिए एक एम्बेडिंग बेसलाइन बनाएं

संदर्भ डेटा की एम्बेडिंग बेसलाइन बनाने के लिए, AWS ग्लू कंसोल खोलें और ETL जॉब चुनें embedding-drift-analysis. ईटीएल कार्य के लिए पैरामीटर निम्नानुसार सेट करें और कार्य चलाएँ:

सेट --job_type सेवा मेरे BASELINE.
सेट --out_table को अमेज़ॅन डायनेमोडीबी संदर्भ एम्बेडिंग डेटा के लिए तालिका। (एडब्ल्यूएस सीडीके आउटपुट देखें DriftTableReference तालिका नाम के लिए.)
सेट --centroid_table संदर्भ सेंट्रोइड डेटा के लिए DynamoDB तालिका में। (एडब्ल्यूएस सीडीके आउटपुट देखें CentroidTableReference तालिका नाम के लिए.)
सेट --data_path उपसर्ग के साथ S3 बाल्टी में; उदाहरण के लिए, s3:///embeddingarchive/. (एडब्ल्यूएस सीडीके आउटपुट देखें BucketName बाल्टी के नाम के लिए.)

इसी तरह, ईटीएल नौकरी का उपयोग करना embedding-drift-analysis, संकेतों की एक एम्बेडिंग बेसलाइन बनाएं। ईटीएल कार्य के लिए पैरामीटर निम्नानुसार सेट करें और कार्य चलाएँ:

सेट --job_type सेवा मेरे BASELINE
सेट --out_table शीघ्र एम्बेडिंग डेटा के लिए DynamoDB तालिका में। (एडब्ल्यूएस सीडीके आउटपुट देखें DriftTablePromptsName तालिका नाम के लिए.)
सेट --centroid_table प्रॉम्प्ट सेंट्रोइड डेटा के लिए DynamoDB तालिका में। (एडब्ल्यूएस सीडीके आउटपुट देखें CentroidTablePrompts तालिका नाम के लिए.)
सेट --data_path उपसर्ग के साथ S3 बाल्टी में; उदाहरण के लिए, s3:///promptarchive/. (एडब्ल्यूएस सीडीके आउटपुट देखें BucketName बाल्टी के नाम के लिए.)

संदर्भ डेटा और प्रॉम्प्ट के लिए एक एम्बेडिंग स्नैपशॉट बनाएं

ओपनसर्च सेवा में अतिरिक्त जानकारी डालने के बाद, ईटीएल कार्य चलाएँ embedding-drift-analysis संदर्भ डेटा एम्बेडिंग को फिर से स्नैपशॉट करने के लिए। पैरामीटर ईटीएल जॉब के समान होंगे जो आपने संदर्भ डेटा की एम्बेडिंग बेसलाइन बनाने के लिए चलाया था जैसा कि पिछले अनुभाग में दिखाया गया है, सेटिंग के अपवाद के साथ --job_type करने के लिए पैरामीटर SNAPSHOT.

इसी तरह, प्रॉम्प्ट एम्बेडिंग को स्नैपशॉट करने के लिए, ईटीएल जॉब चलाएँ embedding-drift-analysis दोबारा। पैरामीटर ईटीएल जॉब के समान होंगे जो आपने पिछले अनुभाग में दिखाए गए संकेतों के लिए एम्बेडिंग बेसलाइन बनाने के लिए चलाया था, सेटिंग के अपवाद के साथ --job_type करने के लिए पैरामीटर SNAPSHOT.

आधार रेखा की तुलना स्नैपशॉट से करें

संदर्भ डेटा और संकेतों के लिए एम्बेडिंग बेसलाइन और स्नैपशॉट की तुलना करने के लिए, दिए गए नोटबुक का उपयोग करें pattern1-rag/notebooks/drift-analysis.ipynb.

संदर्भ डेटा या संकेतों के लिए एम्बेडिंग तुलना देखने के लिए, DynamoDB तालिका नाम चर बदलें (tbl और c_tbl) नोटबुक में नोटबुक के प्रत्येक रन के लिए उपयुक्त DynamoDB तालिका में।

नोटबुक चर tbl उचित बहाव तालिका नाम में बदला जाना चाहिए। नोटबुक में वेरिएबल को कहां कॉन्फ़िगर करना है इसका एक उदाहरण निम्नलिखित है।

तालिका के नाम इस प्रकार प्राप्त किए जा सकते हैं:

संदर्भ एम्बेडिंग डेटा के लिए, AWS CDK आउटपुट से ड्रिफ्ट तालिका नाम पुनर्प्राप्त करें DriftTableReference
शीघ्र एम्बेडिंग डेटा के लिए, AWS CDK आउटपुट से ड्रिफ्ट तालिका नाम पुनर्प्राप्त करें DriftTablePromptsName

इसके अलावा, नोटबुक चर c_tbl उचित सेंट्रोइड तालिका नाम में बदला जाना चाहिए। नोटबुक में वेरिएबल को कहां कॉन्फ़िगर करना है इसका एक उदाहरण निम्नलिखित है।

तालिका के नाम इस प्रकार प्राप्त किए जा सकते हैं:

संदर्भ एम्बेडिंग डेटा के लिए, AWS CDK आउटपुट से सेंट्रोइड तालिका नाम पुनर्प्राप्त करें CentroidTableReference
शीघ्र एम्बेडिंग डेटा के लिए, AWS CDK आउटपुट से सेंट्रोइड तालिका नाम पुनर्प्राप्त करें CentroidTablePrompts

संदर्भ डेटा से शीघ्र दूरी का विश्लेषण करें

सबसे पहले, AWS ग्लू कार्य चलाएँ embedding-distance-analysis. यह कार्य संदर्भ डेटा एम्बेडिंग के के-मीन्स मूल्यांकन से यह पता लगाएगा कि प्रत्येक प्रॉम्प्ट किस क्लस्टर से संबंधित है। इसके बाद यह प्रत्येक प्रॉम्प्ट से संबंधित क्लस्टर के केंद्र तक की दूरी के माध्य, माध्यिका और मानक विचलन की गणना करता है।

आप नोटबुक चला सकते हैं pattern1-rag/notebooks/distance-analysis.ipynb समय के साथ दूरी मेट्रिक्स में रुझान देखने के लिए। इससे आपको त्वरित एम्बेडिंग दूरियों के वितरण में समग्र रुझान का एहसास होगा।

नोटबुक pattern1-rag/notebooks/prompt-distance-outliers.ipynb एक AWS ग्लू नोटबुक है जो आउटलेर्स की तलाश करती है, जो आपको यह पहचानने में मदद कर सकती है कि क्या आपको अधिक संकेत मिल रहे हैं जो संदर्भ डेटा से संबंधित नहीं हैं।

समानता स्कोर की निगरानी करें

ओपनसर्च सेवा से सभी समानता स्कोर लॉग इन हैं अमेज़ॅन क्लाउडवॉच नीचे rag नामस्थान. डैशबोर्ड RAG_Scores औसत स्कोर और ग्रहण किए गए स्कोर की कुल संख्या दिखाता है।

क्लीन अप

भविष्य में शुल्क लगने से बचने के लिए, अपने द्वारा बनाए गए सभी संसाधनों को हटा दें।

तैनात सेजमेकर मॉडल हटाएं

के सफ़ाई अनुभाग का संदर्भ लें उदाहरण नोटबुक प्रदान की गई तैनात सेजमेकर जम्पस्टार्ट मॉडल को हटाने के लिए, या आप कर सकते हैं सेजमेकर कंसोल पर मॉडल हटाएं.

AWS CDK संसाधन हटाएँ

यदि आपने अपना पैरामीटर a में दर्ज किया है cdk.context.json फ़ाइल को इस प्रकार साफ़ करें:

$ cd pattern1-rag/cdk
$ cdk destroy --all

यदि आपने कमांड लाइन पर अपने पैरामीटर दर्ज किए हैं और केवल बैकएंड एप्लिकेशन (बैकएंड एडब्ल्यूएस सीडीके स्टैक) तैनात किया है, तो निम्नानुसार सफाई करें:

$ cd pattern1-rag/cdk
$ cdk destroy --all
    -c textModelEndpointName=<Enter the SageMaker Endpoint Name for the Text generation model> 
    -c embeddingsModelEndpointName=<Enter the SageMaker Endpoint Name for the Text embeddings model>

यदि आपने कमांड लाइन पर अपने पैरामीटर दर्ज किए हैं और पूर्ण समाधान (फ्रंटएंड और बैकएंड एडब्ल्यूएस सीडीके स्टैक) तैनात किया है, तो निम्नानुसार सफाई करें:

$ cd pattern1-rag/cdk
$ cdk destroy --all -c appCustomDomainName=<Enter Custom Domain Name to be used for Frontend App> 
    -c loadBalancerOriginCustomDomainName=<Enter Custom Domain Name to be used for Load Balancer Origin> 
    -c customDomainRoute53HostedZoneID=<Enter Route53 Hosted Zone ID for the Custom Domain being used> 
    -c customDomainRoute53HostedZoneName=<Enter Route53 Hostedzone Name> 
    -c customDomainCertificateArn=<Enter ACM Certificate ARN for Custom Domains provided> 
    -c textModelEndpointName=<Enter the SageMaker Endpoint Name for the Text generation model> 
    -c embeddingsModelEndpointName=<Enter the SageMaker Endpoint Name for the Text embeddings model>

निष्कर्ष

इस पोस्ट में, हमने एक एप्लिकेशन का एक कामकाजी उदाहरण प्रदान किया है जो जेनरेटिव एआई के लिए आरएजी पैटर्न में संदर्भ डेटा और प्रॉम्प्ट दोनों के लिए एम्बेडिंग वैक्टर को कैप्चर करता है। हमने दिखाया कि यह निर्धारित करने के लिए क्लस्टरिंग विश्लेषण कैसे किया जाए कि क्या संदर्भ या त्वरित डेटा समय के साथ बह रहा है, और संदर्भ डेटा उपयोगकर्ताओं द्वारा पूछे जाने वाले प्रश्नों के प्रकारों को कितनी अच्छी तरह कवर करता है। यदि आप बहाव का पता लगाते हैं, तो यह संकेत दे सकता है कि वातावरण बदल गया है और आपके मॉडल को नए इनपुट मिल रहे हैं जिन्हें संभालने के लिए इसे अनुकूलित नहीं किया जा सकता है। यह बदलते इनपुट के विरुद्ध वर्तमान मॉडल के सक्रिय मूल्यांकन की अनुमति देता है।

लेखक के बारे में

अब्दुल्लाही ओलाओये अमेज़ॅन वेब सर्विसेज (एडब्ल्यूएस) में एक वरिष्ठ समाधान वास्तुकार हैं। अब्दुल्लाही के पास विचिटा स्टेट यूनिवर्सिटी से कंप्यूटर नेटवर्किंग में एमएससी है और वह एक प्रकाशित लेखक हैं, जिन्होंने डेवऑप्स, इंफ्रास्ट्रक्चर आधुनिकीकरण और एआई जैसे विभिन्न प्रौद्योगिकी डोमेन में भूमिकाएँ निभाई हैं। वह वर्तमान में जेनेरेटिव एआई पर ध्यान केंद्रित कर रहे हैं और जेनेरेटिव एआई द्वारा संचालित अत्याधुनिक समाधानों को तैयार करने और बनाने में उद्यमों की सहायता करने में महत्वपूर्ण भूमिका निभाते हैं। प्रौद्योगिकी के दायरे से परे, उसे अन्वेषण की कला में आनंद मिलता है। जब वह एआई समाधान तैयार नहीं कर रहे होते हैं, तो उन्हें नई जगहों का पता लगाने के लिए अपने परिवार के साथ यात्रा करने में आनंद आता है।

रैंडी डेफॉउ AWS में वरिष्ठ प्रिंसिपल सॉल्यूशंस आर्किटेक्ट हैं। उनके पास मिशिगन विश्वविद्यालय से एमएसईई है, जहां उन्होंने स्वायत्त वाहनों के लिए कंप्यूटर विज़न पर काम किया। उन्होंने कोलोराडो स्टेट यूनिवर्सिटी से एमबीए भी किया है। रैंडी ने प्रौद्योगिकी क्षेत्र में सॉफ्टवेयर इंजीनियरिंग से लेकर उत्पाद प्रबंधन तक विभिन्न पदों पर काम किया है। 2013 में बिग डेटा क्षेत्र में प्रवेश किया और उस क्षेत्र का पता लगाना जारी रखा। वह एमएल क्षेत्र में परियोजनाओं पर सक्रिय रूप से काम कर रहे हैं और उन्होंने स्ट्रेटा और ग्लूकॉन सहित कई सम्मेलनों में प्रस्तुति दी है।

शेल्बी आइजेनब्रोड Amazon Web Services (AWS) में प्रिंसिपल AI और मशीन लर्निंग स्पेशलिस्ट सॉल्यूशंस आर्किटेक्ट हैं। वह कई उद्योगों, प्रौद्योगिकियों और भूमिकाओं में फैले 24 वर्षों से प्रौद्योगिकी में है। वह वर्तमान में अपने DevOps और ML पृष्ठभूमि को MLOps के डोमेन में संयोजित करने पर ध्यान केंद्रित कर रही है ताकि ग्राहकों को बड़े पैमाने पर ML वर्कलोड वितरित करने और प्रबंधित करने में मदद मिल सके। विभिन्न प्रौद्योगिकी डोमेन में 35 से अधिक पेटेंट दिए जाने के साथ, उन्हें निरंतर नवाचार और व्यावसायिक परिणामों को चलाने के लिए डेटा का उपयोग करने का जुनून है। शेल्बी कौरसेरा पर प्रैक्टिकल डेटा साइंस विशेषज्ञता के सह-निर्माता और प्रशिक्षक हैं। वह डेनवर चैप्टर में वीमेन इन बिग डेटा (वाईबीडी) की सह-निदेशक भी हैं। अपने खाली समय में, वह अपने परिवार, दोस्तों और अति सक्रिय कुत्तों के साथ समय बिताना पसंद करती है।

एसईओ संचालित सामग्री और पीआर वितरण। आज ही प्रवर्धित हो जाओ।
प्लेटोडेटा.नेटवर्क वर्टिकल जेनरेटिव एआई। स्वयं को शक्तिवान बनाएं। यहां पहुंचें।
प्लेटोआईस्ट्रीम। Web3 इंटेलिजेंस। ज्ञान प्रवर्धित। यहां पहुंचें।
प्लेटोईएसजी. कार्बन, क्लीनटेक, ऊर्जा, पर्यावरण, सौर, कचरा प्रबंधन। यहां पहुंचें।
प्लेटोहेल्थ। बायोटेक और क्लिनिकल परीक्षण इंटेलिजेंस। यहां पहुंचें।
स्रोत: https://aws.amazon.com/blogs/machine-learning/monitor-embedding-drift-for-llms-deployed-from-amazon-sagemaker-jumpstart/

समय टिकट: फ़रवरी 2, 2024

समय टिकट: 11 मई 2022

प्लेटो द्वारा पुनर्प्रकाशित

Amazon SageMaker | का उपयोग करके एक ईमेल स्पैम डिटेक्टर बनाएं अमेज़न वेब सेवाएँ

MongoDB समय श्रृंखला संग्रह और अमेज़ॅन सेजमेकर कैनवस के साथ समय-से-अंतर्दृष्टि में तेजी लाना | अमेज़न वेब सेवाएँ

Amazon SageMaker का उपयोग करके टेराफॉर्म के साथ मशीन लर्निंग पाइपलाइनों को तैनात और प्रबंधित करें

अमेज़ॅन सेजमेकर कैनवास और अमेज़ॅन क्विकसाइट के साथ बुद्धिमान निर्णय लेने में सक्षम करें

लूप में मानव के साथ स्वचालित खोजपूर्ण डेटा विश्लेषण और मॉडल संचालन ढांचा

वैयक्तिकृत मशीन लर्निंग और Amazon SageMaker का उपयोग करके वाहन में आराम प्राप्त करें

हमारे बारे में

ऊर्ध्वाधर खोज और ऐ

मंच

जुड़े रहें

लेखा