पोस्ट में पेश है AWS ProServe Hadoop Migration Delivery Kit TCO टूल, हमने AWS ProServe Hadoop माइग्रेशन डिलीवरी किट (HMDK) TCO टूल और ऑन-प्रिमाइसेस Hadoop वर्कलोड को माइग्रेट करने के लाभों की शुरुआत की अमेज़ॅन ईएमआर. इस पोस्ट में, हम टीसीओ की गणना करने के लिए लॉग अंतर्ग्रहण, परिवर्तन, विज़ुअलाइज़ेशन और आर्किटेक्चर डिज़ाइन से सभी चरणों के माध्यम से टूल में गहराई तक जाते हैं।
समाधान अवलोकन
आइए संक्षेप में HMDK TCO टूल की प्रमुख विशेषताओं पर जाएँ। उपकरण YARN लॉग एकत्र करने के लिए Hadoop संसाधन प्रबंधक को जोड़ने के लिए YARN लॉग संग्राहक प्रदान करता है। एक पायथन-आधारित Hadoop कार्यभार विश्लेषक, जिसे YARN लॉग विश्लेषक कहा जाता है, Hadoop अनुप्रयोगों की छानबीन करता है। अमेज़न क्विकसाइट डैशबोर्ड विश्लेषक से परिणाम दिखाते हैं। वही परिणाम भविष्य के ईएमआर उदाहरणों के डिजाइन को भी तेज करते हैं। इसके अतिरिक्त, एक टीसीओ कैलकुलेटर माइग्रेशन की सुविधा के लिए एक अनुकूलित ईएमआर क्लस्टर का टीसीओ अनुमान उत्पन्न करता है।
अब देखते हैं कि टूल कैसे काम करता है। निम्नलिखित आरेख एंड-टू-एंड वर्कफ़्लो दिखाता है।
अगले अनुभागों में, हम टूल के पाँच मुख्य चरणों से गुजरते हैं:
- YARN जॉब हिस्ट्री लॉग लीजिए।
- कार्य इतिहास लॉग को JSON से CSV में बदलें।
- कार्य इतिहास लॉग का विश्लेषण करें।
- माइग्रेशन के लिए EMR क्लस्टर डिज़ाइन करें।
- टीसीओ की गणना करें।
.. पूर्वापेक्षाएँ
आरंभ करने से पहले, निम्नलिखित पूर्वापेक्षाओं को पूरा करना सुनिश्चित करें:
- क्लोन किया गया हडूप-माइग्रेशन-असेसमेंट-टीको रिपॉजिटरी.
- अपने स्थानीय मशीन पर पायथन 3 स्थापित करें।
- अनुमति के साथ AWS खाता है AWS लाम्बा, क्विकसाइट (एंटरप्राइज़ संस्करण), और एडब्ल्यूएस CloudFormation.
YARN जॉब हिस्ट्री लॉग लीजिए
सबसे पहले, आप एक चलाते हैं यार्न लॉग कलेक्टर, start-collector.sh, आपकी स्थानीय मशीन पर। यह चरण Hadoop YARN लॉग एकत्र करता है और लॉग को आपकी स्थानीय मशीन पर रखता है। स्क्रिप्ट आपकी स्थानीय मशीन को हडूप प्राथमिक नोड से जोड़ती है और संसाधन प्रबंधक के साथ संचार करती है। फिर यह YARN ResourceManager एप्लिकेशन API को कॉल करके नौकरी के इतिहास की जानकारी (एप्लिकेशन प्रबंधकों से YARN लॉग) को पुनः प्राप्त करता है।
YARN लॉग कलेक्टर को चलाने से पहले, आपको YARN संसाधन प्रबंधक की पहुंच को सत्यापित करने के लिए कनेक्शन (HTTP: 8088 या HTTPS: 8090; बाद की सिफारिश की गई है) को कॉन्फ़िगर और स्थापित करने की आवश्यकता है और YARN टाइमलाइन सर्वर (टाइमलाइन सर्वर v1 या बाद में समर्थित हैं) को सक्षम किया गया है। ). आपको YARN लॉग के संग्रह अंतराल और अवधारण नीति को परिभाषित करने की आवश्यकता हो सकती है। यह सुनिश्चित करने के लिए कि आप लगातार YARN लॉग एकत्र करते हैं, आप लॉग कलेक्टर को उचित समय अंतराल में शेड्यूल करने के लिए क्रॉन जॉब का उपयोग कर सकते हैं। उदाहरण के लिए, 2,000 दैनिक अनुप्रयोगों के साथ एक Hadoop क्लस्टर के लिए और 1,000 पर सेट यार्न.संसाधन प्रबंधक.मैक्स-पूर्ण-अनुप्रयोग, सैद्धांतिक रूप से, आपको सभी YARN लॉग प्राप्त करने के लिए लॉग कलेक्टर को कम से कम दो बार चलाना होगा। इसके अलावा, हम समग्र कार्यभार का विश्लेषण करने के लिए कम से कम 7 दिनों के YARN लॉग एकत्र करने की सलाह देते हैं।
लॉग कलेक्टर को कॉन्फ़िगर और शेड्यूल करने के तरीके के बारे में अधिक जानकारी के लिए देखें यार्न-लॉग-कलेक्टर GitHub रेपो.
YARN जॉब हिस्ट्री लॉग को JSON से CSV में बदलें
YARN लॉग प्राप्त करने के बाद, आप YARN लॉग आयोजक, यार्न-लॉग-Organizer.py चलाते हैं, जो JSON-आधारित लॉग को CSV फ़ाइलों में बदलने के लिए एक पार्सर है। ये आउटपुट CSV फाइलें YARN लॉग एनालाइजर के लिए इनपुट हैं। पार्सर में अन्य क्षमताएँ भी होती हैं, जिसमें समय के अनुसार घटनाओं को छाँटना, समर्पित को हटाना और कई लॉग को मर्ज करना शामिल है।
यार्न लॉग आयोजक का उपयोग कैसे करें के बारे में अधिक जानकारी के लिए देखें यार्न-लॉग-आयोजक GitHub रेपो.
YARN जॉब हिस्ट्री लॉग का विश्लेषण करें
इसके बाद, आप CSV प्रारूप में YARN लॉग का विश्लेषण करने के लिए YARN लॉग एनालाइज़र लॉन्च करते हैं।
QuickSight के साथ, आप YARN लॉग डेटा की कल्पना कर सकते हैं और पूर्व-निर्मित डैशबोर्ड टेम्प्लेट और एक विजेट द्वारा उत्पन्न डेटासेट के विरुद्ध विश्लेषण कर सकते हैं। विजेट स्वचालित रूप से लक्ष्य AWS खाते में QuickSight डैशबोर्ड बनाता है, जिसे CloudFormation टेम्प्लेट में कॉन्फ़िगर किया गया है।
निम्न आरेख HMDK TCO आर्किटेक्चर को दिखाता है।
यार्न लॉग एनालाइजर चार प्रमुख कार्यात्मकताएं प्रदान करता है:
- परिवर्तित YARN कार्य इतिहास लॉग को CSV प्रारूप में अपलोड करें (उदाहरण के लिए,
cluster_yarn_logs_*.csv
) करने के लिए अमेज़न सरल भंडारण सेवा (अमेज़न S3) बाल्टियाँ। ये CSV फ़ाइलें YARN लॉग आयोजक के आउटपुट हैं। - एक मेनिफ़ेस्ट JSON फ़ाइल बनाएँ (उदाहरण के लिए,
yarn-log-manifest.json
) QuickSight के लिए और इसे S3 बकेट पर अपलोड करें: - CloudFormation टेम्प्लेट का उपयोग करके QuickSight डैशबोर्ड को तैनात करें, जो कि YAML प्रारूप में है। परिनियोजित करने के बाद, तब तक ताज़ा करें आइकन चुनें जब तक आपको स्टैक की स्थिति इस रूप में दिखाई न दे
CREATE_COMPLETE
. यह चरण आपके AWS लक्ष्य खाते में QuickSight डैशबोर्ड पर डेटासेट बनाता है। - QuickSight डैशबोर्ड पर, आप विभिन्न चार्ट्स से विश्लेषण किए गए Hadoop वर्कलोड की जानकारी पा सकते हैं। ये अंतर्दृष्टि आपको माइग्रेशन त्वरण के लिए भावी ईएमआर उदाहरणों को डिजाइन करने में मदद करती हैं, जैसा कि अगले चरण में दिखाया गया है।
माइग्रेशन के लिए EMR क्लस्टर डिज़ाइन करें
YARN लॉग एनालाइज़र के परिणाम आपको मौजूदा सिस्टम पर वास्तविक Hadoop वर्कलोड को समझने में मदद करते हैं। यह चरण एक का उपयोग करके माइग्रेशन के लिए भविष्य के ईएमआर उदाहरणों को डिजाइन करने में तेजी लाता है एक्सेल टेम्पलेट. टेम्पलेट में वर्कलोड विश्लेषण और क्षमता नियोजन करने के लिए एक चेकलिस्ट शामिल है:
- क्या क्लस्टर पर चल रहे एप्लीकेशन का उनकी वर्तमान क्षमता के साथ उचित उपयोग किया जा रहा है?
- क्लस्टर एक निश्चित समय पर लोड होता है या नहीं? यदि हां, तो समय कब है?
- क्लस्टर पर किस प्रकार के एप्लिकेशन और इंजन (जैसे MR, TEZ, या Spark) चल रहे हैं, और प्रत्येक प्रकार के लिए संसाधन उपयोग क्या है?
- क्या एक क्लस्टर में अलग-अलग जॉब रन साइकिल (रीयल-टाइम, बैच, तदर्थ) चल रहे हैं?
- क्या कोई नौकरी नियमित बैचों में चल रही है, और यदि हां, तो ये शेड्यूल अंतराल क्या हैं? (उदाहरण के लिए, प्रत्येक 10 मिनट, 1 घंटा, 1 दिन।) क्या आपके पास ऐसी नौकरियां हैं जो लंबी अवधि के दौरान बहुत सारे संसाधनों का उपयोग करती हैं?
- क्या किसी कार्य के प्रदर्शन में सुधार की आवश्यकता है?
- क्या कोई विशिष्ट संगठन या व्यक्ति क्लस्टर पर एकाधिकार कर रहे हैं?
- क्या कोई मिश्रित विकास और संचालन कार्य एक क्लस्टर में चल रहे हैं?
चेकलिस्ट को पूरा करने के बाद, आपको इस बात की बेहतर समझ होगी कि भविष्य की वास्तुकला को कैसे डिज़ाइन किया जाए। EMR क्लस्टर लागत प्रभावशीलता को अनुकूलित करने के लिए, निम्न तालिका उचित प्रकार के EMR क्लस्टर को चुनने के सामान्य दिशानिर्देश प्रदान करती है और अमेज़ॅन इलास्टिक कम्प्यूट क्लाउड (अमेज़न EC2) परिवार।
उचित क्लस्टर प्रकार और उदाहरण परिवार का चयन करने के लिए, आपको विभिन्न मानदंडों के आधार पर YARN लॉग के विश्लेषण के कई दौर करने की आवश्यकता है। आइए कुछ प्रमुख मीट्रिक देखें।
समयरेखा
आप टाइम विंडो में चल रहे Hadoop एप्लिकेशन की संख्या के आधार पर वर्कलोड पैटर्न पा सकते हैं। उदाहरण के लिए, दैनिक या प्रति घंटा चार्ट "स्टार्टेडटाइम द्वारा रिकॉर्ड्स की संख्या" निम्नलिखित अंतर्दृष्टि प्रदान करते हैं:
- दैनिक समय श्रृंखला चार्ट में, आप कार्य दिवसों और छुट्टियों के बीच और कैलेंडर दिनों के बीच चलने वाले एप्लिकेशन की संख्या की तुलना करते हैं। यदि संख्याएँ समान हैं, तो इसका अर्थ है कि क्लस्टर का दैनिक उपयोग तुलनीय है। दूसरी ओर, यदि विचलन बड़ा है, तदर्थ नौकरियों का अनुपात महत्वपूर्ण है। आप विशेष दिनों में संभावित साप्ताहिक या मासिक नौकरियों का भी पता लगा सकते हैं। स्थिति में, आप आसानी से एक सप्ताह या एक महीने में उच्च वर्कलोड एकाग्रता के साथ विशिष्ट दिन देख सकते हैं।
- प्रति घंटा समय श्रृंखला चार्ट में, आप आगे समझते हैं कि प्रति घंटा विंडो में एप्लिकेशन कैसे चलते हैं। आप एक दिन में पीक और ऑफ-पीक घंटे पा सकते हैं।
उपयोगकर्ता
YARN लॉग में प्रत्येक एप्लिकेशन की उपयोगकर्ता आईडी होती है। यह जानकारी आपको यह समझने में मदद करती है कि कतार में कौन आवेदन जमा करता है। प्रति कतार और प्रति उपयोगकर्ता चलने वाले व्यक्तिगत और समेकित अनुप्रयोग के आँकड़ों के आधार पर, आप उपयोगकर्ता द्वारा मौजूदा वर्कलोड वितरण निर्धारित कर सकते हैं। आम तौर पर, एक ही टीम के उपयोगकर्ताओं की कतारें साझा होती हैं। कभी-कभी, कई टीमों ने कतारें साझा की हैं। उपयोगकर्ताओं के लिए क्यू डिज़ाइन करते समय, अब आपके पास ऐसे एप्लिकेशन वर्कलोड को डिज़ाइन और वितरित करने में मदद करने के लिए अंतर्दृष्टि है जो क्यू में पहले की तुलना में अधिक संतुलित हैं।
आवेदन प्रकार
आप विभिन्न एप्लिकेशन प्रकारों (जैसे हाइव, स्पार्क, प्रेस्टो, या HBase) के आधार पर वर्कलोड को विभाजित कर सकते हैं और इंजन (जैसे MR, Spark, या Tez) चला सकते हैं। कंप्यूट-हैवी वर्कलोड जैसे MapReduce या Hive-on-MR जॉब के लिए, CPU-अनुकूलित इंस्टेंसेस का उपयोग करें। मेमोरी-इंटेंसिव वर्कलोड जैसे हाइव-ऑन-टीईजेड, प्रेस्टो और स्पार्क जॉब्स के लिए, मेमोरी-ऑप्टिमाइज़्ड इंस्टेंसेस का उपयोग करें।
बीता हुआ समय
आप रनटाइम द्वारा अनुप्रयोगों को वर्गीकृत कर सकते हैं। एम्बेडेड CloudFormation टेम्प्लेट स्वचालित रूप से QuickSight डैशबोर्ड में एक बीता हुआ समूह फ़ील्ड बनाता है। यह आपको QuickSight डैशबोर्ड पर चार में से एक चार्ट में लंबे समय तक चलने वाली नौकरियों का निरीक्षण करने की अनुमति देने के लिए एक प्रमुख विशेषता को सक्षम करता है। इसलिए, आप इन बड़ी नौकरियों के लिए भविष्य के आर्किटेक्चर को डिजाइन कर सकते हैं।
इसी QuickSight डैशबोर्ड में चार चार्ट शामिल हैं। आप प्रत्येक चार्ट को ड्रिल डाउन कर सकते हैं, जो एक समूह से संबद्ध है।
समूह नंबर |
नौकरी का रनटाइम / बीता हुआ समय |
1 | 10 मिनट से भी कम |
2 | 10 मिनट और 30 मिनट के बीच |
3 | 30 मिनट और 1 घंटे के बीच |
4 | 1 घंटे से अधिक |
समूह 4 के चार्ट में, आप उपयोगकर्ता, कतार, आवेदन प्रकार, समयरेखा, संसाधन उपयोग आदि सहित विभिन्न मेट्रिक्स के आधार पर बड़ी नौकरियों की छानबीन पर ध्यान केंद्रित कर सकते हैं। इस विचार के आधार पर, आपके पास क्लस्टर पर समर्पित कतारें या बड़े कार्यों के लिए समर्पित EMR क्लस्टर हो सकते हैं। इस बीच, आप साझा क्यू में छोटे कार्य सबमिट कर सकते हैं।
उपयुक्त संसाधन चुनें
संसाधन (सीपीयू, मेमोरी) खपत पैटर्न के आधार पर, आप प्रदर्शन और लागत प्रभावशीलता के लिए ईसी2 उदाहरणों का सही आकार और परिवार चुनते हैं। संगणना-गहन अनुप्रयोगों के लिए, हम CPU-अनुकूलित परिवारों के उदाहरणों की अनुशंसा करते हैं। स्मृति-गहन अनुप्रयोगों के लिए, स्मृति-अनुकूलित उदाहरण परिवारों की अनुशंसा की जाती है।
इसके अलावा, समय के साथ एप्लिकेशन वर्कलोड और संसाधन उपयोग की प्रकृति के आधार पर, आप एक स्थायी या क्षणिक EMR क्लस्टर चुन सकते हैं, ईकेएस पर अमेज़न ईएमआरया, अमेज़ॅन ईएमआर सर्वर रहित.
विभिन्न मेट्रिक्स द्वारा YARN लॉग का विश्लेषण करने के बाद, आप भविष्य के EMR आर्किटेक्चर को डिज़ाइन करने के लिए तैयार हैं। निम्न तालिका प्रस्तावित EMR समूहों के उदाहरण सूचीबद्ध करती है। आप में अधिक विवरण प्राप्त कर सकते हैं अनुकूलित-tco-कैलकुलेटर GitHub रेपो.
टीसीओ की गणना करें
अंत में, अपनी स्थानीय मशीन पर, अनुकूलित टीसीओ की गणना करने के लिए एक्सेल टेम्पलेट का उपयोग करने से पहले घंटे के आधार पर यार्न जॉब हिस्ट्री लॉग को एकत्रित करने के लिए tco-input-generator.py चलाएं। यह कदम महत्वपूर्ण है क्योंकि परिणाम भविष्य के EMR उदाहरणों में Hadoop वर्कलोड का अनुकरण करते हैं।
टीसीओ सिमुलेशन की शर्त चलाना है tco-input-generator.py
, जो प्रति घंटा एकत्रित लॉग उत्पन्न करता है। अगला, आप मैक्रोज़ को सक्षम करने के लिए एक एक्सेल टेम्प्लेट फ़ाइल खोलते हैं और TCO की गणना के लिए हरे रंग की कोशिकाओं में अपने इनपुट प्रदान करते हैं। इनपुट डेटा के संबंध में, आप प्रतिकृति के बिना वास्तविक डेटा आकार और Hadoop प्राथमिक नोड और डेटा नोड्स के हार्डवेयर विनिर्देशों (vCore, mem) में प्रवेश करते हैं। आपको पहले से जनरेट किए गए प्रति घंटा समेकित लॉग को भी चुनना और अपलोड करना होगा। आपके द्वारा TCO सिमुलेशन चर सेट करने के बाद, जैसे कि क्षेत्र, EC2 प्रकार, Amazon EMR उच्च उपलब्धता, इंजन प्रभाव, Amazon EC2 और Amazon EBS छूट (EDP), Amazon S3 वॉल्यूम छूट, स्थानीय मुद्रा दर और EMR EC2 टास्क/कोर मूल्य निर्धारण अनुपात और कीमत/घंटा, टीसीओ सिम्यूलेटर स्वचालित रूप से अमेज़ॅन ईसी2 पर भविष्य के ईएमआर उदाहरणों की इष्टतम लागत की गणना करता है। निम्न स्क्रीनशॉट HMDK TCO परिणामों का एक उदाहरण दिखाते हैं।
एचएमडीके टीसीओ गणनाओं की अतिरिक्त जानकारी और निर्देशों के लिए देखें अनुकूलित-tco-कैलकुलेटर GitHub रेपो.
क्लीन अप
सभी चरणों को पूरा करने और परीक्षण समाप्त करने के बाद, लागत लगने से बचने के लिए संसाधनों को हटाने के लिए निम्न चरणों को पूरा करें:
- AWS CloudFormation कंसोल पर, आपके द्वारा बनाए गए स्टैक को चुनें।
- चुनें मिटाना.
- चुनें स्टैक हटाएं.
- स्थिति देखने तक पृष्ठ को ताज़ा करें
DELETE_COMPLETE
. - Amazon S3 कंसोल पर, आपके द्वारा बनाए गए S3 बकेट को हटाएं।
निष्कर्ष
AWS ProServe HMDK TCO टूल माइग्रेशन प्लानिंग के प्रयासों को काफी कम कर देता है, जो आपके Hadoop वर्कलोड का आकलन करने के लिए समय लेने वाली और चुनौतीपूर्ण कार्य हैं। एचएमडीके टीसीओ उपकरण के साथ, मूल्यांकन में आमतौर पर 2-3 सप्ताह लगते हैं। आप भविष्य के EMR आर्किटेक्चर के परिकलित TCO का भी निर्धारण कर सकते हैं। HMDK TCO टूल के साथ, आप अपने कार्यभार और संसाधन उपयोग के पैटर्न को जल्दी से समझने में सक्षम हैं। उपकरण द्वारा उत्पन्न अंतर्दृष्टि के साथ, आप इष्टतम भविष्य ईएमआर आर्किटेक्चर डिजाइन करने के लिए सुसज्जित हैं। उपयोग के कई मामलों में, अनुकूलित रिफैक्टर आर्किटेक्चर का 1-वर्ष का टीसीओ लिफ्ट-एंड-शिफ्ट हडूप माइग्रेशन की तुलना में गणना और भंडारण पर महत्वपूर्ण लागत बचत (64-80% की कमी) प्रदान करता है।
अपने Hadoop माइग्रेशन को Amazon EMR और HMDK CTO टूल में तेजी लाने के बारे में अधिक जानने के लिए देखें Hadoop माइग्रेशन डिलीवरी किट TCO GitHub रेपो, या संपर्क करें एडब्ल्यूएस-HMDK@amazon.com.
लेखक के बारे में
सुंगयौल पार्क AWS ProServe में सीनियर प्रैक्टिस मैनेजर हैं। वह ग्राहकों को AWS एनालिटिक्स, IoT और AI/ML सेवाओं के साथ अपने व्यवसाय को नया करने में मदद करता है। बिग डेटा सेवाओं और प्रौद्योगिकियों में उनकी विशेषज्ञता है और ग्राहक व्यवसाय परिणामों को एक साथ बनाने में उनकी रुचि है।
जीसेओंग किम AWS ProServe में सीनियर डेटा आर्किटेक्ट हैं। वह मुख्य रूप से डेटा लेक माइग्रेशन और आधुनिकीकरण में मदद करने के लिए उद्यम ग्राहकों के साथ काम करता है, और हडूप, स्पार्क, डेटा वेयरहाउसिंग, रीयल-टाइम डेटा प्रोसेसिंग और बड़े पैमाने पर मशीन लर्निंग जैसी बड़ी डेटा परियोजनाओं पर मार्गदर्शन और तकनीकी सहायता प्रदान करता है। वह यह भी समझता है कि बड़ी डेटा समस्याओं को हल करने के लिए तकनीकों को कैसे लागू किया जाए और एक अच्छी तरह से डिज़ाइन किए गए डेटा आर्किटेक्चर का निर्माण किया जाए।
जॉर्ज झाओ AWS ProServe में सीनियर डेटा आर्किटेक्ट हैं। वह आधुनिक डेटा समाधान देने के लिए AWS ग्राहकों के साथ काम करने वाले एक अनुभवी एनालिटिक्स लीडर हैं। वह एक ProServe Amazon EMR डोमेन विशेषज्ञ भी हैं, जो ProServe सलाहकारों को Hadoop से Amazon EMR माइग्रेशन के लिए सर्वोत्तम प्रथाओं और वितरण किटों पर सक्षम बनाता है। उनकी रुचि का क्षेत्र डेटा लेक और क्लाउड मॉडर्न डेटा आर्किटेक्चर डिलीवरी है।
कालेन झांग AWS में पार्टनर डेटा और एनालिटिक्स के ग्लोबल सेगमेंट टेक लीड थे। डेटा और एनालिटिक्स के एक विश्वसनीय सलाहकार के रूप में, उन्होंने डेटा ट्रांसफ़ॉर्मेशन, लीड डेटा और एनालिटिक्स वर्कलोड माइग्रेशन और आधुनिकीकरण कार्यक्रमों के लिए रणनीतिक पहल की, और बड़े पैमाने पर भागीदारों के साथ त्वरित ग्राहक माइग्रेशन यात्राएँ कीं। वह डिस्ट्रीब्यूटेड सिस्टम्स, एंटरप्राइज डेटा मैनेजमेंट, एडवांस्ड एनालिटिक्स और बड़े पैमाने पर रणनीतिक पहलों में माहिर हैं।
- एसईओ संचालित सामग्री और पीआर वितरण। आज ही प्रवर्धित हो जाओ।
- प्लेटोब्लॉकचैन। Web3 मेटावर्स इंटेलिजेंस। ज्ञान प्रवर्धित। यहां पहुंचें।
- स्रोत: https://aws.amazon.com/blogs/big-data/deep-dive-into-the-aws-proserve-hadoop-migration-delivery-kit-tco-tool/
- 000
- 1
- 10
- 100
- 7
- a
- योग्य
- About
- में तेजी लाने के
- त्वरित
- तेज करता
- तेज
- त्वरण
- एक्सेसिबिलिटी
- लेखा
- के पार
- Ad
- इसके अलावा
- अतिरिक्त
- अतिरिक्त जानकारी
- इसके अतिरिक्त
- उन्नत
- सलाहकार
- बाद
- के खिलाफ
- ऐ / एमएल
- सब
- वीरांगना
- अमेज़ॅन EC2
- अमेज़ॅन ईएमआर
- के बीच में
- विश्लेषण
- विश्लेषिकी
- विश्लेषण करें
- का विश्लेषण
- और
- एपीआई
- आवेदन
- अनुप्रयोगों
- लागू करें
- उचित रूप से
- स्थापत्य
- क्षेत्र
- मूल्यांकन
- सहायता
- जुड़े
- स्वतः
- उपलब्धता
- एडब्ल्यूएस
- एडब्ल्यूएस CloudFormation
- आधारित
- आधार
- क्योंकि
- जा रहा है
- लाभ
- BEST
- सर्वोत्तम प्रथाओं
- बेहतर
- के बीच
- बड़ा
- बड़ा डेटा
- संक्षिप्त
- निर्माण
- इमारत
- व्यापार
- गणना
- परिकलित
- गणना
- परिकलन
- कैलेंडर
- बुलाया
- बुला
- क्षमताओं
- क्षमता
- मामलों
- कोशिकाओं
- कुछ
- चुनौतीपूर्ण
- चार्ट
- चार्ट
- चुनें
- चुनने
- बादल
- समूह
- इकट्ठा
- एकत्रित
- संग्रह
- कलेक्टर
- एकत्र
- COM
- तुलनीय
- तुलना
- तुलना
- पूरा
- गणना करना
- ध्यान देना
- एकाग्रता
- आचरण
- का आयोजन
- जुडिये
- संबंध
- जोड़ता है
- लगातार
- विचार
- कंसोल
- सलाहकार
- खपत
- शामिल हैं
- इसी
- लागत
- लागत बचत
- लागत
- सी पी यू
- बनाया
- बनाता है
- मापदंड
- महत्वपूर्ण
- सीटीओ
- क्यूरेट
- मुद्रा
- वर्तमान
- ग्राहक
- ग्राहक
- चक्र
- दैनिक
- डैशबोर्ड
- तिथि
- डेटा लेक
- आँकड़ा प्रबंधन
- डेटा संसाधन
- डेटासेट
- दिन
- दिन
- समर्पित
- गहरा
- विस्तृत विश्लेषण
- उद्धार
- प्रसव
- साबित
- तैनाती
- डिज़ाइन
- डिज़ाइन बनाना
- विवरण
- निर्धारित करना
- विकास
- विचलन
- विभिन्न
- छूट
- बांटो
- वितरित
- वितरित प्रणाली
- वितरण
- डोमेन
- नीचे
- दौरान
- से प्रत्येक
- आसानी
- EBS
- संस्करण
- प्रभाव
- प्रभावशीलता
- प्रयासों
- एम्बेडेड
- सक्षम
- सक्षम
- सक्षम बनाता है
- शुरू से अंत तक
- इंजन
- इंजन
- सुनिश्चित
- दर्ज
- उद्यम
- उद्यम ग्राहकों
- सुसज्जित
- स्थापित करना
- ईथर (ईटीएच)
- घटनाओं
- प्रत्येक
- उदाहरण
- उदाहरण
- एक्सेल
- मौजूदा
- अनुभवी
- अभिनंदन करना
- परिवारों
- परिवार
- Feature
- विशेषताएं
- खेत
- आकृति
- पट्टिका
- फ़ाइलें
- खोज
- खत्म
- निम्नलिखित
- प्रारूप
- से
- कार्यक्षमताओं
- आगे
- भविष्य
- सामान्य जानकारी
- उत्पन्न
- उत्पन्न करता है
- मिल
- मिल रहा
- GitHub
- वैश्विक
- हरा
- समूह
- दिशा निर्देशों
- Hadoop
- हार्डवेयर
- मदद
- मदद करता है
- हाई
- इतिहास
- करंड
- छुट्टियां
- समग्र
- घंटे
- कैसे
- How To
- एचटीएमएल
- HTTPS
- नायक
- सुधार
- in
- शामिल
- सहित
- व्यक्ति
- व्यक्तियों
- करें-
- पहल
- कुछ नया
- निवेश
- अंतर्दृष्टि
- उदाहरण
- निर्देश
- ब्याज
- रुचियों
- शुरू की
- IOT
- IT
- काम
- नौकरियां
- यात्रा
- JSON
- कुंजी
- किट
- झील
- बड़ा
- बड़े पैमाने पर
- लांच
- नेतृत्व
- नेता
- जानें
- सीख रहा हूँ
- नेतृत्व
- एलईडी डेटा
- सूचियाँ
- भार
- स्थानीय
- लंबा
- लंबे समय तक
- देखिए
- लॉट
- मशीन
- यंत्र अधिगम
- मैक्रोज़
- मुख्य
- बनाना
- प्रबंध
- प्रबंधक
- प्रबंधक
- बहुत
- साधन
- तब तक
- याद
- विलय
- मेट्रिक्स
- प्रवास
- मिनट
- मिश्रित
- आधुनिक
- आधुनिकीकरण
- महीना
- मासिक
- अधिक
- विभिन्न
- प्रकृति
- आवश्यकता
- अगला
- नोड
- नोड्स
- संख्या
- संख्या
- निरीक्षण
- प्राप्त करने के
- ONE
- खुला
- परिचालन
- आपरेशन
- इष्टतम
- अनुकूलित
- के अनुकूलन के
- इष्टतम
- संगठनों
- अन्य
- विशेष
- साथी
- भागीदारों
- पैटर्न उपयोग करें
- शिखर
- निष्पादन
- प्रदर्शन
- अवधि
- अनुमति
- गंतव्य
- की योजना बना
- प्लेटो
- प्लेटो डेटा इंटेलिजेंस
- प्लेटोडाटा
- नीति
- संभव
- पद
- अभ्यास
- प्रथाओं
- आवश्यक शर्तें
- पहले से
- कीमत निर्धारण
- प्राथमिक
- पूर्व
- समस्याओं
- प्रसंस्करण
- प्रोग्राम्स
- परियोजनाओं
- उचित
- प्रस्तावित
- प्रदान करना
- प्रदान करता है
- अजगर
- जल्दी से
- मूल्यांकन करें
- अनुपात
- पहुंच
- तैयार
- वास्तविक समय
- वास्तविक समय डाटा
- की सिफारिश
- की सिफारिश की
- अभिलेख
- कम कर देता है
- के बारे में
- क्षेत्र
- नियमित
- हटाने
- प्रतिकृति
- संसाधन
- उपयुक्त संसाधन चुनें
- परिणाम
- प्रतिधारण
- राउंड
- रन
- दौड़ना
- वही
- बचत
- स्केल
- अनुसूची
- स्क्रीनशॉट
- वर्गों
- खंड
- वरिष्ठ
- कई
- सेवाएँ
- सेट
- की स्थापना
- कई
- साझा
- दिखाना
- प्रदर्शन
- महत्वपूर्ण
- काफी
- समान
- सरल
- अनुकार
- सिम्युलेटर
- स्थिति
- आकार
- छोटा
- So
- समाधान ढूंढे
- हल
- कुछ
- स्पार्क
- विशेषज्ञ
- माहिर
- विशेषता
- विशिष्ट
- विनिर्देशों
- धुआँरा
- शुरू
- आँकड़े
- स्थिति
- कदम
- कदम
- भंडारण
- सामरिक
- प्रस्तुत
- ऐसा
- समर्थित
- प्रणाली
- सिस्टम
- तालिका
- अनुरूप
- लेता है
- लक्ष्य
- कार्य
- टीम
- टीमों
- तकनीक
- तकनीकी
- टेक्नोलॉजीज
- टेम्पलेट
- टेम्पलेट्स
- परीक्षण
- RSI
- भविष्य
- लेकिन हाल ही
- इसलिये
- यहाँ
- पहर
- समय श्रृंखला
- बहुत समय लगेगा
- समय
- सेवा मेरे
- एक साथ
- साधन
- बदालना
- परिवर्तन
- तब्दील
- <strong>उद्देश्य</strong>
- विश्वस्त
- प्रकार
- के अंतर्गत
- समझना
- समझ
- समझता है
- प्रयोग
- उपयोग
- उपयोगकर्ता
- उपयोगकर्ताओं
- आमतौर पर
- विभिन्न
- सत्यापित
- दृश्य
- आयतन
- घूमना
- भण्डारण
- सप्ताह
- साप्ताहिक
- सप्ताह
- क्या
- एचएमबी क्या है?
- कौन कौन से
- कौन
- खिड़कियां
- बिना
- वर्कफ़्लो
- काम कर रहे
- कार्य
- यमलो
- आपका
- जेफिरनेट