सीएसवी से 5 सरल चरणों में चैटजीपीटी के साथ विश्लेषणात्मक रिपोर्ट पूरी करें - केडीनगेट्स

सीएसवी से 5 सरल चरणों में चैटजीपीटी के साथ विश्लेषणात्मक रिपोर्ट पूरी करें - केडीनगेट्स

स्रोत नोड: 2982942

सीएसवी से 5 सरल चरणों में चैटजीपीटी के साथ विश्लेषणात्मक रिपोर्ट पूरी करें
छवि द्वारा rawpixel.com on Freepik
 

इससे कोई फर्क नहीं पड़ता कि आप किस व्यवसाय में हैं, डेटा का विश्लेषण करना जानना डेटा-संचालित युग में पहले से कहीं अधिक महत्वपूर्ण है। डेटा विश्लेषण व्यवसायों को प्रतिस्पर्धी बने रहने और बेहतर निर्णय लेने की क्षमता प्रदान करने में सक्षम बनाएगा।

डेटा विश्लेषण का महत्व प्रत्येक व्यक्ति को यह जानने के लिए प्रेरित करता है कि डेटा विश्लेषण कैसे किया जाए। हालाँकि, कभी-कभी डेटा विश्लेषण करने में बहुत अधिक समय लग जाता है। इसीलिए हम अपनी डेटा फ़ाइल से संपूर्ण रिपोर्ट बनाने के लिए ChatGPT पर भरोसा कर सकते हैं।

यह आलेख आपकी CSV फ़ाइल से संपूर्ण विश्लेषणात्मक रिपोर्ट बनाने के लिए पाँच सरल चरणों का पता लगाएगा। इन पाँच चरणों में शामिल हैं:

चरण 1: सीएसवी फ़ाइल आयात करना

चरण 2: डेटा सारांश और प्रीप्रोसेसिंग

चरण 3: डेटा विश्लेषण

चरण 4: डेटा विज़ुअलाइज़ेशन

चरण 5: रिपोर्ट जनरेशन

एक शर्त के रूप में, यह लेख मानता है कि पाठक ने चैटजीपीटी प्लस की सदस्यता ले ली है। इसे ध्यान में रखते हुए, आइए शुरुआत करें।

पहला कदम वह सीएसवी फ़ाइल तैयार करना है जिसका आप विश्लेषण करना चाहते हैं और एक रिपोर्ट बनाना चाहते हैं। यह फ़ाइल किसी भी भरोसेमंद स्रोत से आ सकती है, लेकिन यह लेख टेलीकॉम मंथन डेटासेट का उपयोग करेगा Kaggle.

सुनिश्चित करें कि डेटा संरचित, व्यवस्थित और स्पष्ट हेडर है। यदि आपके पास कोई निश्चित लक्ष्य है जिसका आप विश्लेषण करना चाहते हैं, तो उस डेटा को फ़ाइल में शामिल करना न भूलें। हमारे उदाहरण में, हम मंथन कॉलम के लिए एक विश्लेषण करने का प्रयास करेंगे।

डेटा तैयार होने पर, उन्हें ChatGPT से जोड़ें और मॉडल को अपना काम करने दें।

अगला कदम हमारी सीएसवी फ़ाइल से डेटा सारांश प्राप्त करना और उन्हें प्रीप्रोसेस करना है। डेटा अपलोड करते समय निम्नलिखित संकेत इनपुट करें।

Provide the data summary to this file and perform appropriate data processing for the dataset.

उपरोक्त संकेत निम्नलिखित परिणाम प्रदान करता है:

यहां आपके डेटासेट का सारांश दिया गया है:

पंक्तियों की संख्या: 3333

स्तंभों की संख्या: 11

कॉलम नाम:

मंथन

खातासप्ताह

संविदा नवीनीकरण

डेटा योजना

डेटा उपयोग में लाया गया

कस्टसर्वकॉल्स

दिनमिनट

डेकॉल्स

मासिक शुल्क

अधिक आयु शुल्क

RoamMins

जानकारी का प्रकार:

पूर्णांक: मंथन, अकाउंटवीक्स, कॉन्ट्रैक्टरिन्यूअल, डेटाप्लान, कस्टसर्वकॉल्स, डेकॉल्स

फ़्लोट: डेटा उपयोग, दिन-मिनट, मासिक शुल्क, ओवरएज शुल्क, रोम-मिनट

लापता मूल्य: किसी भी कॉलम में कोई लुप्त मान नहीं है।

चैटजीपीटी स्पष्ट रूप से डेटा को अच्छी तरह से पढ़ सकता था और दिए गए डेटासेट प्रदान करने में सक्षम था। अगला परिणाम चैटजीपीटी से डेटा प्रीप्रोसेसिंग है।

चूँकि डेटासेट में कोई लुप्त मान नहीं हैं, डेटा सफाई और प्रीप्रोसेसिंग का मुख्य फोकस इस पर होगा:

  • डेटा में किसी भी बाहरी कारक या विसंगतियों की जाँच करना।
  • यदि आवश्यक हो तो डेटा को सामान्य बनाना या मानकीकृत करना, विशेष रूप से निरंतर संख्यात्मक मान वाले कॉलम के लिए।
  • यदि आवश्यक हो तो श्रेणीबद्ध डेटा को विश्लेषण के लिए उपयुक्त प्रारूप में परिवर्तित करना।

आइए इन चरणों के साथ आगे बढ़ें। 
 

सीएसवी से 5 सरल चरणों में चैटजीपीटी के साथ विश्लेषणात्मक रिपोर्ट पूरी करें
 

बॉक्सप्लॉट आपके डेटासेट के प्रत्येक संख्यात्मक कॉलम में संभावित आउटलेर्स का एक दृश्य अवलोकन प्रदान करते हैं। यहां कुछ अवलोकन दिए गए हैं:

  • अकाउंटवीक्स, कस्टसर्वकॉल्स, डेकॉल्स: ये कॉलम कुछ आउटलेर्स के साथ काफी सामान्य वितरण दिखाते हैं।
  • डेटा उपयोग, डेमिन्स, मासिक शुल्क, ओवरएजफी, रोममिन्स: ये कॉलम कुछ आउटलेर्स भी दिखाते हैं, लेकिन डेटा की प्रकृति को देखते हुए वे उचित सीमा के भीतर प्रतीत होते हैं।
  • मंथन, कॉन्ट्रैक्टरिन्यूअल, डेटाप्लान: श्रेणीबद्ध/बाइनरी डेटा होने के कारण, ये कॉलम पारंपरिक आउटलेर नहीं दिखाते हैं।

इस जानकारी को देखते हुए, डेटा सफाई और प्रीप्रोसेसिंग के अगले चरणों में शामिल हो सकते हैं:

  • आउटलेर्स को संभालना: हम आपकी विशिष्ट विश्लेषणात्मक आवश्यकताओं और डोमेन ज्ञान के आधार पर यह तय कर सकते हैं कि आउटलेर्स को हटाना है, सीमित करना है या अन्यथा संभालना है।
  • डेटा परिवर्तन: यदि आवश्यक हो, तो हम डेमिन्स, मंथलीचार्ज इत्यादि जैसे कॉलम को सामान्य या मानकीकृत कर सकते हैं, खासकर यदि आप ऐसे एल्गोरिदम का उपयोग करने की योजना बना रहे हैं जो डेटा के पैमाने के प्रति संवेदनशील हैं।
  • श्रेणीबद्ध डेटा एन्कोडिंग: यदि ऐसे किसी परिवर्तन की आवश्यकता है, तो श्रेणीबद्ध डेटा को विश्लेषण के लिए उपयुक्त प्रारूप में परिवर्तित करें।

आप चैटजीपीटी को डेटा की सफाई और प्रीप्रोसेसिंग के लिए अतिरिक्त कदम उठाने दे सकते हैं या इसे वैसे ही रहने दे सकते हैं। इस उदाहरण के लिए, हम अगले चरणों पर आगे बढ़ेंगे।

इसके बाद, हम चैटजीपीटी के साथ डेटा विश्लेषण करेंगे। डेटा विश्लेषण इस पर निर्भर करता है कि आप क्या हासिल करना चाहते हैं। हमारे मामले में, हम मंथन पीओवी से डेटा विश्लेषण करना चाहते हैं।

उपरोक्त मामले के लिए चैटजीपीटी के साथ डेटा विश्लेषण निष्पादित करने के लिए हम निम्नलिखित संकेत का उपयोग करते हैं।

Please perform the data analysis based on the data above with respect to the churn data.

 

डेटा विश्लेषण को निम्नलिखित परिणाम में देखा जा सकता है।

मंथन डेटा के संबंध में डेटा विश्लेषण करने के लिए, हम यह समझने पर ध्यान केंद्रित करेंगे कि विभिन्न कारक ग्राहक मंथन से कैसे संबंधित हैं। मंथन, एक द्विआधारी चर (बिना मंथन के लिए 0, मंथन के लिए 1) होने के कारण, आमतौर पर वर्गीकरण विधियों के माध्यम से और अन्य चर के साथ संबंधों की जांच करके विश्लेषण किया जाता है। यहाँ योजना है:

  1. सहसंबंध विश्लेषण: शुरू करने के लिए, हम देखेंगे कि प्रत्येक संख्यात्मक विशेषता मंथन के साथ कैसे संबंधित है। इससे हमें प्रारंभिक समझ मिलती है कि कौन से कारक मंथन से अधिक निकटता से संबंधित हो सकते हैं।
  1. सांख्यिकीय परीक्षण: कॉन्ट्रैक्टरिन्यूअल और डेटाप्लान जैसे श्रेणीबद्ध चर के लिए, हम यह देखने के लिए सांख्यिकीय परीक्षणों का उपयोग कर सकते हैं कि क्या विभिन्न श्रेणियों में मंथन दरों में महत्वपूर्ण अंतर हैं।
  1. विज़ुअल विश्लेषण: हम इन संबंधों को और अधिक जानने के लिए कुछ विज़ुअलाइज़ेशन बनाएंगे। इसमें विभिन्न समूहों में मंथन दरों की तुलना करना और मंथन के विरुद्ध प्रमुख चर की योजना बनाना शामिल है।
  1. सारांश आँकड़े: हम मंथन की स्थिति के आधार पर विभिन्न समूहों के लिए सारांश आँकड़े प्रदान करेंगे, यह देखने के लिए कि क्या साधनों या वितरण में ध्यान देने योग्य अंतर हैं।

आइए सहसंबंध विश्लेषण से शुरुआत करें और फिर अगले चरणों पर आगे बढ़ें।

मंथन के साथ सहसंबंध विश्लेषण

मंथन के साथ विभिन्न चरों का सहसंबंध इस प्रकार है (सबसे मजबूत नकारात्मक से सबसे मजबूत सकारात्मक सहसंबंध तक):

नकारात्मक सहसंबंध:

  • अनुबंध नवीनीकरण: सबसे मजबूत नकारात्मक सहसंबंध। इंगित करता है कि जो ग्राहक अपने अनुबंधों को नवीनीकृत नहीं करते हैं, उनके मंथन की संभावना अधिक होती है।
  • डेटाप्लान: बिना डेटा प्लान वाले ग्राहकों के मंथन की संभावना थोड़ी अधिक है।
  • डेटा उपयोग: अधिक डेटा उपयोग से मंथन की संभावना थोड़ी कम हो जाती है।

सकारात्मक संबंध:

  • अकाउंटवीक्स, डेकॉल्स: बहुत कमजोर सकारात्मक सहसंबंध, मंथन पर न्यूनतम प्रभाव का सुझाव देता है।
  • RoamMins: रोमिंग मिनटों में वृद्धि के साथ मंथन की संभावना में मामूली वृद्धि।
  • मासिक शुल्क: बढ़े हुए मासिक शुल्क के साथ थोड़ी अधिक मंथन दर।
  • ओवरएज शुल्क: अधिक ओवरएज शुल्क का बढ़े हुए मंथन के साथ मामूली संबंध है।
  • डेमिन्स: उच्च दैनिक मिनट बढ़े हुए मंथन के साथ मध्यम रूप से सहसंबद्ध होते हैं।
  • CustServCalls: मजबूत सकारात्मक सहसंबंध। अधिक ग्राहक सेवा कॉल उच्च मंथन दर से जुड़ी हैं।

इन सहसंबंधों के आधार पर, ऐसा लगता है कि अनुबंध नवीनीकरण, ग्राहक सेवा कॉल, दैनिक मिनट और अधिक शुल्क जैसे कारक मंथन से अधिक निकटता से संबंधित हैं। हम दृश्य विश्लेषण और सांख्यिकीय परीक्षणों के माध्यम से इन कारकों का और पता लगा सकते हैं, विशेष रूप से कॉन्ट्रैक्टरिन्यूअल और डेटाप्लान जैसे श्रेणीबद्ध चर के लिए।

दृश्य विश्लेषण

 

सीएसवी से 5 सरल चरणों में चैटजीपीटी के साथ विश्लेषणात्मक रिपोर्ट पूरी करें
 

विज़ुअलाइज़ेशन विभिन्न चर और मंथन के बीच संबंधों में मूल्यवान अंतर्दृष्टि प्रदान करते हैं:

कॉन्ट्रैक्टरिन्यूअल और डेटाप्लान द्वारा मंथन:

  • अनुबंध नवीनीकरण: मंथन दरों में एक महत्वपूर्ण अंतर स्पष्ट है। जिन ग्राहकों ने अपने अनुबंधों को नवीनीकृत नहीं किया, उनमें मंथन की दर अधिक है।
  • डेटाप्लान: ग्राहकों के पास डेटा प्लान है या नहीं, इसके आधार पर मंथन दरों में उल्लेखनीय अंतर है, बिना डेटा प्लान वाले ग्राहकों में उच्च मंथन दिखाई देता है।

मंथन द्वारा संख्यात्मक चर (कस्टसर्वकॉल, डेमिन्स, मासिक शुल्क, ओवरएज शुल्क):

  • CustServCalls: अधिक संख्या में ग्राहक सेवा कॉल वाले ग्राहक अधिक मंथन करते हैं।
  • दिन-प्रतिदिन: उच्च दैनिक मिनट मंथन की अधिक संभावना से जुड़े होते हैं।
  • मासिक शुल्क: उच्च मासिक शुल्क बढ़ी हुई मंथन दर से संबंधित है।
  • ओवरएज शुल्क: अधिक ओवरएज शुल्क भी बढ़े हुए मंथन से जुड़ा है।

विश्लेषण से निष्कर्ष

  • अनुबंध नवीनीकरण की स्थिति और डेटा प्लान की उपस्थिति ग्राहक मंथन में महत्वपूर्ण कारक हैं।
  • उच्च उपयोग (दिन मिनटों के संदर्भ में) और उच्च शुल्क (मासिक शुल्क और अधिक शुल्क) उच्च मंथन दर से जुड़े हैं।
  • ग्राहक सेवा कॉलों की अधिक संख्या संभावित मंथन का एक मजबूत संकेतक है।

अगला चरण

इन जानकारियों के आधार पर, मंथन को कम करने के लिए लक्षित रणनीतियाँ विकसित की जा सकती हैं, जैसे ग्राहक सेवा में सुधार, मूल्य निर्धारण रणनीतियों को संशोधित करना, या अनुबंध नवीनीकरण और डेटा योजना सदस्यता के लिए प्रोत्साहन की पेशकश करना।

एक संकेत के साथ, हम देख सकते हैं कि चैटजीपीटी हमें संपूर्ण डेटा विश्लेषण कितनी अच्छी तरह दे सकता है और डेटा से अंतर्दृष्टि प्राप्त कर सकता है। आप विश्लेषण के लक्ष्यों में बदलाव कर सकते हैं और वहां से शुरुआत कर सकते हैं।

डेटा विश्लेषण और समग्र रिपोर्ट को बेहतर बनाने के लिए डेटा विज़ुअलाइज़ेशन एक सहायक गतिविधि है। विज़ुअलाइज़ेशन होने से, हम अपने डेटा को समझने के लिए अधिक व्यापक रिपोर्ट प्राप्त कर सकते हैं।

निम्नलिखित संकेत का उपयोग करके, हम ChatGPT के साथ डेटा विज़ुअलाइज़ेशन कर सकते हैं।

Please perform data visualization from the data analysis to explain the data better.

डेटा विश्लेषण परिणामों की समझ बढ़ाने के लिए, मैं विज़ुअलाइज़ेशन की एक श्रृंखला बनाऊंगा जो ग्राहक मंथन से संबंधित प्रमुख निष्कर्षों को स्पष्ट रूप से दर्शाती है। इन विज़ुअलाइज़ेशन में शामिल होंगे:

  1. श्रेणीबद्ध चर के लिए बार प्लॉट:
  • अनुबंध नवीनीकरण वाले और बिना नवीनीकरण वाले ग्राहकों के लिए मंथन दरों की तुलना करना।
  • डेटा प्लान वाले और बिना डेटा प्लान वाले ग्राहकों के लिए मंथन दरों की तुलना करना।
  • मुख्य संख्यात्मक चर के लिए बॉक्स प्लॉट:
  1. ग्राहक सेवा कॉल बनाम मंथन।
  • दैनिक मिनट बनाम मंथन।
  • मासिक शुल्क बनाम मंथन।
  • ओवरएज फीस बनाम मंथन।
  1. सहसंबंध का हीटमैप:

मंथन के साथ सभी चरों के सहसंबंध की कल्पना करना।

 

सीएसवी से 5 सरल चरणों में चैटजीपीटी के साथ विश्लेषणात्मक रिपोर्ट पूरी करें
 

विज़ुअलाइज़ेशन सभी महत्वपूर्ण प्लॉट दिखाएगा जो संपूर्ण डेटासेट को समाहित करता है। हम प्रत्येक कथानक के लिए अधिक विस्तृत विवरण मांग सकते हैं, जिसे आप स्वतंत्र रूप से आज़मा सकते हैं।

अंतिम चरण पिछले चरणों के आधार पर रिपोर्ट तैयार करना है। दुर्भाग्य से, चैटजीपीटी डेटा विश्लेषण से सभी विवरण और अंतर्दृष्टि प्राप्त नहीं कर सकता है, लेकिन हमारे पास अभी भी रिपोर्ट का सरल संस्करण हो सकता है।

पिछले विश्लेषण के आधार पर एक पीडीएफ रिपोर्ट तैयार करने के लिए निम्नलिखित संकेत का उपयोग करें।

Please provide me with the pdf report from the first step to the last step.

आपको अपने पिछले विश्लेषण के साथ पीडीएफ लिंक परिणाम मिलेगा। यदि आपको लगता है कि परिणाम अपर्याप्त है या कुछ चीजें हैं जिन्हें आप बदलना चाहते हैं तो चरणों को दोहराने का प्रयास करें।

डेटा विश्लेषण एक ऐसी गतिविधि है जिसे हर किसी को जानना चाहिए क्योंकि यह वर्तमान युग में सबसे आवश्यक कौशल में से एक है। हालाँकि, डेटा विश्लेषण करने के बारे में सीखने में लंबा समय लग सकता है। चैटजीपीटी के साथ, हम उस सभी गतिविधि समय को कम कर सकते हैं। 

इस लेख में, हमने चर्चा की है कि 5 चरणों में CSV फ़ाइलों से संपूर्ण विश्लेषणात्मक रिपोर्ट कैसे तैयार की जाए। चैटजीपीटी उपयोगकर्ताओं को फ़ाइल आयात करने से लेकर रिपोर्ट तैयार करने तक एंड-टू-एंड डेटा विश्लेषण गतिविधि प्रदान करता है।
 
 

कार्नेलियस युधा विजया एक डेटा साइंस असिस्टेंट मैनेजर और डेटा राइटर है। एलियांज इंडोनेशिया में पूर्णकालिक काम करते हुए, उन्हें सोशल मीडिया और राइटिंग मीडिया के माध्यम से पायथन और डेटा टिप्स साझा करना पसंद है।

समय टिकट:

से अधिक केडनगेट्स