CSV থেকে ChatGPT সহ 5 টি সহজ ধাপে সম্পূর্ণ বিশ্লেষণাত্মক প্রতিবেদন - KDnuggets

CSV থেকে ChatGPT-এর সাথে 5 টি সহজ ধাপে সম্পূর্ণ বিশ্লেষণাত্মক প্রতিবেদন - KDnuggets

উত্স নোড: 2982942

CSV থেকে ChatGPT সহ 5 টি সহজ ধাপে সম্পূর্ণ বিশ্লেষণাত্মক প্রতিবেদন
দ্বারা চিত্র কাঁচপিক্সেল.কম on Freepik
 

আপনি যে ব্যবসায়ই থাকুন না কেন, ডেটা-চালিত যুগে কীভাবে ডেটা বিশ্লেষণ করতে হয় তা জানা আগের চেয়ে বেশি গুরুত্বপূর্ণ। ডেটা বিশ্লেষণ ব্যবসাগুলিকে প্রতিযোগিতামূলক থাকতে এবং আরও ভাল সিদ্ধান্ত নেওয়ার ক্ষমতা প্রদান করতে সক্ষম করবে।

ডেটা বিশ্লেষণের গুরুত্ব প্রতিটি ব্যক্তিকে কীভাবে ডেটা বিশ্লেষণ করতে হয় তা জানতে চালিত করে। যাইহোক, কখনও কখনও ডেটা বিশ্লেষণ পরিচালনা করতে খুব বেশি সময় লাগে। এজন্য আমরা আমাদের ডেটা ফাইল থেকে একটি সম্পূর্ণ প্রতিবেদন তৈরি করতে ChatGPT-এর উপর নির্ভর করতে পারি।

এই নিবন্ধটি আপনার CSV ফাইল থেকে সম্পূর্ণ বিশ্লেষণাত্মক প্রতিবেদন তৈরি করার জন্য পাঁচটি সহজ পদক্ষেপ অন্বেষণ করবে। এই পাঁচটি পদক্ষেপ অন্তর্ভুক্ত:

ধাপ 1: CSV ফাইল আমদানি করা

ধাপ 2: ডেটা সারাংশ এবং প্রিপ্রসেসিং

ধাপ 3: ডেটা বিশ্লেষণ

ধাপ 4: ডেটা ভিজ্যুয়ালাইজেশন

ধাপ 5: প্রতিবেদন তৈরি

পূর্বশর্ত হিসাবে, এই নিবন্ধটি অনুমান করে যে পাঠক ChatGPT Plus-এ সদস্যতা নিয়েছেন। এটা মাথায় রেখে, শুরু করা যাক।

প্রথম ধাপ হল CSV ফাইলটি প্রস্তুত করা যা আপনি বিশ্লেষণ করতে চান এবং একটি প্রতিবেদন তৈরি করতে চান। এই ফাইলটি যেকোনো বিশ্বস্ত উৎস থেকে আসতে পারে, কিন্তু এই নিবন্ধটি টেলিকম চার্ন ডেটাসেট ব্যবহার করবে Kaggle.

নিশ্চিত করুন যে ডেটা সুগঠিত, সংগঠিত এবং একটি স্পষ্ট শিরোনাম আছে। আপনার যদি একটি নির্দিষ্ট লক্ষ্য থাকে যা আপনি বিশ্লেষণ করতে চান, তাহলে ফাইলটিতে সেই ডেটা অন্তর্ভুক্ত করতে ভুলবেন না। আমাদের উদাহরণে, আমরা মন্থন কলামের জন্য একটি বিশ্লেষণ করার চেষ্টা করব।

ডেটা প্রস্তুত হলে, সেগুলিকে ChatGPT-এ সংযুক্ত করুন এবং মডেলটিকে তাদের কাজ করতে দিন৷

পরবর্তী ধাপ হল আমাদের CSV ফাইল থেকে ডেটা সারাংশ পাওয়া এবং সেগুলিকে প্রিপ্রসেস করা। আপনি ডেটা আপলোড করার সময় নিম্নলিখিত প্রম্পট ইনপুট করুন।

Provide the data summary to this file and perform appropriate data processing for the dataset.

উপরের প্রম্পট নিম্নলিখিত ফলাফল প্রদান করে:

আপনার ডেটাসেটের সারাংশ এখানে দেওয়া হল:

সারির সংখ্যা: 3333

কলামের সংখ্যা: 11

কলামের নাম:

মন্থন করা

অ্যাকাউন্ট উইকস

চুক্তি নবায়ন

তথ্য পরিকল্পনা

তথ্য ব্যবহার

CustServCalls

ডেমিনস

ডেকল

মাসিক মূল্য

ওভারেজ ফি

RoamMins

তথ্যের ধরণ:

পূর্ণসংখ্যা: মন্থন, অ্যাকাউন্ট উইকস, কন্ট্রাক্ট রিনিউয়াল, ডেটাপ্ল্যান, কাস্টসার্ভকল, ডেকল

ফ্লোট: ডেটা ব্যবহার, ডেমিনস, মাসিক চার্জ, ওভারেজ ফি, রোমমিনস

অনুপস্থিত মানের: কোনো কলামে কোনো অনুপস্থিত মান নেই।

ChatGPT পরিষ্কারভাবে ডেটা ভালভাবে পড়তে পারে এবং প্রদত্ত ডেটাসেট প্রদান করতে সক্ষম হয়েছিল। পরবর্তী ফলাফল হল ChatGPT থেকে ডেটা প্রিপ্রসেসিং।

যেহেতু ডেটাসেটে কোনও অনুপস্থিত মান নেই, তাই ডেটা পরিষ্কার এবং প্রিপ্রসেসিংয়ের মূল ফোকাস থাকবে:

  • ডেটাতে কোনো বহিঃপ্রকাশ বা অসঙ্গতির জন্য পরীক্ষা করা হচ্ছে।
  • যদি প্রয়োজন হয়, বিশেষ করে ক্রমাগত সাংখ্যিক মান সহ কলামগুলির জন্য ডেটাকে স্বাভাবিককরণ বা প্রমিতকরণ।
  • প্রয়োজনে বিশ্লেষণের জন্য উপযুক্ত বিন্যাসে শ্রেণীবদ্ধ ডেটা রূপান্তর করা।

আসুন এই পদক্ষেপগুলি নিয়ে এগিয়ে যাই। 
 

CSV থেকে ChatGPT সহ 5 টি সহজ ধাপে সম্পূর্ণ বিশ্লেষণাত্মক প্রতিবেদন
 

বক্সপ্লটগুলি আপনার ডেটাসেটের প্রতিটি সংখ্যাসূচক কলামে সম্ভাব্য বহিরাগতদের একটি ভিজ্যুয়াল ওভারভিউ প্রদান করে। এখানে কিছু পর্যবেক্ষণ আছে:

  • AccountWeeks, CustServCalls, DayCalls: এই কলামগুলি কয়েকটি আউটলায়ার সহ একটি মোটামুটি স্বাভাবিক বিতরণ দেখায়।
  • DataUsage, DayMins, MonthlyCharge, OverageFee, RoamMins: এই কলামগুলি কিছু আউটলারও দেখায়, কিন্তু ডেটার প্রকৃতি বিবেচনা করে সেগুলি যুক্তিসঙ্গত পরিসরের মধ্যে বলে মনে হয়৷
  • চার্ন, কন্ট্রাক্ট রিনিউয়াল, ডেটাপ্ল্যান: ক্যাটাগরিকাল/বাইনারী ডেটা হওয়ার কারণে, এই কলামগুলি গতানুগতিক বহিঃপ্রকাশ দেখায় না।

এই তথ্য দেওয়া, ডেটা পরিষ্কার এবং প্রিপ্রসেসিংয়ের পরবর্তী পদক্ষেপগুলি অন্তর্ভুক্ত করতে পারে:

  • আউটলায়ার্স হ্যান্ডলিং: আপনার নির্দিষ্ট বিশ্লেষণাত্মক চাহিদা এবং ডোমেন জ্ঞানের উপর ভিত্তি করে আমরা সিদ্ধান্ত নিতে পারি যে বহিরাগতদের অপসারণ, ক্যাপ বা অন্যথায় হ্যান্ডেল করব কিনা।
  • ডেটা ট্রান্সফরমেশন: যদি প্রয়োজন হয়, আমরা ডেমিনস, মাসিক চার্জ ইত্যাদির মতো কলামগুলিকে স্বাভাবিক বা মানসম্মত করতে পারি, বিশেষ করে যদি আপনি ডেটার স্কেলের প্রতি সংবেদনশীল অ্যালগরিদমগুলি ব্যবহার করার পরিকল্পনা করেন৷
  • ক্যাটেগরিক্যাল ডেটা এনকোডিং: শ্রেণীগত ডেটাকে বিশ্লেষণের জন্য উপযুক্ত ফর্ম্যাটে রূপান্তর করুন, যদি এই ধরনের কোনো রূপান্তরের প্রয়োজন হয়।

আপনি ChatGPT কে ডেটা পরিষ্কার এবং প্রিপ্রসেসিংয়ের জন্য অতিরিক্ত পদক্ষেপগুলি সম্পাদন করতে দিতে পারেন বা এটি যেমন আছে তেমন হতে দিতে পারেন। এই উদাহরণের জন্য, আমরা পরবর্তী পদক্ষেপগুলি চালিয়ে যাব।

এর পরে, আমরা ChatGPT এর সাথে ডেটা বিশ্লেষণ করব। ডেটা বিশ্লেষণ আপনি কী অর্জন করতে চান তার উপর নির্ভর করে। আমাদের ক্ষেত্রে, আমরা চার্ন পিওভি থেকে ডেটা বিশ্লেষণ করতে চাই।

উপরের ক্ষেত্রে ChatGPT-এর সাথে ডেটা বিশ্লেষণ চালানোর জন্য আমরা নিম্নলিখিত প্রম্পট ব্যবহার করি।

Please perform the data analysis based on the data above with respect to the churn data.

 

তথ্য বিশ্লেষণ নিম্নলিখিত ফলাফল দেখা যাবে.

মন্থন ডেটার সাপেক্ষে ডেটা বিশ্লেষণ করতে, আমরা গ্রাহক মন্থনের সাথে বিভিন্ন কারণ কীভাবে সম্পর্কিত তা বোঝার উপর ফোকাস করব। মন্থন, একটি বাইনারি ভেরিয়েবল (কোন মন্থনের জন্য 0, মন্থনের জন্য 1), সাধারণত শ্রেণীবিভাগ পদ্ধতির মাধ্যমে এবং অন্যান্য ভেরিয়েবলের সাথে সম্পর্ক পরীক্ষা করে বিশ্লেষণ করা হয়। এখানে পরিকল্পনা আছে:

  1. পারস্পরিক সম্পর্ক বিশ্লেষণ: শুরু করার জন্য, আমরা দেখব কিভাবে প্রতিটি সংখ্যাসূচক বৈশিষ্ট্য মন্থনের সাথে সম্পর্কযুক্ত। এটি আমাদের প্রাথমিক ধারণা দেয় যে কোন কারণগুলি মন্থনের সাথে আরও ঘনিষ্ঠভাবে সম্পর্কিত হতে পারে।
  1. পরিসংখ্যানগত পরীক্ষা: কন্ট্রাক্ট রিনিউয়াল এবং ডেটাপ্ল্যানের মতো শ্রেণীগত ভেরিয়েবলের জন্য, আমরা পরিসংখ্যানগত পরীক্ষাগুলি ব্যবহার করতে পারি যে বিভিন্ন বিভাগে মন্থন হারে উল্লেখযোগ্য পার্থক্য রয়েছে কিনা।
  1. ভিজ্যুয়াল অ্যানালাইসিস: এই সম্পর্কগুলিকে আরও অন্বেষণ করতে আমরা কিছু ভিজ্যুয়ালাইজেশন তৈরি করব। এর মধ্যে রয়েছে বিভিন্ন গোষ্ঠী জুড়ে মন্থনের হারের তুলনা করা এবং মন্থনের বিপরীতে মূল ভেরিয়েবল প্লট করা।
  1. সংক্ষিপ্ত পরিসংখ্যান: আমরা মন্থন অবস্থার উপর ভিত্তি করে বিভিন্ন গোষ্ঠীর জন্য সারাংশ পরিসংখ্যান সরবরাহ করব যাতে বোঝার বা বন্টনের মধ্যে লক্ষণীয় পার্থক্য রয়েছে কিনা।

এর পারস্পরিক সম্পর্ক বিশ্লেষণের সাথে শুরু করা যাক এবং তারপরে পরবর্তী ধাপে এগিয়ে যাওয়া যাক।

মন্থন সঙ্গে পারস্পরিক সম্পর্ক বিশ্লেষণ

মন্থনের সাথে বিভিন্ন ভেরিয়েবলের পারস্পরিক সম্পর্ক নিম্নরূপ (সবচেয়ে নেতিবাচক থেকে শক্তিশালী ইতিবাচক পারস্পরিক সম্পর্ক):

নেতিবাচক সম্পর্ক:

  • চুক্তি পুনর্নবীকরণ: শক্তিশালী নেতিবাচক সম্পর্ক। নির্দেশ করে যে গ্রাহকরা যারা তাদের চুক্তি পুনর্নবীকরণ করেন না তাদের মন্থন করার সম্ভাবনা বেশি।
  • ডেটাপ্ল্যান: ডেটা প্ল্যান ছাড়া গ্রাহকদের মন্থন হওয়ার সম্ভাবনা কিছুটা বেশি।
  • ডেটা ব্যবহার: উচ্চতর ডেটা ব্যবহার মন্থনের সম্ভাবনাকে কিছুটা হ্রাস করে।

ইতিবাচক সম্পর্ক:

  • AccountWeeks, DayCalls: খুবই দুর্বল ইতিবাচক সম্পর্ক, মন্থনের উপর ন্যূনতম প্রভাবের পরামর্শ দেয়।
  • RoamMins: বর্ধিত রোমিং মিনিটের সাথে মন্থনের সম্ভাবনা সামান্য বৃদ্ধি।
  • মাসিক চার্জ: বর্ধিত মাসিক চার্জের সাথে সামান্য উচ্চ মন্থন হার।
  • ওভারেজ ফি: বেশি বয়সের ফি বর্ধিত মন্থনের সাথে মাঝারিভাবে সম্পর্কযুক্ত।
  • ডেমিনস: উচ্চ দৈনিক মিনিটগুলি বর্ধিত মন্থনের সাথে মাঝারিভাবে সম্পর্কযুক্ত।
  • CustServCalls: শক্তিশালী ইতিবাচক সম্পর্ক। আরও গ্রাহক পরিষেবা কল উচ্চ মন্থন হারের সাথে যুক্ত।

এই পারস্পরিক সম্পর্কের উপর ভিত্তি করে, এটা মনে হয় যে চুক্তি পুনর্নবীকরণ, গ্রাহক পরিষেবা কল, দৈনিক মিনিট, এবং অতিরিক্ত ফি এর মত বিষয়গুলি মন্থনের সাথে আরও ঘনিষ্ঠভাবে সম্পর্কিত। আমরা ভিজ্যুয়াল বিশ্লেষণ এবং পরিসংখ্যানগত পরীক্ষার মাধ্যমে এই কারণগুলিকে আরও অন্বেষণ করতে পারি, বিশেষত চুক্তি পুনর্নবীকরণ এবং ডেটাপ্ল্যানের মতো শ্রেণীগত ভেরিয়েবলের জন্য।

ভিজ্যুয়াল বিশ্লেষণ

 

CSV থেকে ChatGPT সহ 5 টি সহজ ধাপে সম্পূর্ণ বিশ্লেষণাত্মক প্রতিবেদন
 

ভিজ্যুয়ালাইজেশনগুলি বিভিন্ন ভেরিয়েবল এবং মন্থনের মধ্যে সম্পর্কের মধ্যে মূল্যবান অন্তর্দৃষ্টি প্রদান করে:

চুক্তি পুনর্নবীকরণ এবং ডেটাপ্ল্যান দ্বারা মন্থন:

  • চুক্তি পুনর্নবীকরণ: মন্থন হারে একটি উল্লেখযোগ্য পার্থক্য স্পষ্ট। যে গ্রাহকরা তাদের চুক্তি পুনর্নবীকরণ করেননি তারা মন্থনের উচ্চ হার দেখান।
  • ডেটা প্ল্যান: গ্রাহকদের ডেটা প্ল্যান আছে কি না তার উপর ভিত্তি করে মন্থন হারের মধ্যে একটি লক্ষণীয় পার্থক্য রয়েছে, যাদের ডেটা প্ল্যান নেই তারা উচ্চ মন্থন দেখাচ্ছে।

মন্থন দ্বারা সংখ্যাসূচক ভেরিয়েবল (CustServCalls, DayMins, MonthlyCharge, OverageFee):

  • CustServCalls: গ্রাহক পরিষেবা কলের বেশি সংখ্যক গ্রাহকেরা বেশি মন্থন করে।
  • DayMins: উচ্চ দৈনিক মিনিট মন্থন একটি বৃহত্তর সম্ভাবনা সঙ্গে যুক্ত করা হয়.
  • মাসিক চার্জ: উচ্চ মাসিক চার্জ বর্ধিত মন্থন হারের সাথে সম্পর্কযুক্ত।
  • ওভারেজ ফি: উচ্চ ওভারেজ ফিও বর্ধিত মন্থনের সাথে যুক্ত।

বিশ্লেষণ থেকে উপসংহার

  • চুক্তি পুনর্নবীকরণ অবস্থা এবং একটি ডেটা প্ল্যানের উপস্থিতি গ্রাহক মন্থনের উল্লেখযোগ্য কারণ।
  • উচ্চ ব্যবহার (দিনের মিনিটের পরিপ্রেক্ষিতে) এবং উচ্চ চার্জ (মাসিক চার্জ এবং অতিরিক্ত ফি) উচ্চ মন্থন হারের সাথে যুক্ত।
  • উচ্চ সংখ্যক গ্রাহক পরিষেবা কল সম্ভাব্য মন্থনের একটি শক্তিশালী সূচক।

পরবর্তী পদক্ষেপ

এই অন্তর্দৃষ্টিগুলির উপর ভিত্তি করে, মন্থন কমাতে লক্ষ্যযুক্ত কৌশলগুলি তৈরি করা যেতে পারে, যেমন গ্রাহক পরিষেবার উন্নতি করা, মূল্য নির্ধারণের কৌশলগুলি সংশোধন করা, বা চুক্তি পুনর্নবীকরণ এবং ডেটা প্ল্যান সাবস্ক্রিপশনের জন্য প্রণোদনা দেওয়া।

একটি একক প্রম্পটের মাধ্যমে, আমরা দেখতে পারি যে ChatGPT আমাদের সম্পূর্ণ ডেটা বিশ্লেষণ এবং ডেটা থেকে অন্তর্দৃষ্টি নিয়ে আসতে পারে। আপনি বিশ্লেষণের লক্ষ্যগুলি পরিবর্তন করতে পারেন এবং সেখান থেকে শুরু করতে পারেন।

ডেটা ভিজ্যুয়ালাইজেশন ডেটা বিশ্লেষণ এবং সামগ্রিক প্রতিবেদনের উন্নতির জন্য একটি সহায়ক কার্যকলাপ। ভিজ্যুয়ালাইজেশন থাকার মাধ্যমে, আমাদের ডেটা বোঝার জন্য আমরা আরও বিস্তৃত প্রতিবেদন পেতে পারি।

নিম্নলিখিত প্রম্পট ব্যবহার করে, আমরা ChatGPT-এর সাথে ডেটা ভিজ্যুয়ালাইজেশন করতে পারি।

Please perform data visualization from the data analysis to explain the data better.

ডেটা বিশ্লেষণের ফলাফল বোঝার জন্য, আমি একটি সিরিজ ভিজ্যুয়ালাইজেশন তৈরি করব যা গ্রাহক মন্থন সম্পর্কিত মূল ফলাফলগুলিকে স্পষ্টভাবে চিত্রিত করবে। এই ভিজ্যুয়ালাইজেশনগুলি অন্তর্ভুক্ত করবে:

  1. শ্রেণীগত ভেরিয়েবলের জন্য বার প্লট:
  • চুক্তি পুনর্নবীকরণ সহ এবং ছাড়া গ্রাহকদের জন্য মন্থন হার তুলনা.
  • ডেটা প্ল্যান সহ এবং ছাড়া গ্রাহকদের জন্য মন্থন হারের তুলনা করা।
  • মূল সংখ্যাসূচক ভেরিয়েবলের জন্য বক্স প্লট:
  1. কাস্টমার সার্ভিস কল বনাম চুর্ন।
  • দৈনিক মিনিট বনাম মন্থন।
  • মাসিক চার্জ বনাম চুর্ন।
  • ওভারেজ ফি বনাম চুর্ন।
  1. পারস্পরিক সম্পর্কের হিটম্যাপ:

মন্থনের সাথে সমস্ত ভেরিয়েবলের পারস্পরিক সম্পর্ক কল্পনা করতে।

 

CSV থেকে ChatGPT সহ 5 টি সহজ ধাপে সম্পূর্ণ বিশ্লেষণাত্মক প্রতিবেদন
 

ভিজ্যুয়ালাইজেশনটি সমস্ত গুরুত্বপূর্ণ প্লট দেখাবে যা পুরো ডেটাসেটকে আবদ্ধ করে। আমরা প্রতিটি প্লটের জন্য আরও বিশদ বিবরণ চাইতে পারি, যা আপনি স্বাধীনভাবে চেষ্টা করতে পারেন।

শেষ ধাপ হল পূর্ববর্তী ধাপের উপর ভিত্তি করে প্রতিবেদন তৈরি করা। দুর্ভাগ্যবশত, ChatGPT ডেটা বিশ্লেষণ থেকে সমস্ত বিবরণ এবং অন্তর্দৃষ্টি ক্যাপচার নাও করতে পারে, কিন্তু আমরা এখনও প্রতিবেদনের সহজ সংস্করণ পেতে পারি।

পূর্ববর্তী বিশ্লেষণের উপর ভিত্তি করে একটি PDF প্রতিবেদন তৈরি করতে নিম্নলিখিত প্রম্পটটি ব্যবহার করুন।

Please provide me with the pdf report from the first step to the last step.

আপনি আপনার পূর্ববর্তী বিশ্লেষণ কভার সহ পিডিএফ লিঙ্ক ফলাফল পাবেন। আপনি যদি ফলাফল অপর্যাপ্ত মনে করেন বা আপনি পরিবর্তন করতে চান এমন কিছু থাকলে পদক্ষেপগুলি পুনরাবৃত্তি করার চেষ্টা করুন।

ডেটা বিশ্লেষণ হল এমন একটি কার্যকলাপ যা প্রত্যেকেরই জানা উচিত কারণ এটি বর্তমান যুগে সবচেয়ে প্রয়োজনীয় দক্ষতাগুলির মধ্যে একটি। যাইহোক, ডেটা বিশ্লেষণ সম্পাদন করা সম্পর্কে শিখতে অনেক সময় লাগতে পারে। ChatGPT এর মাধ্যমে, আমরা সেই সমস্ত কার্যকলাপের সময় কমিয়ে আনতে পারি। 

এই নিবন্ধে, আমরা আলোচনা করেছি কিভাবে 5টি ধাপে CSV ফাইল থেকে একটি সম্পূর্ণ বিশ্লেষণমূলক প্রতিবেদন তৈরি করা যায়। ChatGPT ব্যবহারকারীদের ফাইল ইম্পোর্ট করা থেকে রিপোর্ট তৈরি করা পর্যন্ত এন্ড-টু-এন্ড ডেটা বিশ্লেষণ কার্যকলাপ প্রদান করে।
 
 

কর্নেলিয়াস যুধা বিজয়া একজন ডেটা বিজ্ঞান সহকারী ব্যবস্থাপক এবং ডেটা লেখক। আলিয়াঞ্জ ইন্দোনেশিয়াতে পূর্ণ-সময় কাজ করার সময়, তিনি সোশ্যাল মিডিয়া এবং লেখার মাধ্যমে পাইথন এবং ডেটা টিপস শেয়ার করতে পছন্দ করেন।

সময় স্ট্যাম্প:

থেকে আরো কেডনুগেটস

অ্যামাজন ওয়েব সার্ভিসেস ওয়েবিনার: স্বাস্থ্যসেবা তথ্যের সাথে ক্লিনিকাল ট্রায়াল এবং বায়োমেডিক্যাল ডেভেলপমেন্ট প্রসেসকে ত্বরান্বিত করা

উত্স নোড: 1864939
সময় স্ট্যাম্প: আগস্ট 18, 2021