The Only Free Course You Need To Become A Professional Data Engineer - KDnuggets

প্লেটো দ্বারা প্রকাশিত

অনুসরণকারী: 0

পেশাদার ডেটা ইঞ্জিনিয়ার হওয়ার জন্য আপনার প্রয়োজন একমাত্র বিনামূল্যের কোর্স
লেখকের ছবি

মেশিন লার্নিং এবং ডেটা সায়েন্সের উপর অনেক কোর্স এবং রিসোর্স পাওয়া যায়, কিন্তু ডেটা ইঞ্জিনিয়ারিং এর উপর খুব কম। এটি কিছু প্রশ্ন উত্থাপন করে। এটা কি কঠিন ক্ষেত্র? এটা কম বেতন অফার? এটি কি অন্যান্য প্রযুক্তিগত ভূমিকার মতো উত্তেজনাপূর্ণ বলে মনে করা হয় না? যাইহোক, বাস্তবতা হল যে অনেক কোম্পানি সক্রিয়ভাবে ডেটা ইঞ্জিনিয়ারিং প্রতিভা খুঁজছে এবং যথেষ্ট বেতন অফার করছে, কখনও কখনও $200,000 USD ছাড়িয়ে যায়। ডেটা ইঞ্জিনিয়াররা ডেটা প্ল্যাটফর্মের স্থপতি হিসাবে একটি গুরুত্বপূর্ণ ভূমিকা পালন করে, ভিত্তিগত সিস্টেমগুলি ডিজাইন এবং তৈরি করে যা ডেটা বিজ্ঞানী এবং মেশিন লার্নিং বিশেষজ্ঞদের কার্যকরভাবে কাজ করতে সক্ষম করে।

এই শিল্পের ব্যবধান পূরণ করে, DataTalkClub একটি রূপান্তরমূলক এবং বিনামূল্যের বুটক্যাম্প চালু করেছে, “ডেটা ইঞ্জিনিয়ারিং জুমক্যাম্প" এই কোর্সটি নতুনদের বা পেশাজীবীদের ক্ষমতায়ন করার জন্য ডিজাইন করা হয়েছে যারা কেরিয়ার পরিবর্তন করতে চাইছেন, প্রয়োজনীয় দক্ষতা এবং ডেটা ইঞ্জিনিয়ারিংয়ে বাস্তব অভিজ্ঞতা সহ।

এটা একটা 6-সপ্তাহের বুটক্যাম্প যেখানে আপনি একাধিক কোর্স, পড়ার উপকরণ, কর্মশালা এবং প্রকল্পের মাধ্যমে শিখবেন। প্রতিটি মডিউলের শেষে, আপনি যা শিখেছেন তা অনুশীলন করার জন্য আপনাকে হোমওয়ার্ক দেওয়া হবে।

সপ্তাহ 1: GCP, Docker, Postgres, Terraform এবং পরিবেশ সেটআপের ভূমিকা।
সপ্তাহ 2: Mage সঙ্গে ওয়ার্কফ্লো অর্কেস্ট্রেশন.
সপ্তাহ 3: BigQuery-এর সাহায্যে ডেটা গুদামজাত করা এবং BigQuery-এর সাহায্যে মেশিন লার্নিং।
সপ্তাহ 4: ডিবিটি, গুগল ডেটা স্টুডিও এবং মেটাবেসের সাথে বিশ্লেষণাত্মক প্রকৌশলী।
সপ্তাহ 5: স্পার্কের সাথে ব্যাচ প্রক্রিয়াকরণ।
সপ্তাহ 6: কাফকার সাথে স্ট্রিমিং।

পেশাদার ডেটা ইঞ্জিনিয়ার হওয়ার জন্য আপনার প্রয়োজন একমাত্র বিনামূল্যের কোর্স
চিত্র থেকে DataTalksClub/data-engineering-zoomcamp

সিলেবাসটিতে 6টি মডিউল, 2টি কর্মশালা এবং একটি প্রকল্প রয়েছে যা পেশাদার ডেটা ইঞ্জিনিয়ার হওয়ার জন্য প্রয়োজনীয় সমস্ত কিছু কভার করে।

মডিউল 1: কোড হিসাবে কন্টেইনারাইজেশন এবং পরিকাঠামো আয়ত্ত করা

এই মডিউলে, আপনি ডকার এবং পোস্টগ্রেস সম্পর্কে শিখবেন, বেসিকগুলি দিয়ে শুরু করে এবং ডেটা পাইপলাইন তৈরি, ডকারের সাথে পোস্টগ্রেস চালানো এবং আরও অনেক কিছু সম্পর্কে বিস্তারিত টিউটোরিয়ালের মাধ্যমে অগ্রসর হবেন।

মডিউলটি পিজিএডমিন, ডকার-কম্পোজ, এবং এসকিউএল রিফ্রেশার বিষয়গুলির মতো প্রয়োজনীয় সরঞ্জামগুলিও কভার করে, ডকার নেটওয়ার্কিং-এ ঐচ্ছিক বিষয়বস্তু এবং উইন্ডোজ সাবসিস্টেম লিনাক্স ব্যবহারকারীদের জন্য একটি বিশেষ ওয়াক-থ্রু। শেষ পর্যন্ত, কোর্সটি আপনাকে GCP এবং Terraform-এর সাথে পরিচয় করিয়ে দেয়, যা আধুনিক ক্লাউড-ভিত্তিক পরিবেশের জন্য অপরিহার্য কোড হিসাবে কন্টেইনারাইজেশন এবং পরিকাঠামোর একটি সামগ্রিক বোঝাপড়া প্রদান করে।

মডিউল 2: ওয়ার্কফ্লো অর্কেস্ট্রেশন কৌশল

মডিউলটি Mage-এর একটি গভীর অনুসন্ধান অফার করে, যা ডেটা রূপান্তর এবং ইন্টিগ্রেশনের জন্য একটি উদ্ভাবনী ওপেন-সোর্স হাইব্রিড ফ্রেমওয়ার্ক। এই মডিউলটি ওয়ার্কফ্লো অর্কেস্ট্রেশনের প্রাথমিক বিষয়গুলি দিয়ে শুরু হয়, ম্যাজের সাথে হ্যান্ডস-অন অনুশীলনে অগ্রসর হয়, যার মধ্যে এটি ডকারের মাধ্যমে সেট আপ করা এবং API থেকে পোস্টগ্রেস এবং Google ক্লাউড স্টোরেজ (GCS) এবং তারপর BigQuery-এ ETL পাইপলাইন তৈরি করা।

ভিডিও, রিসোর্স এবং ব্যবহারিক কাজগুলির মডিউলের মিশ্রণ একটি বিস্তৃত শিক্ষার অভিজ্ঞতা নিশ্চিত করে, মেজ ব্যবহার করে অত্যাধুনিক ডেটা ওয়ার্কফ্লো পরিচালনা করার দক্ষতা দিয়ে শিক্ষার্থীদের সজ্জিত করে।

কর্মশালা 1: ডেটা ইনজেশন কৌশল

প্রথম কর্মশালায় আপনি দক্ষ ডেটা ইনজেশন পাইপলাইন তৈরি করতে পারদর্শী হবেন। কর্মশালাটি এপিআই এবং ফাইলগুলি থেকে ডেটা বের করা, ডেটা স্বাভাবিককরণ এবং লোড করা এবং ক্রমবর্ধমান লোডিং কৌশলগুলির মতো প্রয়োজনীয় দক্ষতাগুলির উপর দৃষ্টি নিবদ্ধ করে৷ এই কর্মশালাটি শেষ করার পরে, আপনি একজন সিনিয়র ডেটা ইঞ্জিনিয়ারের মতো দক্ষ ডেটা পাইপলাইন তৈরি করতে সক্ষম হবেন।

মডিউল 3: ডেটা গুদামজাতকরণ

মডিউলটি ডেটা স্টোরেজ এবং বিশ্লেষণের একটি গভীর অনুসন্ধান, যা BigQuery ব্যবহার করে ডেটা গুদামজাতকরণের উপর ফোকাস করে। এটি বিভাজন এবং ক্লাস্টারিংয়ের মতো মূল ধারণাগুলি কভার করে এবং BigQuery-এর সর্বোত্তম অনুশীলনগুলিতে ডুব দেয়৷ মডিউলটি উন্নত বিষয়গুলিতে অগ্রসর হয়, বিশেষ করে BigQuery-এর সাথে মেশিন লার্নিং (ML) এর একীকরণ, ML-এর জন্য SQL-এর ব্যবহার হাইলাইট করে এবং হাইপারপ্যারামিটার টিউনিং, বৈশিষ্ট্য প্রিপ্রসেসিং এবং মডেল স্থাপনে সংস্থান প্রদান করে।

মডিউল 4: অ্যানালিটিক্স ইঞ্জিনিয়ারিং

অ্যানালিটিক্স ইঞ্জিনিয়ারিং মডিউলটি BigQuery বা PostgreSQL, একটি বিদ্যমান ডেটা গুদাম সহ dbt (ডেটা বিল্ড টুল) ব্যবহার করে একটি প্রজেক্ট তৈরি করার উপর ফোকাস করে।

মডিউলটি ক্লাউড এবং স্থানীয় উভয় পরিবেশে dbt সেট আপ, বিশ্লেষণ প্রকৌশল ধারণা, ETL বনাম ELT, এবং ডেটা মডেলিং প্রবর্তন করে। এটি উন্নত dbt বৈশিষ্ট্য যেমন ক্রমবর্ধমান মডেল, ট্যাগ, হুক এবং স্ন্যাপশট কভার করে।

শেষ পর্যন্ত, মডিউলটি Google ডেটা স্টুডিও এবং মেটাবেসের মতো সরঞ্জামগুলি ব্যবহার করে রূপান্তরিত ডেটা ভিজ্যুয়ালাইজ করার কৌশলগুলি প্রবর্তন করে এবং এটি সমস্যা সমাধান এবং দক্ষ ডেটা লোডিংয়ের জন্য সংস্থান সরবরাহ করে।

মডিউল 5: ব্যাচ প্রক্রিয়াকরণে দক্ষতা

এই মডিউলটি Apache Spark ব্যবহার করে ব্যাচ প্রসেসিং কভার করে, ব্যাচ প্রসেসিং এবং স্পার্কের ভূমিকা থেকে শুরু করে, Windows, Linux, এবং MacOS-এর জন্য ইনস্টলেশন নির্দেশাবলী সহ।

এতে স্পার্ক এসকিউএল এবং ডেটাফ্রেমগুলি অন্বেষণ করা, ডেটা প্রস্তুত করা, এসকিউএল ক্রিয়াকলাপ সম্পাদন করা এবং স্পার্ক ইন্টারনাল বোঝার অন্তর্ভুক্ত। অবশেষে, এটি ক্লাউডে স্পার্ক চালানো এবং BigQuery-এর সাথে স্পার্ককে একীভূত করার মাধ্যমে শেষ হয়।

মডিউল 6: কাফকার সাথে স্ট্রিমিং ডেটার শিল্প

মডিউলটি শুরু হয় স্ট্রীম প্রসেসিং ধারণার একটি সূচনা দিয়ে, তারপরে কাফকাকে গভীরভাবে অন্বেষণ করে, যার মধ্যে এর মৌলিক বিষয়গুলি, কনফ্লুয়েন্ট ক্লাউডের সাথে একীকরণ এবং প্রযোজক এবং ভোক্তাদের জড়িত ব্যবহারিক অ্যাপ্লিকেশনগুলি।

মডিউলটি কাফকা কনফিগারেশন এবং স্ট্রীমগুলিও কভার করে, স্ট্রীম যোগদান, পরীক্ষা, উইন্ডো করা এবং কাফকা ksqldb এবং কানেক্ট ব্যবহার করার মতো বিষয়গুলিকে সম্বোধন করে৷ উপরন্তু, এটি পাইথন এবং JVM পরিবেশে তার ফোকাস প্রসারিত করে, যেখানে পাইথন স্ট্রীম প্রক্রিয়াকরণের জন্য ফাউস্ট, পাইসপার্ক - স্ট্রাকচার্ড স্ট্রিমিং এবং কাফকা স্ট্রিমগুলির জন্য স্কালা উদাহরণ রয়েছে।

কর্মশালা 2: SQL এর সাথে স্ট্রিম প্রসেসিং

আপনি RisingWave এর সাথে স্ট্রিমিং ডেটা প্রক্রিয়া এবং পরিচালনা করতে শিখবেন, যা আপনার স্ট্রিম প্রক্রিয়াকরণ অ্যাপ্লিকেশনগুলিকে শক্তিশালী করার জন্য একটি PostgreSQL-শৈলীর অভিজ্ঞতা সহ একটি ব্যয়-দক্ষ সমাধান প্রদান করে।

প্রকল্প: রিয়েল-ওয়ার্ল্ড ডেটা ইঞ্জিনিয়ারিং অ্যাপ্লিকেশন

এই প্রজেক্টের উদ্দেশ্য হল একটি এন্ড-টু-এন্ড ডেটা পাইপলাইন নির্মাণের জন্য এই কোর্সে আমরা যে সমস্ত ধারণা শিখেছি তা বাস্তবায়ন করা। আপনি একটি ডেটাসেট নির্বাচন করে দুটি টাইল সমন্বিত একটি ড্যাশবোর্ড তৈরি করবেন, ডেটা প্রক্রিয়াকরণের জন্য একটি পাইপলাইন তৈরি করবেন এবং এটি একটি ডেটা লেকে সংরক্ষণ করবেন, ডেটা লেক থেকে একটি ডেটা গুদামে স্থানান্তরিত করার জন্য একটি পাইপলাইন তৈরি করবেন, রূপান্তর করবেন। ডেটা গুদামে ডেটা এবং ড্যাশবোর্ডের জন্য এটি প্রস্তুত করা এবং অবশেষে ডেটা দৃশ্যত উপস্থাপন করার জন্য একটি ড্যাশবোর্ড তৈরি করা।

2024 কোহর্টের বিবরণ

নিবন্ধন: যোগদিন
শুরুর তারিখ: জানুয়ারী 15, 2024, 17:00 CET এ
নির্দেশিত সমর্থন সহ স্ব-গতিশীল শিক্ষা
সমগোত্রীয় ফোল্ডার হোমওয়ার্ক এবং সময়সীমা সহ
ইন্টারেক্টিভ স্ল্যাক সম্প্রদায় সহকর্মী শেখার জন্য

পূর্বশর্ত

মৌলিক কোডিং এবং কমান্ড লাইন দক্ষতা
এসকিউএল-এ ফাউন্ডেশন
পাইথন: উপকারী কিন্তু বাধ্যতামূলক নয়

আপনার যাত্রার নেতৃত্ব দিচ্ছেন বিশেষজ্ঞ প্রশিক্ষক

অঙ্কুশ খান্না
ভিক্টোরিয়া পেরেজ মোলা
আলেক্সি গ্রিগোরেভ
ম্যাট পামার
লুইস অলিভেরা
মাইকেল শুমেকার

আমাদের 2024 কোহোর্টে যোগ দিন এবং একটি আশ্চর্যজনক ডেটা ইঞ্জিনিয়ারিং সম্প্রদায়ের সাথে শেখা শুরু করুন। বিশেষজ্ঞের নেতৃত্বে প্রশিক্ষণ, হাতে-কলমে অভিজ্ঞতা, এবং শিল্পের প্রয়োজন অনুসারে একটি পাঠ্যক্রম, এই বুটক্যাম্প শুধুমাত্র আপনাকে প্রয়োজনীয় দক্ষতা দিয়েই সজ্জিত করে না বরং একটি লাভজনক এবং চাহিদা-মাফিক ক্যারিয়ারের পথের অগ্রভাগে অবস্থান করে। আজই নথিভুক্ত করুন এবং আপনার আকাঙ্খাকে বাস্তবে রূপান্তর করুন!

আবিদ আলী আওয়ান (@1 আবিদালিয়াওয়ান) একজন প্রত্যয়িত ডেটা সায়েন্টিস্ট পেশাদার যিনি মেশিন লার্নিং মডেল তৈরি করতে পছন্দ করেন। বর্তমানে, তিনি মেশিন লার্নিং এবং ডেটা সায়েন্স টেকনোলজিতে বিষয়বস্তু তৈরি এবং প্রযুক্তিগত ব্লগ লেখার উপর মনোযোগ নিবদ্ধ করছেন। আবিদ টেকনোলজি ম্যানেজমেন্টে স্নাতকোত্তর ডিগ্রি এবং টেলিকমিউনিকেশন ইঞ্জিনিয়ারিংয়ে স্নাতক ডিগ্রি অর্জন করেছেন। তার দৃষ্টিভঙ্গি মানসিক অসুস্থতার সাথে সংগ্রামরত শিক্ষার্থীদের জন্য একটি গ্রাফ নিউরাল নেটওয়ার্ক ব্যবহার করে একটি AI পণ্য তৈরি করা।