আজ থেকে, আপনি ব্যবহার করতে পারেন অ্যামাজন সেজমেকার অটোপাইলট 100 GB পর্যন্ত বড় ডেটাসেটে রিগ্রেশন এবং শ্রেণীবিভাগের কাজগুলি মোকাবেলা করতে। উপরন্তু, আপনি এখন আপনার ডেটাসেটগুলি CSV বা তে প্রদান করতে পারেন৷ Apache Parquet বিষয়বস্তুর প্রকার।
ব্যবসা আগের চেয়ে বেশি ডেটা তৈরি করছে। ব্যবসায়িক সিদ্ধান্তগুলিকে আকার দিতে এই বৃহৎ ডেটাসেটগুলি থেকে অন্তর্দৃষ্টি তৈরি করার জন্য একটি অনুরূপ চাহিদা বাড়ছে৷ যাইহোক, এই বৃহৎ ডেটাসেটে অত্যাধুনিক মেশিন লার্নিং (ML) অ্যালগরিদমকে সফলভাবে প্রশিক্ষণ দেওয়া চ্যালেঞ্জিং হতে পারে। অটোপাইলট এই প্রক্রিয়াটিকে স্বয়ংক্রিয় করে এবং 100 GB পর্যন্ত বড় ডেটাসেটে স্বয়ংক্রিয় মেশিন লার্নিং (AutoML) চালানোর জন্য একটি বিরামহীন অভিজ্ঞতা প্রদান করে।
অটোপাইলট স্বয়ংক্রিয়ভাবে আপনার বৃহৎ ডেটাসেটের নমুনা দেয় যাতে বিরল শ্রেণী সংরক্ষণ করা হয় শ্রেণীর ভারসাম্যহীনতা. ক্লাস ভারসাম্যহীনতা ML-এ সচেতন হওয়া একটি গুরুত্বপূর্ণ সমস্যা, বিশেষ করে যখন বড় ডেটাসেটের সাথে কাজ করা হয়। একটি জালিয়াতি সনাক্তকরণ ডেটাসেট বিবেচনা করুন যেখানে লেনদেনের একটি ছোট ভগ্নাংশই প্রতারণামূলক বলে আশা করা হয়। এই ক্ষেত্রে, অটোপাইলট বিরল শ্রেণী, জালিয়াতিপূর্ণ লেনদেন সংরক্ষণ করার সময় শুধুমাত্র সংখ্যাগরিষ্ঠ শ্রেণীর, অ-প্রতারণামূলক লেনদেনের নমুনা দেয়।
আপনি যখন অটোপাইলট ব্যবহার করে একটি অটোএমএল কাজ চালান, তখন সাবস্যাম্পিংয়ের জন্য সমস্ত প্রাসঙ্গিক তথ্য সংরক্ষণ করা হয় অ্যামাজন ক্লাউডওয়াচ. এর জন্য লগ গ্রুপে নেভিগেট করুন /aws/sagemaker/ProcessingJobs
, আপনার অটোএমএল কাজের নাম অনুসন্ধান করুন এবং ক্লাউডওয়াচ লগ স্ট্রীমটি বেছে নিন যা অন্তর্ভুক্ত রয়েছে -db-
এর নামে
আমাদের অনেক গ্রাহক তাদের বড় ডেটাসেট সংরক্ষণ করতে Parquet বিষয়বস্তুর ধরন পছন্দ করেন। এটি সাধারণত এর সংকুচিত প্রকৃতি, উন্নত ডেটা স্ট্রাকচারের জন্য সমর্থন, দক্ষতা এবং কম খরচের অপারেশনগুলির কারণে হয়। এই ডেটা প্রায়ই দশ বা এমনকি শত শত GBs পর্যন্ত পৌঁছাতে পারে। এখন, আপনি সরাসরি অটোপাইলটে এই Parquet ডেটাসেটগুলি আনতে পারেন৷ আপনি হয় আমাদের API ব্যবহার করতে পারেন বা নেভিগেট করতে পারেন৷ অ্যামাজন সেজমেকার স্টুডিও কয়েক ক্লিকে একটি অটোপাইলট কাজ তৈরি করতে। আপনি একটি একক ফাইল বা একটি ম্যানিফেস্ট ফাইল হিসাবে নির্দিষ্ট করা একাধিক ফাইল হিসাবে আপনার Parquet ডেটাসেটের ইনপুট অবস্থান নির্দিষ্ট করতে পারেন৷ অটোপাইলট স্বয়ংক্রিয়ভাবে আপনার ডেটাসেটের বিষয়বস্তুর ধরন সনাক্ত করে, এটিকে পার্স করে, অর্থপূর্ণ বৈশিষ্ট্যগুলি বের করে এবং একাধিক ML অ্যালগরিদম প্রশিক্ষণ দেয়।
আপনি আমাদের ব্যবহার শুরু করতে পারেন নমুনা নোটবুক Parquet ডেটাসেটে Autopilot ব্যবহার করে AutoML চালানোর জন্য।
লেখক সম্পর্কে
H. Furkan Bozkurt, মেশিন লার্নিং ইঞ্জিনিয়ার, আমাজন সেজমেকার অটোপাইলট।
ভ্যালেরিও পেরোন, ফলিত বিজ্ঞান ম্যানেজার, আমাজন সেজমেকার অটোপাইলট।
- '
- 100
- অগ্রসর
- আলগোরিদিম
- সব
- মর্দানী স্ত্রীলোক
- আমাজন সেজমেকার
- এ্যাপাচি
- API
- অটোমেটেড
- স্বয়ংক্রিয় মেশিন শেখা
- স্বনির্দেশকারী
- ডেস্কটপ AWS
- ব্যবসায়
- পেতে পারি
- শ্রেণীবিন্যাস
- বিষয়বস্তু
- গ্রাহকদের
- উপাত্ত
- ডিলিং
- চাহিদা
- সনাক্তকরণ
- দক্ষতা
- প্রকৌশলী
- বিশেষত
- প্রত্যাশিত
- অভিজ্ঞতা
- চায়ের
- বৈশিষ্ট্য
- ফিট
- প্রতারণা
- গ্রুপ
- ক্রমবর্ধমান
- HTTPS দ্বারা
- শত শত
- গুরুত্বপূর্ণ
- তথ্য
- অর্ন্তদৃষ্টি
- IT
- কাজ
- বড়
- শিক্ষা
- অবস্থান
- মেশিন লার্নিং
- সংখ্যাগুরু
- ML
- এমএল অ্যালগরিদম
- অধিক
- প্রকৃতি
- অপারেশনস
- সমস্যা
- প্রক্রিয়া
- প্রদান
- উপলব্ধ
- প্রত্যাগতি
- চালান
- দৌড়
- ঋষি নির্মাতা
- বিজ্ঞান
- নির্বিঘ্ন
- সার্চ
- ছোট
- শুরু
- দোকান
- সফলভাবে
- সমর্থন
- সমর্থিত
- আজ
- প্রশিক্ষণ
- ট্রেন
- লেনদেন