ওপেনএআই কোডেক্সের পিছনে: বিল্ডিং কোডেক্স সম্পর্কে 5টি আকর্ষণীয় চ্যালেঞ্জ যা আপনি জানেন না

উত্স নোড: 1068192

ওপেনএআই কোডেক্সের পিছনে: বিল্ডিং কোডেক্স সম্পর্কে 5টি আকর্ষণীয় চ্যালেঞ্জ যা আপনি জানেন না


কোডেক্স নির্মাণের সময় কিছু এমএল ইঞ্জিনিয়ারিং এবং মডেলিং চ্যালেঞ্জের সম্মুখীন হয়।




OpenAI কোডেক্স
উত্স: https://bdtechtalks.com/2021/07/15/openai-codex-ai-programming/

 

কয়েক সপ্তাহ আগে, ওপেনএআই কোডেক্স প্রকাশের মাধ্যমে কৃত্রিম বুদ্ধিমত্তা (এআই) বিশ্বকে অবাক করে দিয়েছিল, একটি বিশাল মডেল যা প্রাকৃতিক ভাষাকে কোডে অনুবাদ করতে পারে। কোডেক্স কার্যকরভাবে মৌলিক ভাষার নির্দেশাবলী থেকে প্রান্ত থেকে প্রান্ত তৈরি করতে পারে। আপনি যদি আমাকে বিশ্বাস না করেন তবে আপনার এই ভিডিওটি দেখা উচিত যা সর্বকালের সেরা এআই ডেমোগুলির মধ্যে একটি হিসাবে বিবেচিত হতে পারে 😉



ভিডিও ক্রেডিট: OpenAI

 

কোডেক্সের প্রাথমিক প্রবর্তনের পর থেকে এর ক্ষমতা সম্পর্কে অনেক কিছু লেখা হয়েছে।

যাইহোক, আমি এই মাত্রার একটি মডেল তৈরি করার জন্য অবিশ্বাস্যভাবে প্রাসঙ্গিক হয়ে যাওয়া ছোট প্রয়োজনীয়তাগুলির দ্বারা আরও আগ্রহী হয়েছি। কোডেক্সের গভীরে ডাইভিং করে, আমি কিছু আকর্ষণীয় জিনিস খুঁজে পেয়েছি যা হাইলাইট করা ভাল হবে:

1. কোডেক্স প্রায় এক ডজন ভাষায় দক্ষ কিন্তু এটি পাইথনের জন্য প্রশিক্ষিত ছিল

 
আমি এই অবিশ্বাস্যভাবে অন্তর্দৃষ্টিপূর্ণ পাওয়া গেছে. ওপেনএআই-এর মূল লক্ষ্য ছিল কোডেক্সকে পাইথনে দক্ষ করে তোলা কিন্তু দেখা যাচ্ছে যে মডেলটি প্রি-ট্রেনিং প্রক্রিয়া চলাকালীন অন্যান্য ভাষা বেছে নিয়েছে। এটি ভাষার পূর্বপ্রশিক্ষিত মডেলের অনন্য ক্ষমতার সাথে কথা বলে।

2. কোডেক্স পরীক্ষা করা কঠিনের চেয়ে বেশি ছিল

 
কোডেক্সের পিছনের গবেষণায় এআই সম্প্রদায় বিস্মিত হয়েছে কিন্তু আমি মনে করি প্রকৌশল দিকটি ততটাই চিত্তাকর্ষক। একটি দিক যা আমি বিশেষভাবে কৌতূহলী ছিলাম তা হল পরীক্ষার অংশ। বিশ্বে আপনি কীভাবে বিশাল ঝুঁকি না নিয়ে লাইভ কোড পরীক্ষা করবেন। দেখা যাচ্ছে যে ওপেনএআই দল বিচ্ছিন্নভাবে কোডেক্স থেকে আউটপুট পরীক্ষা করার জন্য অনেক পরিশীলিত স্যান্ডবক্স তৈরি করেছে।

3. কোডের সাথে শব্দার্থের মিল করা তুচ্ছ থেকে অনেক দূরে

 
বিশ্বের সমস্ত উত্স কোডে একটি মডেলকে প্রশিক্ষণ দেওয়া দুর্দান্ত শোনায় তবে এটি তুচ্ছ থেকে অনেক দূরে। সব পরে, সব কোড সমান তৈরি করা হয় না. গিথুবে কোড খারাপভাবে নথিভুক্ত করা যেতে পারে যখন নোটবুকে সমৃদ্ধ শব্দার্থিক তথ্য থাকতে পারে। একইভাবে, স্ট্যাক ওভারফ্লোতে কোড স্নিপেটগুলিতে শব্দার্থিক তথ্যের সমৃদ্ধ স্তর রয়েছে। ভাষার শব্দার্থবিদ্যায় কোড বিভাগ ম্যাপিং কোডেক্স নির্মাণের অন্যতম চ্যালেঞ্জ ছিল।

4. কোডেক্স এখনও টাস্ক পচন সঙ্গে সংগ্রাম

 
আপনি যদি মনে করেন যে প্রোগ্রামাররা কীভাবে কাজ করে, আমরা একটি সমস্যাকে ছোট ছোট কাজগুলিতে বিভক্ত করার প্রবণতা রাখি এবং সেগুলির জন্য কোড তৈরি করি। এটি দেখা যাচ্ছে যে কোডেক্স পরবর্তীতে দুর্দান্ত তবে এখনও সমস্যা পচনশীল কাজগুলিতে লড়াই করে। এটি আশ্চর্যজনক হওয়া উচিত নয় যদি আমরা মনে করি যে সমস্যা পচনের জন্য খুব জটিল জ্ঞানীয় দক্ষতা প্রয়োজন।

5. তত্ত্বাবধানকৃত ফাইন-টিউনিং কোডেক্স নির্মাণের একটি বিশাল অংশ ছিল

 
ইন্টারনেটে কোড সম্পূর্ণতা, ডকুমেন্টেশন, সিনট্যাকটিক সমৃদ্ধি ইত্যাদির সব ধরণের স্তরে উপস্থিত হয়। এই ধরনের বৈচিত্র্যময় কোড সেটে একটি মডেলকে প্রশিক্ষণ দেওয়া অবিশ্বস্ত ফলাফল আনতে পারে। সেই অর্থে ওপেনএআইকে একটি বিশাল তত্ত্বাবধানে ফাইন-টিউনিং প্রচেষ্টার মধ্য দিয়ে যেতে হয়েছিল।

 
কোডেক্স সম্পর্কে এগুলি এমন কিছু দিক যা খুব বেশি পরিচিত নয় তবে মডেলটির প্রথম সংস্করণের সাফল্যের জন্য প্রধান অবদানকারী। কোডেক্স সাফল্য উভয়ই একটি বিশাল এমএল ইঞ্জিনিয়ারিং এবং অবকাঠামো প্রচেষ্টা হিসাবে উন্নত এমএল গবেষণার কারণে হয়েছিল।

 
বায়ো: যিশু রদ্রিগেজ বর্তমানে Intotheblock এ একজন CTO। তিনি একজন প্রযুক্তি বিশেষজ্ঞ, নির্বাহী বিনিয়োগকারী এবং স্টার্টআপ উপদেষ্টা। যীশু টেলাগো প্রতিষ্ঠা করেন, একটি পুরস্কার বিজয়ী সফ্টওয়্যার ডেভেলপমেন্ট ফার্ম যা নতুন এন্টারপ্রাইজ সফ্টওয়্যার প্রবণতাকে কাজে লাগিয়ে কোম্পানিগুলিকে দুর্দান্ত সফ্টওয়্যার সংস্থা হতে সাহায্য করে৷

মূল। অনুমতি নিয়ে পোস্ট করা।

সম্পর্কিত:




শীর্ষ গল্পগুলি গত 30 দিন
সবচেয়ে জনপ্রিয়
  1. ডেটা বিজ্ঞানী এবং এমএল ইঞ্জিনিয়ারদের মধ্যে পার্থক্য
  2. নিউরাল নেটওয়ার্কের পরিবর্তে আপনার লিনিয়ার রিগ্রেশন মডেল ব্যবহার করার 3 টি কারণ
  3. সর্বাধিক প্রচলিত ডেটা সায়েন্স ইন্টারভিউ প্রশ্ন এবং উত্তর
  4. গিটহাব কপিলট ওপেন সোর্স বিকল্প
  5. গুগলের গবেষণা পরিচালক থেকে ডেটা সায়েন্স শেখার পরামর্শ
সর্বাধিক ভাগ করা
  1. ডেটা বিজ্ঞানী এবং এমএল ইঞ্জিনিয়ারদের মধ্যে পার্থক্য
  2. আপনার পান্ডা ডেটাফ্রেম কিভাবে জিজ্ঞাসা করবেন
  3. কেন এবং কীভাবে আপনার "উত্পাদনশীল ডেটা সায়েন্স" শিখতে হবে?
  4. শুধু গভীর শিক্ষার জন্য নয়: কিভাবে GPUs ডেটা সায়েন্স এবং ডেটা অ্যানালিটিক্সকে ত্বরান্বিত করে
  5. রে দিয়ে আপনার প্রথম বিতরণ করা পাইথন অ্যাপ্লিকেশন লিখছি
সূত্র: https://www.kdnuggets.com/2021/09/openai-codex-challenges.html

সময় স্ট্যাম্প:

থেকে আরো কেডনুগেটস