চ্যাটজিপিটি রোবটে এমবেডেড, ইন্টারনেট ফিয়ার্স অব সিভিলাইজেশন

চ্যাটজিপিটি রোবটে এমবেডেড, ইন্টারনেট ফিয়ার্স অব সিভিলাইজেশন

উত্স নোড: 2611695

সৌদি আরবের পিএইচডি ছাত্র গবেষকদের একটি দল একটি নতুন এআই-চালিত টুল, মিনিজিপিটি-4 তৈরি করেছে, যার একই বৈশিষ্ট্য রয়েছে OpenAI এর ChatGPT-4.

থেকে চ্যাটজিপিটি নভেম্বরে মুক্তি পায় এবং একটি বিশ্বব্যাপী হিট হয়ে ওঠে, ডেভেলপাররা নতুন এআই টুল নিয়ে আসতে কিছুতেই থামেনি যা হয় জনপ্রিয় চ্যাটবটকে প্রতিদ্বন্দ্বী করে বা এর পরিপূরক করে।

ChatGPT মডেল ব্যবহার করে বিকশিত MiniGPT-4 হল সাম্প্রতিক উদাহরণ।

এছাড়াও পড়ুন: বিল গেটস: এআই চ্যাটবট শিশুদের 18 মাসে পড়তে শেখাতে পারে

অনুসারে ভবিষ্যতের সরঞ্জাম, MiniGPT-4 ইমেজ বর্ণনা প্রজন্ম এবং ওয়েবসাইট নির্মাণ সহ অনেক কাজ করতে সক্ষম।

"এই টুলটি বিশদ চিত্রের বিবরণ তৈরি করতে, হাতে লেখা খসড়া থেকে ওয়েবসাইট তৈরি করতে, প্রদত্ত চিত্রগুলির দ্বারা অনুপ্রাণিত গল্প এবং কবিতা লিখতে, ছবিতে দেখানো সমস্যার সমাধান প্রদান করতে এবং ব্যবহারকারীদের খাবারের ফটোগুলির উপর ভিত্তি করে কীভাবে রান্না করতে হয় তা শেখাতে সক্ষম," ভবিষ্যতের দাবি। টুলস।

যখন ChatGPT-4 প্রকাশ করা হয়েছিল, তখন একটি স্কেচ ইমেজ থেকে মডেলের ওয়েবসাইট তৈরির একটি ভিডিও দেখানো হয়েছিল৷ দ্বারা একটি টুইট অনুযায়ী বারসি, MiniGPT-4 একই কীর্তি টানতে সক্ষম। শুধুমাত্র পার্থক্য হল যে ChatGPT-4 বর্তমানে সবার জন্য উপলব্ধ নয়, যখন MiniGPT-4 ইতিমধ্যেই বন্য অবস্থায় রয়েছে৷

MiniGPT বোঝা

অনুসারে Ghacks, MiniGPT-4 ভাষা ডিকোডার হিসাবে ভিকুনা নামক একটি উন্নত LLM ব্যবহার করে, যা LLaMa-এর উপর নির্মিত এবং GPT-90 দ্বারা মূল্যায়ন করা ChatGPT-এর 4% গুণমান অর্জন করেছে বলে জানা গেছে।

AI মডেলটি বুটস্ট্র্যাপিং ল্যাঙ্গুয়েজ ইমেজ প্রি-ট্রেনিং (BLIP-2) এর প্রাক-প্রশিক্ষিত উপাদান ব্যবহার করেছে এবং ভিকুনা ভাষা মডেলের সাথে এনকোড করা ভিজ্যুয়াল বৈশিষ্ট্যগুলিকে অন্যান্য সমস্ত দৃষ্টি এবং ভাষার উপাদানগুলিকে হিমায়িত করার জন্য একটি একক ইনজেকশন স্তর যুক্ত করেছে।

ডেভিড ওয়াটসন মিনিজিপিটি হালকা ওজনের এবং চ্যাটবট, ভার্চুয়াল সহকারী এবং স্বয়ংক্রিয় চিত্র ক্যাপশনিং সিস্টেমের মতো রিয়েল-টাইম পরিস্থিতিতে সহজেই প্রয়োগ করা যেতে পারে।

তিনি কয়েকটি সম্ভাব্য অ্যাপ্লিকেশনের তালিকাও করেছেন যা MiniGPT-4 এর জন্য একটি ভাল ব্যবহার হতে পারে: চিত্র ক্যাপশনিং সিস্টেম তৈরি করা যার জন্য শুধুমাত্র হালকা সংস্থান প্রয়োজন; এবং অডিও বর্ণনা ব্যবহার করে দৃষ্টি প্রতিবন্ধীদের জন্য চিত্রের বিবরণ, একটি পদ্ধতি যার জন্য একটি পাঠ্য থেকে অডিও সিস্টেমের প্রয়োজন হবে।

যদিও OpenAI GPT-4 এর মাল্টিমোডাল ক্ষমতা নিশ্চিত করেছে, তারা এখনও এর ইমেজ-প্রসেসিং ক্ষমতা প্রকাশ করতে পারেনি। MiniGPT-4 আরও পরিশীলিত LLM ব্যবহার করে ভাষার পাশাপাশি ছবি প্রক্রিয়াকরণের মাধ্যমে এই শূন্যতা পূরণ করে।

গবেষণায় সাহায্য করার জন্য একটি এআই টুল

বিশেষজ্ঞরা বলছেন যে অত্যাধুনিক ফাউন্ডেশনাল ল্যাঙ্গুয়েজ মডেলটি এই বিশেষ এআই সেগমেন্টে তাদের কাজকে এগিয়ে নিতে গবেষকদের সাহায্য করার জন্য ডিজাইন করা হয়েছে।

OpenAI GPT-4 এর স্থাপত্য, মডেলের আকার, হার্ডওয়্যার, প্রশিক্ষণ গণনা, ডেটাসেট নির্মাণ বা প্রশিক্ষণ পদ্ধতি সম্পর্কে খুব বেশি তথ্য প্রকাশ করেনি তা বিবেচনা করে, MiniGPT-4 এর ওপেন-সোর্স প্রকৃতি গবেষকদের জন্য বিশেষভাবে মূল্যবান প্রমাণিত হতে পারে।

"মিনিজিপিটি-এর ছবি প্রক্রিয়া করার ক্ষমতা গবেষকদের ভাষা এবং দৃষ্টি মডেলের মধ্যে সম্পর্ক অনুসন্ধান করার নতুন সুযোগ প্রদান করে," লিখেছেন ইয়ানা খারা বিশ্লেষণ বিদ্যা.

“গবেষকদের সাথে কাজ করার জন্য একটি ছোট, আরও অ্যাক্সেসযোগ্য মডেল অফার করে, MiniGPT-4 এআই প্রযুক্তিতে উদ্ভাবন এবং অগ্রগতি চালাতে পারে।

"এছাড়াও, মডেলের ওপেন সোর্স ফাউন্ডেশন নিশ্চিত করে যে গবেষণা সম্প্রদায় এই ক্ষেত্রে আরও অগ্রগতির জন্য তাদের ফলাফলগুলিকে সহযোগিতা করতে এবং ভাগ করতে পারে।"

MiniGPT ছবির ক্যাপশনিংকে অন্য স্তরে নিয়ে যায়

বারসি, যিনি চিত্রের সাথে চ্যাট করতে MiniGPT-4 কীভাবে ব্যবহার করা যেতে পারে তা বর্ণনা করে একটি থ্রেড টুইট করেছেন, নিম্নলিখিত ক্ষেত্রে কিছু অন্তর্ভুক্ত করেছেন:

ভাঙা আইটেম ঠিক করা

MiniGPT প্ল্যাটফর্মে একটি ভাঙা আইটেমের একটি ছবি আপলোড করে এবং আপনি কীভাবে চিত্রটির পরিস্থিতি ঠিক করতে পারেন তা জিজ্ঞাসা করে, চ্যাটবট চিত্রটির পরিস্থিতি ব্যাখ্যা করবে এবং চিহ্নিত সমস্যাগুলি সমাধান করার উপায়গুলি সুপারিশ করবে৷

মধ্যে টুইট করেন, MiniGPT সহজেই সমস্যা চিহ্নিত করতে পারে, একটি লিক হওয়া ওয়াশিং মেশিন, কেন লিক হতে পারে তার কারণ ব্যাখ্যা করে এবং ব্যবহারকারী চেষ্টা করতে পারে এমন সমাধানগুলির একটি তালিকা প্রদান করে।

বিজ্ঞাপন লেখা

অন্য বার্সি থেকে টুইট MiniGPT থ্রেডে, তিনি একটি দৃশ্যকল্প অন্তর্ভুক্ত করেছেন যেখানে MiniGPT-কে ব্যবহারকারীর তৈরি এবং বিক্রি করা একটি মগের ছবি দেওয়া হয়েছিল। ব্যবহারকারী তারপর চ্যাটবটকে মগ বাজারজাত করার জন্য একটি বিজ্ঞাপন লিখতে বলে, যা চ্যাটবট যথাযথভাবে করে।

সংক্ষিপ্ত ভূমিকা

শুধু একটি চলচ্চিত্রের একটি ছবি আপলোড করুন এবং MiniGPT কে আপনাকে একটি সংক্ষিপ্ত ভূমিকা দিতে বলুন; এটি তারপর প্রশ্নে মুভিটির একটি অনুচ্ছেদ ভূমিকা তৈরি করবে। হিসাবে দেখা যায় টুইট করেন, মিনিজিপিটি চ্যাটবট "দ্য গডফাদার" থেকে ছবিটিকে চিনতে পারে এবং নির্দেশনা অনুযায়ী সিনেমার একটি ভূমিকা লেখে।

চ্যাটজিপিটি চালু হওয়ার পর থেকে বাজারে অগণিত নতুন এআই টুল তৈরি হয়েছে। বিখ্যাত চ্যাটবটের আরও বিকল্প রয়েছে এবং অন্যরা এটিকে ছাড়িয়ে যাচ্ছে, অন্তত নয় অটো-জিপিটি, যা এখনও AI সম্প্রদায়ে তরঙ্গ তৈরি করছে। এই হারে, এটি প্রায় অনিবার্য বলে মনে হচ্ছে যে আমরা কার্যত যেকোন মানুষের কাজের জন্য AI সম্পদের বিব্রতকর অবস্থায় পড়ব।

সময় স্ট্যাম্প:

থেকে আরো মেটানিউজ