ব্যবহারকারীরা দ্রুততম স্পিচ-টু-টেক্সট API হিসাবে হুইস্পার JAX হাইপ করে

ব্যবহারকারীরা দ্রুততম স্পিচ-টু-টেক্সট API হিসাবে হুইস্পার JAX হাইপ করে

উত্স নোড: 2607028

মার্ক জুকারবার্গ হয়ত "মেটাভার্স" শব্দটিকে জনপ্রিয় করে তুলেছেন, কিন্তু মেটা প্রতিষ্ঠাতা এবং সিইও হয়তো আগের মতো একই উৎসাহে ব্যবহারকারী এবং বিজ্ঞাপনদাতাদের কাছে মেটাভার্স পিচ করবেন না। বা তাই মনে হয়. ইদানীং, মেটা জেনারেটিভ এআই-এর উপর বেশি ফোকাস দেখিয়েছে।

জেনারেটিভ এআই হল মেশিন লার্নিং কৌশলগুলির একটি সেট যা কম্পিউটারগুলিকে পাঠ্য তৈরি করতে, ছবি আঁকতে এবং মানুষের আউটপুটের মতো অন্যান্য মিডিয়া তৈরি করতে দেয়। এখন, মেটা ব্যবহারকারী এবং বিজ্ঞাপনদাতাদের তার TikTok-এর মতো শর্ট-ফর্ম ভিডিও এবং AI সরঞ্জামগুলিতে আবদ্ধ করার চেষ্টা করছে।

সম্প্রতি ক্যালিফোর্নিয়া ভিত্তিক প্রযুক্তি প্রতিষ্ঠানটি ঘোষিত কৃত্রিম বুদ্ধিমত্তার উপর দৃষ্টি নিবদ্ধ করে একটি নতুন পণ্য ইউনিট তৈরি করা - মেটা এআই। বিভাগটির নেতৃত্বে বর্তমান প্রধান পণ্য কর্মকর্তা ক্রিস কক্স এবং মেটা জুড়ে বেশ কয়েকটি দলকে একত্রিত করে।

এছাড়াও পড়ুন: এআই চ্যাটবট হাইপের তাড়ায় বিগ টেক মেটাভার্স ছেড়ে দিন

মেটা ডিনোভি 2 উন্মোচন করেছে

মেটা দল এআই ব্যক্তিত্ব তৈরি করছে যা ব্যবহারকারীদের বিভিন্ন উপায়ে সাহায্য করতে পারে, জুকারবার্গ দাবি করেছেন। এর মধ্যে হোয়াটসঅ্যাপ এবং মেসেঞ্জারে এআই চ্যাটের অভিজ্ঞতা, ইনস্টাগ্রামে এআই ইমেজ ফিল্টার এবং বিজ্ঞাপন ফর্ম্যাট এবং এআই ভিডিও এবং মাল্টি-মোডাল অভিজ্ঞতার ট্রায়াল অন্তর্ভুক্ত রয়েছে।

গত বছর, মেটা এআই মেক-এ-ভিডিও চালু করেছে, একটি কৃত্রিমভাবে বুদ্ধিমান সিস্টেম যা ব্যবহারকারীদের একটি টেক্সট প্রম্পট থেকে ভিডিও তৈরি করতে দেয়। অতি সম্প্রতি, এটি DinoV2 এবং SAM সহ বেশ কয়েকটি AI পণ্য লঞ্চ করেছে।

17 এপ্রিল প্রকাশিত, DinoV2 হল একটি জেনারেটিভ AI মডেল যা ভার্চুয়াল জগতের জন্য দ্রুত 3D সম্পদ তৈরি করতে পারে। অনুযায়ী ক ব্লগ পোস্ট, মডেলটি টপোলজি, সমৃদ্ধ জ্যামিতিক বিবরণ, এবং চিত্র এবং ভিডিওর মতো ডেটা থেকে টেক্সচার সহ ত্রিমাত্রিক (3D) আকার তৈরি করতে সক্ষম।

DinoV2 স্ব-তত্ত্বাবধানে শিক্ষা ব্যবহার করে, এমন একটি কৌশল যা মডেলটিকে কোনো বাহ্যিক লেবেলিং সহায়তা ছাড়াই বিপুল পরিমাণ লেবেলবিহীন ডেটা থেকে শিখতে সক্ষম করে, মেটা বলে। টুলটি ভিডিও কন্টেন্ট নির্মাতাদের জন্য এবং অন্যান্য অ্যাপ্লিকেশনের জন্য খুবই উপযোগী হতে পারে।

মেটা বলেছে যে এটি সহযোগিতায় মডেলটি ব্যবহার করেছে ফরোয়ার্ড পুনরুদ্ধার করুন "ম্যাপ বন, গাছে গাছে, মহাদেশের আকার জুড়ে।" DinoV2 একটি ভিডিওর মধ্যে বিভিন্ন বস্তু যেমন মানুষ, পোষা প্রাণী এবং অন্যান্য আইটেম সনাক্ত করতে এবং চিনতে পারে। এটি সামগ্রিকভাবে এই বস্তু এবং দৃশ্যের মধ্যে সম্পর্ক সনাক্ত করতে সক্ষম।

ডিজিটাল উদ্যোক্তা আবাহ বর্ণিত টুইটারে মডেলটিকে “শিল্প-স্তরের কম্পিউটার ভিশন মডেলগুলি অর্জনের দিকে একটি যুগান্তকারী পদক্ষেপ হিসাবে। স্ব-তত্ত্বাবধানে শিক্ষার ব্যবহার একটি গেম-চেঞ্জার এবং প্রযুক্তি শিল্পে তরঙ্গ তৈরি করবে।"

অন্যরা কৃষি, ওষুধ এবং অন্যান্য শিল্পে DinoV2 ব্যবহার করার আগ্রহ প্রকাশ করেছে। স্যাম, হাতে, একটি নতুন এআই মডেল যা একটি চিত্রের মধ্যে থেকে পৃথক বস্তু সনাক্ত করতে পারে। এটি চিত্র টীকাগুলির একটি ডেটাসেটের সাথে আসে যা গবেষকদের ব্যবহারের জন্য উপলব্ধ৷

মেটার মেটাভার্স সমস্যা

নতুন এআই চ্যাটবট ক্রেজে ফোকাস স্থানান্তরিত হওয়ায় সাম্প্রতিক মাসগুলিতে ক্রমবর্ধমান সংখ্যক বড় প্রযুক্তি সংস্থাগুলি মেটাভার্সে শান্ত হয়েছে।

ফেব্রুয়ারিতে চীনা প্রযুক্তি জায়ান্ট ড টেনসেন্ট হোল্ডিংস এর এক্সটেন্ডেড রিয়েলিটি (এক্সআর) ইউনিটে কর্মীদের কাটা এবং ভার্চুয়াল রিয়েলিটি (ভিআর) হার্ডওয়্যারের জন্য ভাঁজ করা পরিকল্পনা। মেটা এবং মাইক্রোসফ্ট উভয়ই তাদের মেটাভার্স পরিকল্পনাগুলিকে বড় আকারে ফিরিয়ে দিয়েছে।

মেটার রিয়েলিটি ল্যাবস বিভাগ, ব্যবসার অংশ যা ভিআর এবং মেটাভার্সের উপর দৃষ্টি নিবদ্ধ করে, তার সূচনা থেকেই অর্থ হারাচ্ছে এবং গত বছর $13.7 বিলিয়নের বেশি লোকসানের কথা জানিয়েছে। কোম্পানিটি এই বছর 21,000 টিরও বেশি চাকরি কমানোর পথে রয়েছে।

মাইক্রোসফট মার্চ 10 তারিখে এর VR মেটাভার্স আর্ম AltspaceVR বন্ধ করে দেয় এবং এর জনপ্রিয় বর্ধিত বাস্তবতা প্রকল্প HoloLens এবং মিক্সড রিয়েলিটি টুল কিট (MRTK) এর সমগ্র কর্মীদের বরখাস্ত করে।

কাটব্যাকগুলি AI চ্যাটবটগুলিকে ঘিরে বর্তমান হাইপের সাথে মিলে যায়, যা OpenAI এর ব্রেকআউট হিট দিয়ে শুরু হয়েছিল চ্যাটজিপিটি. মাইক্রোসফ্ট এআই প্রযুক্তিতে ব্যয়ের প্রসারে নেতৃত্ব দিচ্ছে, তার বিং অনুসন্ধানের জন্য ChatGPT-ক্ষমতা অর্জনের জন্য বিলিয়ন ডলার ঢেলে দিয়েছে৷

মেটাভার্স বাষ্প হারাচ্ছে কিনা তা নিয়ে বৈশ্বিক প্রযুক্তি জায়ান্টদের বহির্গমন প্রশ্ন উত্থাপন করেছে, মেটা তার AI বিকাশে আরও আক্রমনাত্মক হয়ে উঠেছে, এমন একটি পদক্ষেপে যা তার মেটাভার্স উচ্চাকাঙ্ক্ষাকে বিভ্রান্তিকরভাবে শক্তিশালী করতে পারে।

DinoV2-এর মতো জেনারেটিভ টুলগুলিতে কোম্পানির প্রবেশকে মেটাভার্সের দিকে একটি পদক্ষেপ হিসাবে দেখা যেতে পারে, ভার্চুয়াল জগতে যেখানে লোকেরা বাস্তব জগতের মতো একে অপরের সাথে যোগাযোগ করতে পারে। DinoV2 এর সাথে, Meta ব্যবহারকারীদের জন্য আরও নিমগ্ন অভিজ্ঞতা তৈরি করতে এবং AI প্রযুক্তির মাধ্যমে যা সম্ভব তার সীমানা ঠেলে দেওয়ার আশা করে।

এআই রেস উত্তপ্ত হয়

মেটার এআই ফোকাস প্রযুক্তি শিল্পের একটি বৃহত্তর প্রবণতার অংশ, কারণ কোম্পানিগুলি তাদের পণ্য এবং পরিষেবাগুলিতে কৃত্রিম বুদ্ধিমত্তা অন্তর্ভুক্ত করার জন্য প্রতিযোগিতা করে। অ্যাডোব, উদাহরণস্বরূপ, সম্প্রতি অ্যাডোব সহ বেশ কয়েকটি এআই সরঞ্জাম উন্মোচন করেছে Sensei.

MetaNews পূর্বে হিসাবে রিপোর্ট, Sensei কাজ স্বয়ংক্রিয় করতে এবং ব্যবহারকারীর অভিজ্ঞতা উন্নত করতে মেশিন লার্নিং ব্যবহার করে। Adobe-এর AI টুলগুলির মধ্যে Adobe Stockও রয়েছে, একটি AI-চালিত টুল যা ব্যবহারকারীদের তাদের প্রকল্পের জন্য সঠিক ছবি খুঁজে পেতে সাহায্য করে।

এছাড়াও অ্যাডোব এক্সপেরিয়েন্স ক্লাউড রয়েছে, যা গ্রাহকদের অভিজ্ঞতাকে ব্যক্তিগতকৃত করতে AI ব্যবহার করে। যাইহোক, Adobe-এর এমন কোনো পণ্য নেই যা সরাসরি DinoV2 বা SAM-এর সাথে তুলনীয়।

যাইহোক, সত্য যে DinoV2-এর জন্য প্রচুর পরিমাণে ডেটা প্রয়োজন তার মানে হল যে ডেটা নির্ভুলতা AI মডেলের জন্য একটি বড় চ্যালেঞ্জ হতে পারে কারণ ভুল বা অসামঞ্জস্যপূর্ণ ডেটা মডেলের কর্মক্ষমতা এবং নির্ভুলতাকে নেতিবাচকভাবে প্রভাবিত করতে পারে।

সময় স্ট্যাম্প:

থেকে আরো মেটানিউজ