Generative AI Reconstructs Videos People Are Watching By Reading Their Brain Activity

প্লেটো দ্বারা প্রকাশিত

অনুসরণকারী: 0

আবিলিমেশিনের ty আমাদের মন পড়ুন সাম্প্রতিক বছরগুলিতে অবিচ্ছিন্নভাবে অগ্রগতি হয়েছে। এখন, গবেষকরা AI ভিডিও জেনারেশন প্রযুক্তি ব্যবহার করেছেন আমাদের মনের চোখে একটি উইন্ডো দিতে।

মস্তিষ্কের সংকেতগুলিকে ব্যাখ্যা করার প্রচেষ্টার পিছনে মূল চালক হল এই আশা যে একদিন আমরা কোমায় বা বিভিন্ন ধরণের পক্ষাঘাতে আক্রান্তদের জন্য যোগাযোগের নতুন উইন্ডো সরবরাহ করতে সক্ষম হব। তবে এমনও আশা রয়েছে যে প্রযুক্তিটি মানুষ এবং মেশিনের মধ্যে আরও স্বজ্ঞাত ইন্টারফেস তৈরি করতে পারে যা সুস্থ মানুষের জন্যও অ্যাপ্লিকেশন থাকতে পারে।

এখনও অবধি, বেশিরভাগ গবেষণা অভ্যন্তরীণ মনোলোগ পুনরায় তৈরি করার প্রচেষ্টার উপর দৃষ্টি নিবদ্ধ করেছেs রোগীদের, এআই সিস্টেম ব্যবহার করে বাছাই করা তারা কি শব্দ চিন্তা করছে. সবচেয়ে আশাব্যঞ্জক ফলাফলগুলি আক্রমণাত্মক মস্তিষ্ক ইমপ্লান্ট থেকেও এসেছে যা বেশিরভাগ লোকের জন্য ব্যবহারিক পদ্ধতির হওয়ার সম্ভাবনা কম।

এখন যদিও, সিঙ্গাপুরের ন্যাশনাল ইউনিভার্সিটি এবং চাইনিজ ইউনিভার্সিটি অফ হংকং-এর গবেষকরা দেখিয়েছেন যে তারা নন-ইনভেসিভ ব্রেইন স্ক্যান এবং এআই ইমেজ জেনারেশন প্রযুক্তিকে একত্রিত করে ভিডিওর ছোট স্নিপেট তৈরি করতে পারে যা বিষয়গুলি যে ক্লিপগুলি দেখছিল তার সাথে অদ্ভুতভাবে মিল রয়েছে। যখন তাদের মস্তিষ্কের তথ্য সংগ্রহ করা হয়েছিল।

কাজটি একই লেখকদের গবেষণার একটি সম্প্রসারণ গত বছরের শেষের দিকে প্রকাশিত, যেখানে তারা দেখিয়েছিল যে তারা স্থির চিত্র তৈরি করতে পারে যা দেখানো ছবির বিষয়গুলির সাথে মোটামুটি মিলে যায়। এফএমআরআই ব্রেন স্ক্যানার ব্যবহার করে সংগৃহীত প্রচুর পরিমাণে ডেটার উপর একটি মডেলকে প্রথম প্রশিক্ষণের মাধ্যমে এটি অর্জন করা হয়েছিল। এই মডেলটি তখন ছবি তৈরি করতে ওপেন সোর্স ইমেজ জেনারেশন এআই স্টেবল ডিফিউশনের সাথে একত্রিত হয়েছিল।

একটি নতুন কাগজে প্রকাশিত প্রিপ্রিন্ট সার্ভার নথিপত্র, লেখকরা একই পদ্ধতি অবলম্বন করেন, তবে এটিকে মানিয়ে নেন যাতে সিস্টেমটি মস্তিষ্কের ডেটার স্ট্রিমগুলিকে ব্যাখ্যা করতে পারে এবং স্থিরচিত্রের পরিবর্তে ভিডিওতে রূপান্তর করতে পারে। প্রথমত, তারা একটি মডেলকে প্রচুর পরিমাণে এফএমআরআই-এর উপর প্রশিক্ষণ দিয়েছিল যাতে এটি এই মস্তিষ্কের স্ক্যানগুলির সাধারণ বৈশিষ্ট্যগুলি শিখতে পারে। তারপরে এটিকে বর্ধিত করা হয়েছিল যাতে এটি পৃথক জনের পরিবর্তে এফএমআরআই স্ক্যানগুলির একটি উত্তরাধিকার প্রক্রিয়া করতে পারে এবং তারপরে এফএমআরআই স্ক্যানগুলির সংমিশ্রণে, ভিডিও স্নিপেটগুলি যা সেই মস্তিষ্কের কার্যকলাপ এবং পাঠ্য বিবরণগুলিকে প্রকাশ করে তার উপর আবার প্রশিক্ষণ দেওয়া হয়।

পৃথকভাবে, গবেষকরা স্থির চিত্রের পরিবর্তে ভিডিও তৈরি করার জন্য প্রাক-প্রশিক্ষিত স্থিতিশীল ডিফিউশন মডেলটিকে অভিযোজিত করেছেন। তারপরে একই ভিডিও এবং পাঠ্য বিবরণের উপর আবার প্রশিক্ষিত করা হয়েছিল যে প্রথম মডেলকে প্রশিক্ষণ দেওয়া হয়েছিল। অবশেষে, দুটি মডেলকে এফএমআরআই স্ক্যান এবং তাদের সম্পর্কিত ভিডিওগুলিতে একত্রিত এবং সূক্ষ্ম-টিউন করা হয়েছিল।

ফলস্বরূপ সিস্টেমটি নতুন এফএমআরআই স্ক্যান করতে সক্ষম হয়েছিল যা এটি আগে দেখা যায়নি এবং ভিডিও তৈরি করতে সক্ষম হয়েছিল যা বিস্তৃতভাবে মানুষের সাবজেক্টের ক্লিপগুলির সাথে সাদৃশ্যপূর্ণ।d এ সময় দেখছিল। একটি নিখুঁত ম্যাচ থেকে দূরে থাকলেও, AI এর আউটপুট সাধারণত মূল ভিডিওর কাছাকাছি ছিল, সঠিকভাবে ভিড়ের দৃশ্য বা ঘোড়ার পালকে পুনরায় তৈরি করে এবং প্রায়শই রঙের প্যালেটের সাথে মিলে যায়।

তাদের সিস্টেমের মূল্যায়ন করার জন্য, গবেষকরা একটি ভিডিও ক্লাসিফায়ার ব্যবহার করেছেন যা মূল্যায়ন করার জন্য মডেলটি কতটা ভালোভাবে দৃশ্যের শব্দার্থ বুঝতে পেরেছিল-উদাহরণস্বরূপ, ভিডিওটি অ্যাকোয়ারিয়ামে মাছের সাঁতার বা একটি পরিবারের পথ হাঁটার কথা বুঝতে পেরেছিল কিনা- এমনকি ইমেজরি সামান্য ভিন্ন ছিল. তাদের মডেলটি 85 শতাংশ স্কোর করেছে, যা অত্যাধুনিক মডেলের তুলনায় 45 শতাংশ উন্নতি।

যদিও এআই তৈরি করা ভিডিওগুলি এখনও অস্বস্তিকর, লেখকরা বলছেন যে গবেষণার এই লাইনটি শেষ পর্যন্ত মৌলিক স্নায়ুবিজ্ঞান এবং ভবিষ্যতে উভয় ক্ষেত্রেই প্রয়োগ করতে পারে মস্তিষ্ক-মেশিন ইন্টারফেস. যাইহোক, তারা প্রযুক্তির সম্ভাব্য ডাউনসাইডগুলিও স্বীকার করে। "সরকারি নিয়মকানুন এবং গবেষণা সম্প্রদায়ের প্রচেষ্টা প্রয়োজন একজনের জৈবিক ডেটার গোপনীয়তা নিশ্চিত করতে এবং এই প্রযুক্তির কোনো ক্ষতিকারক ব্যবহার এড়াতে," তারা লিখে।

এটি সম্ভবত উদ্বেগের একটি সম্মতি যে AI ব্রেন স্ক্যানিং প্রযুক্তির সংমিশ্রণ মানুষের পক্ষে তাদের সম্মতি ছাড়াই অন্যের চিন্তাভাবনাকে অনুপ্রবেশকারীভাবে রেকর্ড করা সম্ভব করে তুলতে পারে। Aউদ্বেগ ছিল এছাড়াও এই বছরের শুরুতে কণ্ঠস্বর যখন গবেষকরা মূলত একটি রুক্ষ তৈরি করার জন্য একই পদ্ধতি ব্যবহার করেছিলেন মানুষের মাথার ভিতর কণ্ঠস্বরের প্রতিলিপি, যদিও বিশেষজ্ঞরা উল্লেখ করেছেন যে এটি হবে অসম্ভব না হলে অবাস্তব অদূর ভবিষ্যতের জন্য।

তবে আপনি এটিকে আপনার গোপনীয়তার একটি ভয়ঙ্কর আক্রমণ বা প্রযুক্তির সাথে ইন্টারফেস করার একটি উত্তেজনাপূর্ণ নতুন উপায় হিসাবে দেখেন না কেন, মনে হচ্ছে মেশিন মাইন্ড রিডাররা বাস্তবতার কাছাকাছি আসছে।

চিত্র ক্রেডিট: ক্লডিয়া ডিওয়াল্ড থেকে pixabay

এসইও চালিত বিষয়বস্তু এবং পিআর বিতরণ। আজই পরিবর্ধিত পান।
প্লেটোএআইস্ট্রিম। Web3 ডেটা ইন্টেলিজেন্স। জ্ঞান প্রসারিত. এখানে প্রবেশ করুন.
অ্যাড্রিয়েন অ্যাশলির সাথে ভবিষ্যত মিন্টিং। এখানে প্রবেশ করুন.
PREIPO® এর সাথে PRE-IPO কোম্পানিতে শেয়ার কিনুন এবং বিক্রি করুন। এখানে প্রবেশ করুন.
উত্স: https://singularityhub.com/2023/05/26/an-ai-recreated-videos-people-watched-based-on-their-brain-activity/

সময় স্ট্যাম্প: 26 পারে, 2023