هوش مصنوعی مولد ویدیوهایی را که مردم تماشا می کنند با خواندن فعالیت مغزشان بازسازی می کند

هوش مصنوعی مولد ویدیوهایی را که مردم تماشا می کنند با خواندن فعالیت مغزشان بازسازی می کند

گره منبع: 2679952

تواناییty از ماشین آلات به ذهن ما را بخوانید در سال های اخیر به طور پیوسته در حال پیشرفت بوده است. اکنون، محققان از فناوری تولید ویدئو با هوش مصنوعی استفاده کرده‌اند تا دریچه‌ای به چشمان ما بدهند.

محرک اصلی تلاش برای تفسیر سیگنال‌های مغزی این امید است که روزی بتوانیم دریچه‌های ارتباطی جدیدی را برای افرادی که در کما هستند یا دارای اشکال مختلف فلج هستند ارائه دهیم. اما همچنین امیدواری وجود دارد که این فناوری بتواند رابط های بصری بیشتری بین انسان و ماشین ایجاد کند که می تواند برای افراد سالم نیز کاربرد داشته باشد.

تاکنون، بیشتر تحقیقات بر تلاش‌ها برای بازآفرینی مونولوگ درونی متمرکز بوده استs بیماران با استفاده از سیستم های هوش مصنوعی برای انتخاب کردن به چه کلماتی فکر می کنند امیدوار کننده ترین نتایج نیز از ایمپلنت های تهاجمی مغز حاصل شده است که بعید به نظر می رسد یک رویکرد عملی برای اکثر افراد باشد.

با این حال، اکنون محققان دانشگاه ملی سنگاپور و دانشگاه چینی هنگ کنگ نشان داده‌اند که می‌توانند اسکن‌های غیرتهاجمی مغز و فناوری تولید تصویر هوش مصنوعی را برای ایجاد تکه‌های کوتاه ویدیویی که به طرز عجیبی شبیه به کلیپ‌هایی است که سوژه‌ها تماشا می‌کردند، ترکیب کنند. زمانی که داده های مغز آنها جمع آوری شد.

این کار بسط تحقیق همان نویسندگان است اواخر سال گذشته منتشر شد، جایی که آنها نشان دادند که می توانند تصاویر ثابتی تولید کنند که تقریباً با تصاویر نشان داده شده مطابقت دارد. این با اولین آموزش یک مدل بر روی مقادیر زیادی از داده های جمع آوری شده با استفاده از اسکنرهای مغزی fMRI به دست آمد. سپس این مدل با تولید تصویر منبع باز AI Stable Diffusion برای ایجاد تصاویر ترکیب شد.

در یک مقاله جدید منتشر شده در سرور پیش چاپ مانند: arXiv, نویسندگان رویکرد مشابهی را اتخاذ کرده‌اند، اما آن را به گونه‌ای تطبیق می‌دهند که سیستم بتواند جریان‌های داده‌های مغز را تفسیر کرده و آنها را به‌جای عکس‌برداری به فیلم تبدیل کند. ابتدا یک مدل را روی مقادیر زیادی از fMRI آموزش دادند تا بتواند ویژگی‌های کلی این اسکن‌های مغزی را بیاموزد. سپس آن را تقویت کرد تا بتواند متوالی اسکن‌های fMRI را به جای اسکن‌های فردی پردازش کند و سپس دوباره روی ترکیبی از اسکن‌های fMRI، تکه‌های ویدیویی که آن فعالیت مغز را برانگیخت و توضیحات متنی آموزش دید.

به طور جداگانه، محققان مدل انتشار پایدار از پیش آموزش دیده را برای تولید ویدئو به جای تصاویر ثابت اقتباس کردند. سپس دوباره بر روی همان فیلم ها و توضیحات متنی که مدل اول آموزش داده شده بود، آموزش داده شد. در نهایت، این دو مدل در اسکن‌های fMRI و فیلم‌های مرتبط با آن‌ها با هم ترکیب و تنظیم شدند.

سیستم به دست آمده قادر بود اسکن‌های fMRI جدیدی را که قبلاً ندیده بود، بگیرد و ویدیوهایی تولید کند که به کلی شبیه کلیپ‌های سوژه‌های انسانی بود.d در آن زمان تماشا می کرد اگرچه دور از تطابق کامل بود، خروجی هوش مصنوعی به طور کلی بسیار نزدیک به ویدیوی اصلی بود، صحنه‌های جمعیت یا گله‌های اسب را با دقت بازسازی می‌کرد و اغلب با پالت رنگ مطابقت داشت.

برای ارزیابی سیستم خود، محققان از یک طبقه‌بندی ویدئویی استفاده کردند که برای ارزیابی اینکه مدل چقدر معنای صحنه را درک کرده است - به عنوان مثال، متوجه شده بود که آیا این ویدیو از شنا کردن ماهی در آکواریوم است یا خانواده‌ای که در مسیری قدم می‌زدند، استفاده کردند. حتی اگر تصویر کمی متفاوت بود. مدل آنها امتیاز 85 درصد را به دست آورد که 45 درصد پیشرفت نسبت به پیشرفته ترین مدل ها دارد.

در حالی که ویدئوهایی که هوش مصنوعی تولید می‌کند هنوز پر از اشکال هستند، نویسندگان می‌گویند این خط تحقیقات در نهایت می‌تواند هم در علوم اعصاب پایه و هم در آینده کاربرد داشته باشد. رابط های مغز و ماشین. با این حال، آنها همچنین به نقاط ضعف احتمالی این فناوری اذعان دارند. آنها می نویسند: "مقررات دولتی و تلاش های جوامع تحقیقاتی برای اطمینان از حریم خصوصی داده های بیولوژیکی فرد و جلوگیری از هرگونه استفاده مخرب از این فناوری لازم است."

این احتمالاً نشانه‌ای از این نگرانی است که ترکیبی از فناوری اسکن مغز هوش مصنوعی می‌تواند این امکان را برای افراد فراهم کند که افکار دیگران را بدون رضایت آنها به طور سرزده ثبت کنند. Anxieties بودند همچنین در اوایل سال جاری زمانی که محققان از رویکرد مشابهی برای ایجاد اساساً یک روش تقریبی استفاده کردند، بیان شد رونوشت صدای درون سر مردم، اگرچه کارشناسان اشاره کرده اند که این خواهد بود غیر عملی اگر غیر ممکن نیست برای آینده قابل پیش بینی.

اما چه آن را به عنوان یک تجاوز وحشتناک به حریم خصوصی خود یا یک راه جدید و هیجان انگیز برای ارتباط با فناوری ببینید، به نظر می رسد خوانندگان ذهن ماشینی به واقعیت نزدیک تر می شوند.

تصویر های اعتباری: کلودیا دیوالد از جانب Pixabay

تمبر زمان:

بیشتر از تکینگی هاب