OpenAI: آموزش هوش مصنوعی سطح بالا و اجتناب از حق چاپ غیرممکن است

OpenAI: آموزش هوش مصنوعی سطح بالا و اجتناب از حق چاپ غیرممکن است

گره منبع: 3052150

OpenAI گفته است که ساخت شبکه‌های عصبی سطح بالا که نیازهای امروزی را بدون استفاده از آثار دارای حق چاپ افراد برآورده می‌کنند، «غیر ممکن» است. آزمایشگاه تحت حمایت مایکروسافت، که معتقد است به طور قانونی محتوای گفته شده را برای آموزش مدل‌های خود جمع‌آوری می‌کند، گفت که استفاده از محتوای مالکیت عمومی خارج از حق نسخه‌برداری منجر به نرم‌افزار هوش مصنوعی پایین‌تر خواهد شد.

این ادعا در زمانی مطرح می‌شود که دنیای یادگیری ماشینی ابتدا روی دیوار آجری که قانون کپی‌رایت است می‌دوند. همین هفته گزارشی از IEEE به این نتیجه رسید که Midjourney و OpenAI's DALL-E 3، دو سرویس اصلی هوش مصنوعی برای تبدیل پیام‌های متنی به تصویر، می‌توانند صحنه‌های دارای حق چاپ از فیلم‌ها و بازی‌های ویدیویی را بر اساس داده‌های آموزشی خود بازسازی کنند.

La مطالعهتوسط گری مارکوس، کارشناس و منتقد هوش مصنوعی، و رید ساوتن، تصویرگر دیجیتال، چندین نمونه از «خروجی‌های سرقت ادبی» را مستند می‌کند که در آن OpenAI و DALL-E 3 نسخه‌های تقریباً مشابهی از صحنه‌هایی از فیلم‌ها، تصاویری از مشهور را ارائه می‌کنند. بازیگران و محتوای بازی های ویدیویی

مارکوس و ساوتن می گویند تقریباً مطمئن است که Midjourney و OpenAI مدل های تولید تصویر هوش مصنوعی مربوطه خود را بر روی مطالب دارای حق چاپ آموزش داده اند.

این که آیا این قانونی است، و اینکه آیا فروشندگان هوش مصنوعی یا مشتریان آنها در معرض مسئولیت قرار می‌گیرند، سوال بحث انگیز باقی می‌ماند. با این حال، یافته های این گزارش ممکن است کسانی را که از Midjourney و سازنده DALL-E OpenAI به دلیل نقض حق چاپ شکایت می کنند، تقویت کند.

کاربران ممکن است وقتی تصویری را تولید می کنند ندانند که آیا آنها نقض می کنند یا خیر

آنها نوشتند: "OpenAI و Midjourney به طور کامل قادر به تولید مطالبی هستند که به نظر می رسد حق چاپ و علائم تجاری را نقض می کنند." «این سیستم‌ها هنگام انجام این کار به کاربران اطلاع نمی‌دهند. آنها هیچ اطلاعاتی در مورد منشأ تصاویری که تولید می کنند ارائه نمی کنند. کاربران ممکن است وقتی تصویری را تولید می کنند ندانند که آیا آنها نقض می کنند یا خیر.

هیچکدام از شرکت‌های بیز اطلاعات آموزشی مورد استفاده برای ساخت مدل‌های هوش مصنوعی خود را به طور کامل فاش نکرده‌اند.

این فقط نیست هنرمندان دیجیتال چالش برانگیز شرکت های هوش مصنوعی نیویورک تایمز اخیرا از OpenAI شکایت کرد زیرا مدل متنی ChatGPT آن، نسخه‌های تقریباً کلمه‌به‌لفظی از مقالات دارای دیوار پرداختی روزنامه را بیرون می‌آورد. نویسندگان کتاب ادعاهای مشابهی را مطرح کرده اند توسعه دهندگان نرم افزار.

قبلا تحقیق نشان داده است که ChatGPT OpenAI را می توان برای بازتولید متن آموزشی به کار گرفت. و کسانی که از مایکروسافت و گیت هاب شکایت می کنند معتقدند که مدل دستیار کدنویسی Copilot کد را کم و بیش کلمه به کلمه بازتولید می کند.

ساوتن مشاهده کرد که Midjourney از مشتریانی که محتوای متخلف ایجاد می کنند و از طریق درآمد اشتراک سود می برند، هزینه دریافت می کند. او می گوید: «کاربران MJ [Midjourney] مجبور نیستند تصاویر را به دلیل نقض حق نسخه برداری به طور بالقوه بفروشند، MJ در حال حاضر از ایجاد آن سود می برد. اظهار داشت:، بازتاب استدلال ارائه شده در گزارش IEEE.

OpenAI همچنین هزینه اشتراک را دریافت می کند و در نتیجه به همان روش سود می برد. هیچکدام OpenAI و Midjourney به درخواست ها برای اظهار نظر پاسخ ندادند.

با این حال، OpenAI در روز دوشنبه یک پست های وبلاگ رسیدگی به شکایت نیویورک تایمز، که فروشنده هوش مصنوعی گفت فاقد شایستگی است. به‌طور شگفت‌انگیزی، این آزمایشگاه گفت که اگر شبکه‌های عصبی آن محتوای متخلف تولید می‌کنند، یک «اشکال» است.

در مجموع، تازه‌کار امروز استدلال کرد که: فعالانه با سازمان‌های خبری همکاری می‌کند. آموزش در مورد داده های دارای حق نسخه برداری واجد شرایط دفاع از استفاده منصفانه تحت قانون حق چاپ است. ""نقص" یک اشکال نادر است که ما در تلاش هستیم تا آن را به صفر برسانیم"؛ و نیویورک تایمز نمونه هایی از بازتولید متن را انتخاب کرده است که نشان دهنده رفتار معمولی نیست.

قانون تصمیم خواهد گرفت

تایلر اوچوا، استاد بخش حقوق در دانشگاه سانتا کلارا در کالیفرنیا، گفت ثبت نام که اگرچه یافته‌های گزارش IEEE احتمالاً به طرفین دعوی در مورد ادعاهای حق نسخه‌برداری کمک می‌کند، نباید این کار را انجام دهند - زیرا نویسندگان مقاله، به نظر او، آنچه را که اتفاق می‌افتد، به اشتباه معرفی کرده‌اند.

آنها می نویسند: «آیا می توان مدل های تولید کننده تصویر را به تولید خروجی های سرقت ادبی بر اساس مطالب حق چاپ القا کرد؟ … [ما دریافتیم که پاسخ به وضوح مثبت است، حتی بدون درخواست مستقیم خروجی‌های سرقت ادبی».

اوچوآ این نتیجه را زیر سوال برد و استدلال کرد که درخواست‌هایی که نویسندگان گزارش وارد کرده‌اند نشان می‌دهد که آنها در واقع مستقیماً خروجی‌های سرقت ادبی را درخواست می‌کنند. هر پیامی عنوان یک فیلم خاص را ذکر می کند، نسبت تصویر را مشخص می کند، و در همه موارد به جز یک مورد، کلمات "فیلم" و "اسکرین شات" یا "اسکرین کپ" را مشخص می کند. (یک استثنا تصویری را توصیف می کند که می خواستند آن را تکرار کنند. )”

پروفسور حقوق گفت که موضوع قانون کپی رایت تعیین این است که چه کسی مسئول این خروجی های سرقت ادبی است: سازندگان مدل هوش مصنوعی یا افرادی که از مدل هوش مصنوعی خواسته اند یک صحنه محبوب را بازتولید کند.

اوچوا توضیح داد: «مدل هوش مصنوعی مولد قادر به تولید خروجی اصلی است و همچنین می‌تواند صحنه‌هایی را که شبیه صحنه‌هایی از ورودی‌های دارای حق نسخه‌برداری است، بازتولید کند. "این باید به عنوان یک مورد نقض مشارکتی تحلیل شود: شخصی که مدل را مطرح کرده است، متخلف اصلی است و سازندگان مدل تنها در صورتی مسئول هستند که از تخلف اولیه مطلع شده باشند و اقدامات معقولی برای متوقف کردن انجام نداده باشند. آی تی."

اوچوا گفت که مدل‌های مولد هوش مصنوعی زمانی که نمونه‌های متعددی از آن تصاویر در مجموعه داده‌های آموزشی آن‌ها وجود دارد، احتمالاً تصاویر خاصی را بازتولید می‌کنند.

در این مورد، بسیار بعید است که داده های آموزشی شامل کل فیلم ها باشد. محتمل‌تر است که داده‌های آموزشی شامل تصاویر ثابتی از فیلم‌هایی باشد که به عنوان عکس‌های تبلیغاتی برای فیلم توزیع شده‌اند.» «این تصاویر چندین بار در داده‌های آموزشی تکثیر شدند، زیرا رسانه‌ها تشویق شدند که آن تصاویر را برای اهداف تبلیغاتی توزیع کنند و این کار را انجام دادند.

اساساً ناعادلانه خواهد بود که یک صاحب حق چاپ به انتشار گسترده تصاویر ثابت برای اهداف تبلیغاتی تشویق کند و سپس شکایت کند که این تصاویر توسط یک هوش مصنوعی تقلید شده است زیرا داده های آموزشی شامل چندین نسخه از همان تصاویر است.

اوچوا گفت اقداماتی برای محدود کردن چنین رفتاری از مدل‌های هوش مصنوعی وجود دارد. سوال این است که آیا باید این کار را انجام دهند، وقتی شخصی که وارد فرمان شده است به وضوح می‌خواهد هوش مصنوعی را برای بازتولید یک تصویر قابل تشخیص وادار کند، و استودیوهای فیلمسازی که تصاویر ثابت اصلی را تولید کرده‌اند به وضوح می‌خواهند آن تصاویر ساکن به طور گسترده توزیع شوند. ،" او گفت.

یک سوال بهتر می تواند این باشد: زمانی که درخواست به فیلم خاصی اشاره نمی کند یا شخصیت یا صحنه خاصی را توصیف نمی کند، چند وقت یکبار این اتفاق می افتد؟ من فکر می کنم یک محقق بی طرف احتمالاً متوجه می شود که پاسخ به ندرت (شاید تقریباً هرگز) است.

با این وجود، محتوای دارای حق چاپ به نظر می رسد سوخت ضروری برای عملکرد خوب این مدل ها باشد.

OpenAI از خود در برابر لردها دفاع می کند

در پاسخ به پرس و جو OpenAI در رابطه با خطرات و فرصت های مدل های هوش مصنوعی توسط کمیته ارتباطات و دیجیتال مجلس اعیان بریتانیا ارسال [PDF] هشدار می دهد که مدل های آن بدون آموزش در مورد محتوای دارای حق نسخه برداری کار نمی کنند.

این آزمایشگاه فوق‌العاده گفت: «از آنجایی که امروزه کپی رایت تقریباً هر نوع بیان انسانی را شامل می‌شود - از جمله پست‌های وبلاگ، عکس‌ها، پست‌های انجمن، تکه‌های کد نرم‌افزار و اسناد دولتی - آموزش مدل‌های پیشرو هوش مصنوعی امروزی بدون استفاده از مواد دارای حق چاپ غیرممکن است. .

محدود کردن داده‌های آموزشی به کتاب‌ها و نقاشی‌های مالکیت عمومی که بیش از یک قرن پیش ایجاد شده‌اند، ممکن است آزمایش جالبی به همراه داشته باشد، اما سیستم‌های هوش مصنوعی را که نیازهای شهروندان امروزی را برآورده می‌کند، ارائه نمی‌کند.»

AI biz گفت معتقد است که با قانون کپی رایت مطابقت دارد و آموزش در مورد مطالب دارای حق چاپ قانونی است، اگرچه این اجازه را می دهد که "هنوز کار برای حمایت و توانمندسازی سازندگان وجود دارد."

این احساس، که شبیه به رسمیت شناختن دیپلماتیک نگرانی‌های اخلاقی در مورد غرامت برای استفاده منصفانه قابل بحث از اثر دارای حق چاپ است، باید در ارتباط با این ادعای گزارش IEEE در نظر گرفته شود که «ما شواهدی کشف کرده‌ایم که یک مهندس نرم‌افزار ارشد در Midjourney در یک مکالمه در فوریه 2022 در مورد نحوه فرار از قانون حق چاپ با «پاکسازی» داده ها «از طریق یک کدکس دقیق تنظیم شده»».

مارکوس، یکی از نویسندگان گزارش IEEE، نسبت به تلاش OpenAI برای به دست آوردن چراغ سبز نظارتی در بریتانیا برای شیوه های تجاری فعلی خود ابراز تردید کرد.

"ترجمه خشن: اگر به ما اجازه دزدی ندهید، ما به طرز شگفت انگیزی ثروتمند نخواهیم شد، پس لطفا دزدی را جرم تلقی نکنید!" او در یک شبکه اجتماعی نوشت پست. «ما را مجبور به پرداخت نکنید صدور مجوز هزینه ها، یا! مطمئناً نتفلیکس ممکن است میلیاردها دلار در سال هزینه صدور مجوز بپردازد، اما we نباید مجبور باشد! پول بیشتر برای ما، ناله!»

OpenAI به مشتریان ChatGPT و API شرکتی غرامت ارائه کرده است در برابر ادعاهای حق چاپ، اگرچه نه اگر مشتری یا کاربران نهایی مشتری «می دانستند یا باید می دانستند که خروجی نقض می کند یا احتمالاً نقض می کند» یا اگر مشتری ویژگی های ایمنی را دور زده باشد، از جمله محدودیت های دیگر. بنابراین، درخواست از DALL-E 3 برای بازسازی یک صحنه فیلم معروف - که کاربران باید بدانند احتمالاً تحت پوشش حق چاپ است - برای غرامت واجد شرایط نیست.

Midjourney رویکرد مخالف را در پیش گرفته است، و قول داده است که مشتریانی را که درگیر تخلف هستند شکایت کند تا هزینه های قانونی ناشی از ادعاهای مرتبط را جبران کند.

Midjourney's "اگر آگاهانه مالکیت معنوی دیگران را نقض کنید، و این برای ما هزینه دارد، ما شما را پیدا می کنیم و آن پول را از شما دریافت می کنیم." شرایط استفاده از خدمات حالت. ما ممکن است کارهای دیگری نیز انجام دهیم، مانند تلاش برای درخواست از دادگاه برای پرداخت هزینه های قانونی ما. این کار را نکن.» ®

تمبر زمان:

بیشتر از ثبت نام