يمكن للفنانين الآن تسميم صورهم لردع إساءة استخدامها بواسطة الذكاء الاصطناعي

يمكن للفنانين الآن تسميم صورهم لردع إساءة استخدامها بواسطة الذكاء الاصطناعي

عقدة المصدر: 3074000

أصدرت جامعة شيكاغو هذا الأسبوع Nightshade 1.0، وهي أداة مصممة لمعاقبة صانعي نماذج التعلم الآلي عديمي الضمير الذين يقومون بتدريب أنظمتهم على البيانات دون الحصول على إذن أولاً.

نوع من الباذنجان هي أداة هجومية لتسميم البيانات، وهي مصاحبة لأداة حماية ذات أسلوب دفاعي تسمى الصقيل، التي السجل مغطى في فبراير من العام الماضي.

يقوم Nightshade بتسميم ملفات الصور مما يسبب عسر الهضم للنماذج التي تستوعب البيانات دون إذن. الغرض منه هو جعل تلك النماذج التدريبية الموجهة نحو الصور تحترم رغبات منشئي المحتوى بشأن استخدام عملهم.

"يتم حساب Nightshade باعتباره تحسينًا متعدد الأهداف يقلل من التغييرات المرئية على الصورة الأصلية،" محمد الفريق المسؤول عن المشروع.

"على سبيل المثال، قد ترى عيون الإنسان صورة مظللة لبقرة في حقل أخضر دون تغيير إلى حد كبير، ولكن نموذج الذكاء الاصطناعي قد يرى محفظة جلدية كبيرة ملقاة على العشب. "

تم تطوير Nightshade من قبل طلاب الدكتوراه في جامعة شيكاغو، شون شان، ووينكسين دينغ، وجوزفين باسانانتي، والأساتذة هيذر تشنغ وبن تشاو، الذين ساعد بعضهم أيضًا في Glaze.

الموصوفة في أ ورقة بحثية في أكتوبر 2023، يعد Nightshade هجومًا تسمميًا محددًا وسريعًا. يتضمن تسميم الصورة اختيار ملصق (قطة على سبيل المثال) يصف ما تم تصويره بالفعل من أجل طمس حدود هذا المفهوم عند استيعاب الصورة للتدريب على النماذج.

لذلك يمكن لمستخدم نموذج تم تدريبه على الصور المسمومة لـ Nightshade إرسال مطالبة لقطة وتلقي إشعار بوجود صورة كلب أو سمكة. الاستجابات غير المتوقعة من هذا النوع تجعل نماذج تحويل النص إلى صورة أقل فائدة بشكل ملحوظ، مما يعني أن صانعي النماذج لديهم حافز للتأكد من أنهم يتدربون فقط على البيانات المقدمة مجانًا.

"يمكن أن يوفر Nightshade أداة قوية لأصحاب المحتوى لحماية ملكيتهم الفكرية ضد المدربين النموذجيين الذين يتجاهلون أو يتجاهلون إشعارات حقوق الطبع والنشر، وتوجيهات عدم الكشط/الزحف، وقوائم إلغاء الاشتراك"، كما ذكر المؤلفون في ورقتهم البحثية.

أدى عدم مراعاة رغبات المبدعين وأصحاب الأعمال الفنية إلى رفع دعوى قضائية قدم العام الماضي، وهو جزء من رد فعل أوسع ضد جمع البيانات دون إذن لصالح شركات الذكاء الاصطناعي. تزعم دعوى الانتهاك، المقدمة نيابة عن العديد من الفنانين ضد Stability AI وDeviant Art وMidjourney، أن نموذج Stable Diffusion الذي تستخدمه الشركات المدعى عليها يتضمن أعمال الفنانين دون إذن. تم تعديل القضية في نوفمبر 2023 لتشمل متهمًا جديدًا، وهو Runway AI، تواصل ليتم التقاضي.

يحذر المؤلفون من أن Nightshade لديه بعض القيود. على وجه التحديد، قد تختلف الصور التي تتم معالجتها باستخدام البرنامج اختلافًا طفيفًا عن الصورة الأصلية، خاصة الأعمال الفنية التي تستخدم ألوانًا مسطحة وخلفيات ناعمة. لاحظوا أيضًا أنه قد يتم تطوير تقنيات التراجع عن Nightshade، على الرغم من أنهم يعتقدون أن بإمكانهم تكييف برامجهم لمواكبة الإجراءات المضادة.

وقال ماثيو جوزديال، الأستاذ المساعد لعلوم الكمبيوتر بجامعة ألبرتا، في إحدى وسائل التواصل الاجتماعي بريد.. اعلاني"هذا عمل رائع وفي الوقت المناسب! لكني أشعر بالقلق من المبالغة في ذلك كحل. إنه يعمل فقط مع النماذج المستندة إلى CLIP ووفقًا للمؤلفين، سيتطلب 8 ملايين صورة "مسمومة" ليكون لها تأثير كبير على إنشاء صور مماثلة لنماذج LAION."

الصقيل، الذي وصل إلى 1.0 في يونيو الماضي، قد نسخة الويب، وهو الآن على ذلك 1.1.1 الإفراج، يغير الصور لمنع النماذج التي تم تدريبها على تلك الصور من تكرار النمط المرئي للفنان.

إن تقليد الأسلوب - المتاح من خلال خدمات تحويل النص إلى صورة المغلقة مثل Midjourney ومن خلال نماذج مفتوحة المصدر مثل Stable Diffusion - ممكن ببساطة عن طريق تحفيز نموذج تحويل النص إلى صورة لإنتاج صورة بأسلوب فنان معين.

يعتقد الفريق أنه يجب أن يكون لدى الفنانين طريقة لمنع التقاط وإعادة إنتاج أنماطهم البصرية.

"إن تقليد الأسلوب يؤدي إلى عدد من النتائج الضارة التي قد لا تكون واضحة للوهلة الأولى"، كما يقول الخبير. "بالنسبة للفنانين الذين يتم نسخ أساليبهم عمدًا، فإنهم لا يرون خسارة في العمولات والدخل الأساسي فحسب، بل إن النسخ الاصطناعية منخفضة الجودة المنتشرة عبر الإنترنت تضعف علامتهم التجارية وسمعتهم. والأهم من ذلك هو أن الفنانين يربطون أساليبهم بهويتهم ذاتها.

وهم يشبهون تقليد الأسلوب بسرقة الهوية ويقولون إنه يثبط عزيمة الفنانين الطموحين لإنشاء أعمال جديدة.

يوصي الفريق الفنانين باستخدام كل من Nightshade وGlaze. في الوقت الحالي، يجب تنزيل كل من الأداتين وتثبيتهما بشكل منفصل، ولكن يجري تطوير إصدار مدمج. ®

الطابع الزمني:

اكثر من السجل