OpenAI: Lehetetlen a legmagasabb szintű AI betanítása és a szerzői jogok elkerülése

OpenAI: Lehetetlen a legmagasabb szintű AI betanítása és a szerzői jogok elkerülése

Forrás csomópont: 3052150

Az OpenAI azt mondta, hogy „lehetetlen” olyan csúcskategóriás neurális hálózatokat építeni, amelyek megfelelnek a mai igényeknek anélkül, hogy az emberek szerzői joggal védett munkáját felhasználnák. A Microsoft által támogatott laboratórium, amely úgy véli, hogy törvényesen gyűjti be az említett tartalmat modelljei képzése céljából, azt mondta, hogy a szerzői jogon kívüli, köztulajdonban lévő anyagok használata nem megfelelő AI-szoftvert eredményez.

Ez az állítás akkor született, amikor a gépi tanulás világa fejjel előre a téglafalon száguld, ami a szerzői jogi törvény. Éppen ezen a héten zárta le az IEEE jelentését, hogy a Midjourney és az OpenAI DALL-E 3, a szöveges felszólításokat képpé alakító két fő mesterséges intelligencia-szolgáltatás, képes újra létrehozni a szerzői jog által védett jeleneteket filmekből és videojátékokból a képzési adataik alapján.

A tanulmányGary Marcus, mesterséges intelligencia-szakértő és kritikus, valamint Reid Southen digitális illusztrátor társszerzője számos „plagizált kimenetet” dokumentál, amelyekben az OpenAI és a DALL-E 3 filmek jeleneteinek, híres filmek képeinek lényegében hasonló változatait jeleníti meg. színészek és videojáték-tartalom.

Marcus és Southen szerint szinte biztos, hogy a Midjourney és az OpenAI szerzői joggal védett anyagokon képezte ki saját mesterséges intelligencia-képgeneráló modelljét.

Továbbra is vitatott kérdés, hogy ez törvényes-e, és hogy az AI-szállítók vagy ügyfeleik felelősségre vonhatók-e. A jelentés megállapításai azonban megerősíthetik azokat, akik a Midjourney-t és a DALL-E gyártó OpenAI-t perelik szerzői jogok megsértése miatt.

Előfordulhat, hogy a felhasználók nem tudják, amikor képet készítenek, hogy sértik-e a jogot

"Mind az OpenAI, mind a Midjourney teljes mértékben képes olyan anyagok előállítására, amelyek úgy tűnik, hogy sértik a szerzői jogokat és a védjegyeket" - írták. „Ezek a rendszerek nem tájékoztatják a felhasználókat, amikor ezt teszik. Nem adnak tájékoztatást az általuk készített képek eredetéről. Előfordulhat, hogy a felhasználók nem tudják, amikor képet készítenek, hogy sértik-e a jogsértést.”

Egyik biznisz sem fedte fel teljes mértékben az AI modelljeik elkészítéséhez használt képzési adatokat.

Nem csak az digitális művészek kihívást jelentő AI cégeket. A New York Times nemrég beperelte az OpenAI-t mert a ChatGPT szövegmodellje szinte szó szerint kiköpi az újság fizetett falú cikkeit. Könyvszerzők hasonló keresetet nyújtottak be szoftverfejlesztők.

Előzetes kutatás jelezte, hogy az OpenAI ChatGPT-je koaxolható a képzési szöveg reprodukálására. A Microsoftot és a GitHubot beperelők pedig azt állítják, hogy a Copilot kódolási asszisztens modell többé-kevésbé szó szerint reprodukálja a kódot.

Southen megfigyelte, hogy a Midjourney díjat számít fel azon ügyfeleknek, akik jogsértő tartalmat hoznak létre, és előfizetési bevételből profitálnak. „Az MJ [Midjourney] felhasználóinak nem kell eladniuk a képeket azért, mert potenciálisan megsértették a szerzői jogokat, MJ már profitál a létrehozásából” vélekedett, megismételve az IEEE jelentésében megfogalmazott érvet.

Az OpenAI előfizetési díjat is számít fel, és így ugyanúgy profitál. Sem az OpenAI, sem a Midjourney nem válaszolt a megjegyzéskérésekre.

Az OpenAI azonban hétfőn közzétette a blogbejegyzés foglalkozik a New York Times perével, amely az AI-eladó szerint nem volt megalapozott. Meglepő módon a laboratórium azt mondta, hogy ha neurális hálózatai jogsértő tartalmat generáltak, az „hiba” volt.

Összességében a mai feltörekvő a következőkkel érvelt: Aktívan együttműködik hírszervezetekkel; a szerzői joggal védett adatokkal kapcsolatos képzés megfelel a szerzői jogi törvény szerinti méltányos használat védelmének; „A „regurgitáció” egy ritka hiba, amelyet azon dolgozunk, hogy nullára csökkentsük”; a New York Times pedig olyan szövegreprodukciós példákat hozott, amelyek nem a tipikus viselkedést képviselik.

A törvény dönt majd

Tyler Ochoa, a kaliforniai Santa Clara Egyetem jogi tanszékének professzora elmondta A regisztráció hogy bár az IEEE-jelentés megállapításai valószínűleg segítséget nyújtanak a szerzői jogi követelésekkel kapcsolatos peres feleknek, nem szabad – mert a cikk szerzői szerinte félremagyarázták a történéseket.

„Azt írják: „Rávehetők-e képgeneráló modellek, hogy szerzői jogi anyagokon alapuló plágiumot állítsanak elő? … [Úgy találtuk, hogy a válasz egyértelműen igen, még akkor is, ha közvetlenül nem kértünk plágiumot.”

Ochoa megkérdőjelezte ezt a következtetést, és azzal érvelt, hogy a jelentés szerzőinek „beírt felszólításai azt bizonyítják, hogy valóban közvetlenül kérnek plágiumot. Minden egyes felszólítás megemlíti egy adott film címét, megadja a képarányt, és egy kivételével minden esetben a „film” és a „screenshot” vagy „screencap” szavakat. (Az egyetlen kivétel azt a képet írja le, amelyet le akartak reprodukálni. )”

A törvény professzora szerint a szerzői jogi törvény kérdése annak meghatározása, hogy ki a felelős ezekért a plágiumokért: az AI-modell megalkotói vagy azok, akik felkérték az AI-modellt egy népszerű jelenet reprodukálására.

"A generatív mesterséges intelligencia modell képes eredeti kimenetet produkálni, és arra is képes, hogy felszólításra olyan jeleneteket reprodukáljon, amelyek a szerzői jog által védett bemenetekről származó jelenetekhez hasonlítanak" - magyarázta Ochoa. „Ezt a közreműködő jogsértés eseteként kell elemezni: a modellt kezdeményező személy az elsődleges jogsértő, és a modell készítői csak akkor felelősek, ha tudomást szereztek az elsődleges jogsértésről, és nem tettek meg ésszerű lépéseket annak megállítására. azt."

Ochoa szerint a generatív AI-modellek nagyobb valószínűséggel reprodukálnak bizonyos képeket, ha ezek a képek több példányban is szerepelnek a képzési adatkészletükben.

„Ebben az esetben nagyon valószínűtlen, hogy az edzésadatok teljes filmeket tartalmaznának; sokkal valószínűbb, hogy a képzési adatok tartalmaztak állóképeket a filmekből, amelyeket a film reklámfilmjeként terjesztettek” – mondta. „Ezeket a képeket többször is reprodukálták a képzési adatokban, mert a médiákat arra ösztönözték, hogy ezeket a képeket nyilvánosságra hozatal céljából terjesszék, és ezt meg is tették.

"Alapvetően igazságtalan lenne, ha a szerzői jog tulajdonosa ösztönözné az állóképek széles körű terjesztését reklámozás céljából, majd panaszkodik, hogy ezeket a képeket mesterséges intelligencia imitálja, mivel a képzési adatok ugyanazon képek több másolatát is tartalmazták."

Ochoa elmondta, hogy vannak lépések az AI modellek ilyen viselkedésének korlátozására. „A kérdés az, hogy ezt meg kell-e tenniük, amikor a felszólító személy egyértelműen rá akarta venni az AI-t, hogy felismerhető képet reprodukáljon, és az eredeti állóképeket készítő filmstúdiók egyértelműen azt akarták, hogy ezeket az állóképeket széles körben elterjesszék. ," ő mondta.

„Jobb kérdés lenne: Milyen gyakran fordul elő ez, amikor a felszólítás nem említ egy adott filmet, vagy nem ír le egy adott szereplőt vagy jelenetet? Azt hiszem, egy elfogulatlan kutató valószínűleg azt tapasztalná, hogy a válasz ritkán (talán szinte soha) adható meg.”

Mindazonáltal úgy tűnik, hogy a szerzői joggal védett tartalmak elengedhetetlenek ahhoz, hogy ezek a modellek jól működjenek.

Az OpenAI megvédi magát a Lordok előtt

Válaszként érdeklődés Az AI modellek kockázatairól és lehetőségeiről az Egyesült Királyság Lordok Háza Kommunikációs és Digitális Bizottsága által az OpenAI bemutatott egy benyújtása [PDF] arra figyelmeztet, hogy modelljei nem működnek, ha nem képezik őket szerzői joggal védett tartalomra.

„Mivel a szerzői jog ma gyakorlatilag az emberi megnyilvánulások minden fajtáját lefedi – beleértve a blogbejegyzéseket, fényképeket, fórumbejegyzéseket, szoftverkód töredékeket és kormányzati dokumentumokat –, lehetetlen lenne a mai vezető mesterséges intelligencia modelleket kiképezni szerzői joggal védett anyagok használata nélkül” – mondta a szuperlaboratórium. .

"A képzési adatoknak a több mint egy évszázaddal ezelőtt készített, közkincsre való korlátozása érdekes kísérletet eredményezhet, de nem biztosítana olyan mesterséges intelligencia rendszereket, amelyek megfelelnek a mai polgárok igényeinek."

Az AI biz azt mondta, hogy úgy gondolja, hogy megfelel a szerzői jogi törvénynek, és a szerzői joggal védett anyagokkal kapcsolatos képzés törvényes, bár lehetővé teszi, hogy "még mindig van tennivaló az alkotók támogatásán és felhatalmazásán".

Ezt az érzést, amely a szerzői joggal védett művek vitatható méltányos használatának kompenzációjával kapcsolatos etikai aggályok diplomáciai elismerésének hangzik, az IEEE-jelentés azon állításával összefüggésben kell figyelembe venni, hogy „bizonyítékot fedeztünk fel arra vonatkozóan, hogy a Midjourney vezető szoftvermérnöke részt vett a egy beszélgetés 2022 februárjában arról, hogyan lehet megkerülni a szerzői jogi törvényt az adatok „finomhangolt kódexen keresztül történő mosásával”.

Marcus, az IEEE jelentés társszerzője szkepticizmusának adott hangot az OpenAI azon törekvésével kapcsolatban, hogy az Egyesült Királyságban a szabályozási zöld utat kapjon jelenlegi üzleti gyakorlatához.

"Durva fordítás: Nem leszünk mesésen gazdagok, ha nem hagyod, hogy lopjunk, úgyhogy kérlek, ne tedd bűnnek a lopást!" – írta a közösségi médiában Hozzászólás. „Ne kényszeríts minket, hogy fizessünk engedélyezés díjakat is! Persze a Netflix évente milliárdokat fizethet licencdíjat, de we nem kellene! Több pénzt nekünk, moar!”

Az OpenAI felajánlotta a vállalati ChatGPT és API-ügyfelek kártalanítását szerzői jogi követelésekkel szemben, bár nem, ha az ügyfél vagy az ügyfél végfelhasználói „tudták, vagy tudniuk kellett volna, hogy a kimenet sérti vagy valószínűleg sérti”, vagy ha az ügyfél megkerülte a biztonsági funkciókat, egyéb korlátozások mellett. Így ha a DALL-E 3-at felkérik egy híres filmjelenet újraalkotására – amelyről a felhasználóknak tudniuk kell, hogy valószínűleg szerzői jogvédelem alá esnek –, nem jár kártalanítással.

A Midjourney ezzel ellentétes megközelítést alkalmaz, és azt ígérte, hogy levadászja és bepereli a jogsértésben érintett ügyfeleket, hogy behajtsa a kapcsolódó követelésekből származó jogi költségeket.

„Ha tudatosan megsérti valaki más szellemi tulajdonát, és ez pénzünkbe kerül, akkor megkeresünk, és beszedjük tőled azt a pénzt” – mondta a Midjourney. Általános Szerződési Feltételek állapot. – Más dolgokat is csinálhatunk, például megpróbálunk bíróságot kérni, hogy fizesse ki az ügyvédi díjainkat. ne csináld." ®

Időbélyeg:

Még több A regisztráció