Чия це лінія взагалі, GitHub? Деякі поради для розробників

Чия це лінія взагалі, GitHub? Деякі поради для розробників

Вихідний вузол: 2733749

Думка Відкрите джерело. Він відкритий. Ви можете подивитися. Здебільшого можна використовувати. У назві є підказка. Не так швидко, стверджує колективний позов проти Microsoft, OpenAI і GitHub. Copilot, навчений бот для підказок із відкритим вихідним кодом на основі штучного інтелекту в IDE, працює, пропонуючи рядки коду програмістам, і це, як стверджується в колективному позові, порушує правила та намагається це підступно приховати. Суддя постановив, що деякі претензії заслуговують розгляду в суді. Шановний пане, не чергова битва за авторські права.

Технологія може виглядати дуже дивною для суддів. Скажімо, ви законно придбали електронну книгу. Як ви це отримуєте? Маршрутизатори та кеш-сервери створюють копії книги в міру її доставки, але вони не заплатили ні копійки. Чи власники інтернет-інфраструктури порушують авторські права мільярди разів на день? Ви можете подумати, що це безглузде запитання, але воно настільки стурбувало Верховний суд Великобританії, що він поїхав до Європи, щоб запитати:Чи законний цей Інтернет??» Не будь таким дурним, пролунала відповідь. Ми сумуємо за Європою.

Скільки претензій проти Microsoft, Copilot і суфлера коду OpenAI потрапить у криваву скриню, ще належить побачити. Ніхто не передбачав, що штучний інтелект поглинатиме глобальні бази даних з відкритим вихідним кодом, коли писалися правила. Знову ж таки, ніхто не передбачав, що пошукові системи займатимуться повним завантаженням, аналізом і представленням усього вмісту. З цим, звичайно, є свої проблеми, але консенсус полягає в тому, що він занадто корисний і недостатньо шкідливий, щоб оголосити поза законом. Copilot та інші системи машинного навчання, які використовують Інтернет-контент, у цьому відношенні майже такі ж, як пошукові системи. Тож постає питання, чи результат недостатньо корисний чи занадто шкідливий, щоб прийняти його? Де баланс інтересів?

Існують корисні способи підходу до вирішення проблем, і вони включають – корпоративне керівництво зараз відвернеться – етику. Так, справді, ця коротка модна балаканина про етичний штучний інтелект пропонує конкретний шлях вперед, який працюватиме набагато краще, ніж судові позови.

Суть права інтелектуальної власності полягає в тому, що слід поважати розумні побажання творця. Якщо програмне забезпечення є відкритим кодом, то розробник розумно бажає, щоб люди могли його читати та використовувати. Те, що спонукає до цього, не здається найгіршим гріхом у світі.

Можливо, це так, як він це робить, представляючи пропозиції коду поза контекстом. Зрештою, є багато ліцензій з відкритим кодом, і деякі з них можуть містити умови, про які повинен знати наш щасливий копілот. Що ж, якщо припустити, що Copilot може розпізнати, коли пропонує чужий код, цілком розумно, що він може повідомити про умови ліцензування, за якими він пропонується. Це покладає на кодера обов’язок дотримуватися вимог, що є більш етичним, ніж пропонувати спокусу, приховуючи наслідки. Може навіть підвищити показник відвідувань за дотримання правил відкритого коду.

Що робити, якщо оригінальний кодер справді не хоче, щоб їхні речі просувалися через надра Copilot? Світ пошукових систем вирішив це, винайшовши robots.txt. Помістіть файл із такою назвою у свій кореневий каталог веб-сайту, і ви розмістите знак «Вхід заборонено» для веб-сканерів. Зараз усе трохи просунуте, тому було б непогано додати таку функцію в структуру GitHub із будь-яким тонким налаштуванням, яке найкраще виражає наміри творця. У будь-якому випадку сказати постачальникам контенту: «Ви не хочете, щоб ваші речі з’являлися в наших результатах пошуку? Добре. мав тенденцію зосереджувати уми на способах жити з цим. Надавати людям вибір, пояснюючи наслідки? приємно

Навіть якщо надання людям права видаляти свій код із Copilot тощо призведе до зникнення маси хороших речей, це ще не кінець світу. Є «принцип чистої кімнати», який зруйнував домінуючу позицію IBM у 1980-х роках, одночасно прискоривши ринок як божевільний. Це те, з чого машинне навчання може багато чого навчитися.

Оригінальний IBM PC був майже повністю відкритим. IBM опублікувала технічну інструкцію з повними електричними схемами, у всіх яких використовувалися стандартні чіпи, з’єднані стандартними способами, які виробники чіпів роздавали безкоштовно. Розробка функціонально еквівалентного (але не захищеного авторським правом) клону IBM PC — це те, що могли зробити тисячі електронних інженерів, і сотні це зробили.

Законною міною в бежевій коробці був BIOS, базова система введення-виведення, відносно невелика частина постійного програмного забезпечення, яке забезпечувало стандартний набір апаратних послуг для операційних систем і програм через переривання – те, що сьогодні називають API. Якби ви просто скопіювали цей код для свого клону, IBM вимагала б, щоб ви виправилися. Ви можете переписати код, але тоді IBM може зв’язати вас судовими позовами, змусивши довести, що ви нічого з цього не копіювали. Навіть якщо ви виграєте, затримка та витрати потонуть вас.

Використовуйте чисту кімнату. Клонувальники найняли програмістів, які ніколи не читали жодного рядка BIOS IBM, і заборонили їм це робити. Цим програмістам надали API, який не був захищений авторським правом, і сказали писати в цій специфікації. Завдяки юридичним підтвердженням, до яких клонувальники із задоволенням присягнули в суді, принцип, що ви не можете копіювати те, чого ви не бачили, дотримувався – і остання деталь головоломки в оригінальній Війнах клонів була на місці. Те, що API є такою потужною протиотрутою проти авторського права, останнім часом змусило багатьох спробувати змінити свій правовий статус Google проти Oracle. Це закінчилося у Верховному суді США, де воно, як і всі інші, провалилося.

Отже, візьмемо дві автоматизовані системи: одна призначена для пошуку та ізоляції інтерфейсів у коді, а друга призначена для застосування правил для генерації коду, який забезпечує ці інтерфейси. Немає передачі рядків коду через віртуальний повітряний зазор. Автоматизоване тестування оригінального коду проти штучного інтелекту підвищить якість. Попутно народиться чудовий набір інструментів для рефакторингу, який принесе користь усім. Звучить етично, правда?

Ось і маємо. Якщо є справжні проблеми з тим, що робить Copilot, то є кілька способів уникнути їх, зберігаючи корисність і створюючи нові переваги. Грати за правилами, покращуючи ситуацію? Це хороша лінія. ®

Часова мітка:

Більше від Реєстр