Wessen Zeile ist es überhaupt, GitHub? Einige Tipps für Entwickler

Wessen Zeile ist es überhaupt, GitHub? Einige Tipps für Entwickler

Quellknoten: 2733749

Meinung Open Source. Es ist offen. Du kannst sehen. Meistens können Sie verwenden. Der Name gibt einen Hinweis. Nicht so schnell, behauptet eine Sammelklage gegen Microsoft, OpenAI und GitHub. Copilot, ein In-IDE-KI-gestützter und Open-Source-trainierter Vorschlagsbot, funktioniert, indem er Programmierern Codezeilen anbietet – und das, so behauptet die Sammelklage, gegen die Regeln verstößt und versucht, es hinterlistig zu verbergen. Ein Richter hat entschieden, dass einige der Ansprüche vor Gericht verhandelt werden müssen. Sehr geehrter Herr, kein weiterer Urheberrechtsstreit.

Technologie kann für Richter sehr seltsam aussehen. Angenommen, Sie kaufen legal ein E-Book. Wie bekommst du es? Router und Caching-Server erstellen jeweils Kopien des Buchs bei der Lieferung, haben aber keinen Cent bezahlt. Verstoßen die Eigentümer der Internet-Infrastruktur täglich milliardenfach gegen das Urheberrecht? Man könnte meinen, das sei eine dumme Frage, aber sie störte den Obersten Gerichtshof des Vereinigten Königreichs so sehr, dass er nach Europa reiste und fragte: „Ist dieses Internet tatsächlich legal??“ „Sei nicht so verdammt blöd“, lautete die Antwort. Wir vermissen Europa.

Es bleibt abzuwarten, wie viele der Ansprüche gegen Microsoft, Copilot und den Code-Prompter von OpenAI in die verdammte Schublade fallen. Als die Regeln geschrieben wurden, hatte niemand damit gerechnet, dass KI globale Datenbanken mit Open-Source-Code aufnehmen würde. Andererseits hat niemand damit gerechnet, dass Suchmaschinen den gesamten Inhalt umfassend erfassen, analysieren und präsentieren würden. Das birgt sicherlich seine Probleme, aber man ist sich einig, dass es zu nützlich und nicht schädlich genug ist, um es zu verbieten. Copilot und andere maschinelle Lernsysteme, die sich auf Internetinhalte stützen, ähneln in dieser Hinsicht weitgehend Suchmaschinen. Die Frage ist also: Ist das Ergebnis nicht nützlich genug oder zu schädlich, um es zu akzeptieren? Wo bleibt der Interessenausgleich?

Es gibt sinnvolle Wege, an die Probleme heranzugehen, und sie beinhalten – die Unternehmensleitung schaut jetzt weg – Ethik. Ja, wirklich, dieses kurze modische Gerede über ethische KI bietet einen konkreten Weg nach vorne, der viel besser funktionieren wird als Klagen.

Da es durch Sonderinteressen aus den Fugen geraten ist, besteht der Kern des Rechts des geistigen Eigentums darin, dass die vernünftigen Wünsche des Urhebers respektiert werden sollten. Wenn es sich bei der Software um Open Source handelt, möchte der Ersteller vernünftigerweise, dass die Leute sie lesen und nutzen können. Etwas, das dies fördert, scheint nicht die schlimmste Sünde der Welt zu sein.

Vielleicht liegt es an der Art und Weise, wie es funktioniert, indem die Codevorschläge aus dem Kontext gerissen werden. Schließlich gibt es viele Open-Source-Lizenzen, und einige enthalten möglicherweise Bedingungen, über die unser glücklicher Copilot-Schneider Bescheid wissen sollte. Angenommen, Copilot erkennt, wenn es den Code einer anderen Person vorschlägt, ist es nicht unangemessen, die Lizenzbedingungen zu melden, unter denen es angeboten wird. Dadurch liegt die Verantwortung beim Programmierer, sich daran zu halten, was ethischer ist, als der Versuchung nachzugeben und gleichzeitig die Konsequenzen zu verbergen. Könnte sogar die Trefferquote bei der Einhaltung von Open-Source-Regeln verbessern.

Was ist, wenn der ursprüngliche Programmierer wirklich nicht möchte, dass seine Sachen durch die Eingeweide von Copilot gequetscht werden? Die Suchmaschinenwelt hat dieses Problem mit der Erfindung von robots.txt gelöst. Legen Sie eine Datei mit diesem Namen in Ihrem Web-Root-Verzeichnis ab und Sie platzieren ein „Kein Zutritt“-Schild für Webcrawler. Heutzutage sind die Dinge etwas fortgeschrittener, daher wäre es schön, diese Art von Funktion in die Struktur von GitHub einzubauen, mit welcher Art von Feinabstimmung auch immer, um die Absicht des Erstellers am besten zum Ausdruck zu bringen. Auf jeden Fall sagen Sie Inhaltsanbietern: „Sie möchten Ihre Inhalte nicht in unseren Suchergebnissen haben?“ Bußgeld." neigt dazu, den Geist auf Möglichkeiten zu konzentrieren, damit zu leben. Menschen Wahlmöglichkeiten geben und gleichzeitig die Konsequenzen erklären? Hübsch.

Selbst wenn den Leuten das Recht gegeben wird, ihren Code aus Copilot und dergleichen zu entfernen, bedeutet dies, dass eine Menge guter Dinge verloren gehen, aber das ist nicht das Ende der Welt. Da ist das „Reinraumprinzip“, das in den 1980er-Jahren die marktbeherrschende Stellung von IBM zerschmetterte und gleichzeitig den Markt rasant beschleunigte. Daraus könnte maschinelles Lernen viel lernen.

Der ursprüngliche IBM-PC war fast vollständig Open Source. IBM veröffentlichte ein technisches Handbuch mit vollständigen Schaltplänen, die alle Standardchips verwendeten, die auf standardmäßige Weise miteinander verbunden waren und die die Chiphersteller kostenlos zur Verfügung stellten. Das Entwerfen eines funktional gleichwertigen (jedoch nicht urheberrechtlich geschützten) IBM-PC-Klons war etwas, was Tausende von Elektronikingenieuren tun konnten, und Hunderte taten es auch.

Die juristische Mine im beigen Kasten war das BIOS, Basic INput-OUtput System, ein relativ kleiner Teil permanenter Software, der über Interrupts einen Standardsatz an Hardwarediensten für Betriebssysteme und Anwendungen bereitstellte – was man heute als API bezeichnen würde. Wenn Sie diesen Code einfach für Ihren Klon kopiert hätten, würde IBM Sie auf den richtigen Weg bringen. Sie könnten den Code umschreiben, aber IBM könnte Sie dann in Klagen verwickeln, in denen Sie nachweisen müssten, dass Sie nichts davon kopiert haben. Selbst wenn Sie gewinnen würden, würden die Verzögerung und die Kosten Sie ruinieren.

Rufen Sie den Reinraum auf. Kloner stellten Programmierer ein, die noch nie eine Zeile des BIOS von IBM gelesen hatten, und untersagten ihnen dies. Diese Programmierer erhielten die API, die nicht urheberrechtlich geschützt war, und wurden angewiesen, nach dieser Spezifikation zu schreiben. Mit rechtlichen Bescheinigungen, auf die die Kloner gerne vor Gericht schwörten, galt der Grundsatz, dass man nicht kopieren kann, was man nicht gesehen hat – und das letzte Puzzleteil der ursprünglichen Klonkriege war vorhanden. Dass APIs ein so wirksames Gegenmittel zum Urheberrecht darstellen, hat in jüngster Zeit viele dazu veranlasst, ihren rechtlichen Status zu ändern Google gegen Oracle. Das endete vor dem Obersten Gerichtshof der USA, wo es wie alle anderen scheiterte.

Nehmen wir also zwei automatisierte Systeme, eines zum Auffinden und Isolieren von Schnittstellen im Code und eines zum Anwenden von Regeln zum Generieren von Code, der diese Schnittstellen bereitstellt. Es findet keine Übertragung von Codezeilen über den virtuellen Luftspalt statt. Automatisierte Tests von Original- und KI-Code würden die Qualität steigern. Nebenbei wäre ein sehr gutes Set an Refactoring-Werkzeugen zum Nutzen aller entstanden. Klingt ethisch, oder?

Da haben wir es. Wenn es bei der Arbeit von Copilot echte Probleme gibt, gibt es mehrere Möglichkeiten, diese zu vermeiden und gleichzeitig den Nutzen zu wahren und neue Vorteile zu schaffen. Sich an die Regeln halten und gleichzeitig die Dinge verbessern? Das ist eine gute Linie. ®

Zeitstempel:

Mehr von Das Register