Urheberrechtsverletzung durch KI-Training?

New York Times vs. OpenAI & Microsoft

Die New York Times verklagt ChatGPT, bzw. dessen Entwickler (OpenAI), wegen millionenfacher Urheberrechtsverletzungen. Was steckt dahinter?

Veröffentlicht am: 16.01.2024
Von: Anna-Maria Blömer
Qualifikation: Wissenschaftliche Mitarbeiterin in Hamburg
Lesedauer:

Vor dem Bezirksgericht Manhattan soll er stattfinden, der Kampf der Giganten. Die New York Times (NYT) verklagt die ChatGPT-Entwickler OpenAI und deren Partner Microsoft wegen millionenfacher Urheberrechtsverstöße. Die Zeitung beklagt das unrechtmäßige Kopieren ihrer wertvollen journalistischen Arbeit. Für das Einspeisen „hochwertiger journalistischer Inhalte“ in den Chatbot habe sie im Gegenzug keinerlei finanzielle Kompensation erhalten.

Noch zuletzt war eine Partnerschaft zwischen den beiden Unternehmen angestrebt worden, die vor allem die Nutzung und Verlinkung von Inhalten der New York Times zum Ziel hatte.

ChatGPT führt zu neuen Problemen im Urheberrecht

Die New York Times erhofft sich im Zuge eines Gerichtsverfahrens die Klärung grundsätzlicher Fragen im Urheberrecht in Verbindung mit Künstlicher Intelligenz (KI) (englisch: Artificial Intelligence (AI)). Darüber hinaus will sie Schadensersatzansprüche und entgangene Gewinne geltend machen.

Die KI-Anwendungen des amerikanischen Softwareunternehmens seien laut Vorwurf der New York Times ohne Einverständnis der rechtmäßigen Urheber mit Artikeln, Fotos und anderen journalistischen Inhalten gefüttert worden, in die große Medienhäuser jährlich Millionen von US-Dollar investierten.

Konkret wird den KI-Entwicklern Diebstahl Geistigen Eigentums durch wortgleiche Plagiate vorgeworfen. KI-Produkte, die daraus entstehen, würden durch das Einspeisen der professionellen Inhalte zu ernst zu nehmenden Konkurrenzprodukten.

Milliardenschaden durch unterschlagene Affiliate-Links

Dazu komme, dass die New York Times einige ihrer Artikel mit sogenannten Affiliate-Links versehen, durch deren Verwendung sie Provisionen erhält, wenn Leser mit den Links interagieren. Diese Provisionen entgehen dem Medienhaus allerdings, wenn die Menschen über ChatGPT & Co. die Inhalte ausgespielt bekommen, ohne dass die dazugehörigen Affiliate-Links aufgerufen werden können. Der Zeitungskonzern spricht von einem Milliardenschaden – eine konkrete Summe wird nicht genannt.

OpenAI antwortet öffentlich auf Vorwürfe

Kurz nach der Klageerhebung durch die New York Times hat OpenAI in einem Blogpost ein öffentliches Statement abgegeben. Die ChatGPT-Entwickler weisen die Plagiatsvorwürfe ausdrücklich von sich. Ihnen zufolge habe die New York Times nicht „die ganze Geschichte“ erzählt.

Sie werfen der Zeitung vor, in den Chatbot absichtlich solche Prompts eingegeben zu haben, die ihn dazu veranlassten lange Ausschnitte aus ihren eigenen Artikeln auszuspielen. Normalerweise, so heißt es von den Entwicklern, würde die KI nicht so reagieren, sondern aus Inhalten mehrerer Quellen einen eigenen Antworttext generieren, nicht aber eine Antwort direkt aus nur einer Quelle ausspielen.

Mit einer solchen Verwendung von ChatGPT, habe die New York Times gegen die Nutzungsbedingungen verstoßen. Infolgedessen seien die Beispiele aus ihrer Klageschrift auf missbräuchliche Art und Weise generiert worden.

KI außer Rand und Band?

OpenAI ist überzeugt davon, dass das Training von KI-Anwendungen anhand urheberrechtlich geschützter Inhalte unter den amerikanischen Rechtsbegriff des „fair use“ falle. Ein Anspruch auf Entschädigung für die Verarbeitung der Daten bestehe auf Seiten der New York Times daher nicht.

Allerdings haben die Entwickler selbst zugegeben, dass bei ChatGPT bislang noch in ein paar wenigen Fällen ein Fehler auftrete, bei dem lediglich Inhalte aus dem Netz in voller Länge wiederholt werden. An der Behebung dieses Problems arbeite man nach eigener Aussage bereits.

Außerdem könne man nicht immer eindeutig nachvollziehen, wie sich der Chatbot in bestimmten Situationen verhält. Das wird noch zu künftigen Schwierigkeiten bei der Regulierung von solchen komplexen KI-basierten Sprachmodellen wie ChatGPT führen…

Künstliche Intelligenz – urheberrechtliche Unsicherheit auch in Deutschland

Auch in Deutschland herrscht derweilen noch Unsicherheit über den urheberrechtlichen Umgang mit KI-generierten Inhalten. Dürfen Künstliche Intelligenzen mit urheberrechtlich geschützten Werken trainiert werden? Keine direkte Antwort auf die Zulässigkeit der Nutzung von urheberrechtlich geschützten Werken zu Trainingszwecken, aber erste Regelungen zum Umgang mit künstlicher Intelligenz, soll zunächst der Europäische AI Act liefern.

Damit geht die Einführung einer allgemeinen Transparenzpflicht einher, nach der die Entwickler von KI-Anwendungen eine Liste mit den verwendeten Trainingsinhalten offenlegen müssen. Genauere Hinweise dazu, welche Anforderungen an die Transparenzpflicht gestellt werden, wollen EU-Parlament und EU-Rat laut eigener Mitteilung „in den kommenden Wochen“ finalisieren.