Generative KI

OpenAI weist Vorwürfe der New York Times zurück

Als erstes großes US-Medienunternehmen hatte die "New York Times" OpenAI Ende Dezember wegen Urheberrechtsverletzung verklagt. Der ChatGPT-Entwickler behauptet nun, die Zeitung habe bei der Suche nach Beweisen absichtlich manipuliert.

OpenAI weist Vorwürfe der New York Times zurück

OpenAI weist Vorwürfe zurück

New York Times soll für Reproduktion geschützter Artikel "manipuliert" haben – Training von KI-Modellen sei "Fair use"

Als erstes großes US-Medienunternehmen hatte die "New York Times" OpenAI und seinen Hauptinvestor Microsoft Ende Dezember wegen Urheberrechtsverletzung verklagt. Der ChatGPT-Entwickler hält die Klage für unbegründet und behauptet nun, dass die Zeitung bei der Suche nach Beweisen absichtlich manipuliert habe.

kro Frankfurt

OpenAI hat sich in einer öffentlichen Stellungnahme gegen den Vorwurf der New York Times gewehrt, mit seinem Chatbot ChatGPT Urheberrechte zu verletzen. "Wir unterstützen den Journalismus, gehen Partnerschaften mit Nachrichtenunternehmen ein und glauben, dass die Klage der New York Times unbegründet ist", erklärte das Start-up für generative künstliche Intelligenz (GKI) in einem Blog-Post.

Die New York Times hatte OpenAI und seinen Hauptinvestor Microsoft Ende Dezember als erstes großes US-Medienunternehmen verklagt und den Firmen vorgeworfen, unerlaubt Wissen aus Millionen von Artikeln für das Training der Sprachmodelle verwendet zu haben. Dadurch seien Schäden in Milliardenhöhe entstanden, so die Zeitung. In ihrer Klageschrift hatte sie Beispiele angeführt, bei denen ChatGPT nahezu wortgleiche Auszüge von früheren Artikeln der Times generiert hatte, die anderweitig nur über ein Bazahlabo zugänglich seien.

"Kein typisches Nutzerverhalten"

Nach Darstellung von OpenAI sei das jedoch nur durch einen Verstoß gegen die Nutzungsbedingungen möglich gewesen. So habe die Times ihre Prompts (also die Befehle an den Chatbot zur Erstellung von Inhalten, Anm. d. Red.) "absichtlich manipuliert" und "lange Auszüge von Artikeln genutzt, um unser Modell dazu zu bringen, Texte zu reproduzieren".

Eine solche Art von Fehlanwendung entspreche nicht dem typischen Nutzerverhalten und sei auch nicht erlaubt, erklärte OpenAI. Abgesehen davon würden die Sprachmodelle selbst bei solchen Prompts für gewöhnlich keine geschützten Texte reproduzieren, was aus Sicht des Start-ups darauf hindeutet, dass die Times das Modell entweder zur Reproduktion aufgefordert oder aber viele Anläufe benötigt habe, um passende Beispiele zu erhalten. Hinzu komme, dass die reproduzierten Auszüge scheinbar von mehrere Jahre alten Artikeln stammen und zudem bereits auf mehreren Webseiten von Drittanbietern aufgetaucht seien. Das Phänomen der Reproduktion von geschützten Inhalten sei ein "seltener technischer Fehler", an dem man arbeite, hieß es weiter.

Start-up beruft sich auf Fair-Use-Prinzip

OpenAI bezog sich zugleich auf die Fair-Use-Doktrin, also eine Regelung, die nach US-Recht die legale Nutzung von urheberrechtlich geschütztem Material in bestimmten Fällen vorsieht. "Das Training von KI-Modellen mit öffentlich zugänglichen Inhalten aus dem Internet ist 'Fair Use'", erklärte das Start-up. Diese Ansicht sei durch vorherige Präzedenzfälle untermauert und werde auch von Vertretern der Wissenschaft, von Bibliotheksverbänden, von zivilgesellschaftlichen Gruppen, von Start-ups, führenden Unternehmen und Autoren vertreten. Ähnliche gesetzliche Regelungen gebe es zudem in der EU, in Japan, in Singapur und in Israel.

KI-Entwickler nutzen sogenannte Webcrawler, um Webseiten nach passenden Inhalten für das Training ihrer Sprachmodelle zu durchforsten. Webseiten-Betreiber können dies jedoch unterbinden. Die New York Times hatte eine solche Sperre nach Angaben von OpenAI im August eingerichtet.

Weitere Verlage verhandeln

Trotz seiner Überzeugung hinsichtlich des Fair-Use-Prinzips war OpenAI 2023 bereits mehrere Kooperationen mit Medienunternehmen (darunter Axel Springer und Associated Press) eingegangen, um deren Inhalte rechtmäßig zum Training der Sprachmodelle nutzen zu können. Bloomberg hatte zudem vor Kurzem berichtet, dass das Start-up auch jetzt noch mit Dutzenden Verlagen über die Lizensierung ihrer Artikel verhandelt. Laut dem Nachrichtenportal "The Information" bietet die Firma den Medienhäusern dafür pro Jahr 1 bis 5 Mill. Dollar.


Mehr zum Thema:

Urheberrecht: Klagen gegen KI-Bildgeneratoren