Urheberrecht
Ein "Prompt" ist eine Eingabeaufforderung, Frage oder Anweisung, die an ein KI-Modell wie ChatGPT gerichtet wird, um eine Antwort oder Aktion auszulösen. Es stellt den Startpunkt oder den Kontext für die von der KI generierten Antwort dar. Wie sieht es mit dem Urheberrecht aus?
Was muss ich zum Prompting und Urheberrecht wissen?
Die Nutzung generativer KI-Systeme, wie beispielsweise ChatGPT, wirft bedeutende Fragen in Bezug auf Urheber- und Verwertungsrechte auf. Dieses Dokument dient als Einführung und Orientierungshilfe in diesem komplexen Rechtsgebiet. Es ist zu beachten, dass die Entwicklung generativer KI-Technologien nicht nur technisch, sondern auch rechtlich sehr dynamisch ist, wobei regelmäßig neue juristische Erkenntnisse gewonnen werden, die den bestehenden Wissensstand erweitern oder verändern. Viele rechtliche Herausforderungen im Umgang mit solchen KI-Systemen sind noch nicht vollständig geklärt, und viele relevante Fragen wurden bisher nicht gestellt.
Der folgende Abschnitt bietet einen Überblick über die rechtliche Landschaft, stellt jedoch keine Rechtsberatung dar und kann die Beratung durch einen Fachanwalt nicht ersetzen. Alle Informationen wurden mit großer Sorgfalt geprüft, jedoch wird keine Garantie für ihre Richtigkeit, Vollständigkeit oder Aktualität übernommen.
1. Aspekt: Trainingsdaten von LLMs und Urheberrechte Dritter
Die von ChatGPT generierten Antworten basieren auf Trainingsdaten, die laut der Entwicklerfirma OpenAI ausschließlich aus öffentlich zugänglichen Internetquellen stammen. Es wurde nicht spezifiziert, welche spezifischen Dokumente verwendet wurden. ChatGPTs automatisierte Verfahren haben Zugriff auf eine breite Palette an Textarten aus verschiedenen Bereichen, wie z.B. Bücher, Fachartikel, Blogs, Foren und andere Online-Texte, jedoch nicht auf geschützte Datenbanken oder Abonnementservices.
OpenAI behauptet, keine detaillierten Aufzeichnungen darüber zu führen, welche spezifischen Texte das Modell während des Trainings gesehen hat, sondern lediglich, dass das System gelernt hat, Muster zu erkennen und darauf basierend neue Inhalte zu generieren. Es verfügt daher über kein Wissen bezüglich der spezifischen Inhalte, die während des Trainings verarbeitet wurden.
Da OpenAI keine klaren Angaben zu möglicherweise urheberrechtlich geschützten Materialien im Trainingsprozess macht, bleibt unklar, ob solches Material verwendet wurde. OpenAI gibt lediglich an, nach Möglichkeit Inhalte verwendet zu haben, die entweder gemeinfrei sind oder unter das US-amerikanische „fair use“-Prinzip fallen.
In Deutschland gibt es kein direktes Äquivalent zu „fair use“. Hier regelt das Urheberrechtsgesetz (UrhG) den Zugang zu urheberrechtlich geschützten Werken für Text- und Data-Mining gemäß § 44b Abs. 1 UrhG, vorausgesetzt, die Werke sind rechtskonform öffentlich zugänglich. Die Trainingsdaten müssen vernichtet werden, sobald sie für das Projekt nicht mehr benötigt werden. Dies scheint mit den deutschen Urheberrechtsgesetzen übereinzustimmen.
Allerdings stehen endgültige rechtliche Klärungen zur Nutzung von Trainingsdaten für generative KI-Systeme noch aus. Solange keine gerichtlichen Entscheidungen oder gesetzlichen Regelungen existieren, wird allgemein angenommen, dass der Einsatz vieler generativer KI-Systeme nicht grundsätzlich gegen das deutsche Urheberrecht verstößt.
2. Aspekt: Urheber- und Verwertungsrechte an Inhalten, die von KI erzeugt wurden
Die Beurteilung der Urheber- und Verwertungsrechte an von Künstlicher Intelligenz erzeugten Medien muss individuell erfolgen und hängt von den jeweiligen Nutzungsbedingungen des eingesetzten KI-Systems ab. Als Beispiel dient hier das System „ChatGPT“ von OpenAI LP, im Weiteren „OpenAI“ genannt.
OpenAI erteilt Nutzern uneingeschränkte Verwertungsrechte an den von ChatGPT generierten Texten. Die Nutzungsbedingungen besagen explizit: „[…] OpenAI hereby assigns to you all its right, title and interest in and to Output“ (https://openai.com/policies/terms-of-use). Obwohl die Bedingungen anderer KI-Anbieter variieren können, verfolgen viele führende Anbieter ähnliche pragmatische Ansätze wie OpenAI. Sie neigen dazu, spezifische urheberrechtliche Fragen in ihren Nutzungsbedingungen zu übergehen und konzentrieren sich auf die Übertragung der Verwertungsrechte an die Nutzer.
In Deutschland wird die Urheberschaft von durch KI generierten Medien durch das Urheberrechtsgesetz (UrhG) geregelt, das klare Vorgaben macht. Damit der Output eines KI-Systems urheberrechtlich schutzfähig ist, muss er als Werk gelten. Ein Werk wird gemäß § 2 Abs. 2 UrhG als persönliche geistige Schöpfung definiert, die eine gewisse Schöpfungshöhe erreicht. Nach der herrschenden Rechtsauffassung kann eine Werkschöpfung nur durch Menschen erfolgen. Da KI-Systeme keine Menschen sind, kann ihr Output nicht als persönliche geistige Schöpfung gewertet werden. Daraus folgt, dass der Output von KI-Systemen nach dem UrhG nicht als Werk angesehen wird und somit nicht dem deutschen Urheberrecht unterliegt.
Dennoch existieren bestimmte Fälle, in denen Urheberrechte am Output eines KI-Systems bestehen können. Weitere Einzelheiten dazu werden in der Antwort zum folgenden Aspekt 3 erläutert.
3. Aspekt: Urheberrechtlich geschütztes Material in der Ausgabe von KI-Systemen
Allgemeiner Rahmen:
Die Nutzung urheberrechtlichen Materials durch KI-Systeme ist unproblematisch, solange die erzeugten Inhalte ausschließlich privat genutzt werden. Rechtliche Probleme entstehen, wenn diese Inhalte kopiert, verbreitet oder öffentlich zugänglich gemacht werden.
KI-Systeme und Urheberrecht:
Ein KI-System kann kein Urheberrecht für die von ihm erzeugten Medien beanspruchen. Es besteht jedoch die Möglichkeit, dass in den Ergebnissen eines KI-Systems Urheberrechte Dritter betroffen sind. Die Funktionsweise von KI-Systemen sorgt dafür, dass sie keine direkten Kopien existierender Werke erzeugen, sondern eigenständige Ergebnisse basierend auf gelernten Mustern liefern.
Drei wesentliche urheberrechtliche Konstellationen:
1. Zufällige Ähnlichkeiten:
- KI-Outputs können zufällig existierenden urheberrechtlich geschützten Werken ähneln. Diese Situation ist ähnlich wie bei menschlichen Autoren, bei denen unbeabsichtigte Reproduktionen möglich sind.
- Rechtlich relevant wird es, wenn beispielsweise elf aufeinanderfolgende Wörter eines bestehenden Textes reproduziert werden, da dies nach der Rechtsprechung des Europäischen Gerichtshofs als urheberrechtliche Vervielfältigung gelten kann. Nutzer sollten darauf achten, solche Ähnlichkeiten zu vermeiden, um keine Rechteverletzung zu begehen.
2. Urheberrechtlich geschützter Input:
- Wenn der Input für das KI-System bereits urheberrechtlich geschützt ist, kann auch der Output unter das Urheberrecht fallen. Typische Beispiele sind das Einfügen und anschließende Bearbeiten von Textpassagen.
- Eine Bearbeitung bedarf der Zustimmung des Urhebers, es sei denn, das Ergebnis distanziert sich deutlich vom Original und gilt als eigenständiges Werk (freie Benutzung).
3. Urheberschaft durch die Nutzenden:
- Nutzer können Urheberrechte am Output eines KI-Systems innehaben, wenn sie den Input selbst erstellt haben und dieser eine eigene Schöpfungshöhe aufweist.
- In diesem Fall wird der Output als technische Weiterverarbeitung des urheberrechtlich geschützten Inputs angesehen, wodurch die Urheberschaft bei den Nutzern liegt.
Diese Übersicht soll helfen, die komplexen rechtlichen Aspekte der Nutzung von KI-Systemen besser zu verstehen und entsprechend zu handeln.
4. Aspekt: Einsatz urheberrechtlich geschützter Werke als Eingabe für KI-Systeme
Die Verwendung eines urheberrechtlich geschützten Werkes oder von Teilen davon als Eingabedaten (Prompt) für ein KI-System gilt nach § 16 UrhG als Vervielfältigung. Wenn Nutzer nicht die entsprechenden Nutzungsrechte an diesem Werk besitzen, stellt dies eine Verletzung des Urheberrechts dar.
Es gibt zwar gesetzliche Ausnahmen, die eine Vervielfältigung von urheberrechtlich geschütztem Material unter bestimmten Umständen erlauben, wie zum Beispiel für Menschen mit Behinderungen oder für Zwecke des Text- und Data-Mining. Diese Ausnahmen finden jedoch häufig keine Anwendung, insbesondere im Hochschulkontext. Deshalb führt die direkte Verwendung eines urheberrechtlich geschützten Werks als Prompt, ohne eine vorherige Erlaubnis zur Vervielfältigung, zu einem Urheberrechtsverstoß.
5. Aspekt: Generierung von Medien im „Stil von XY“ durch KI-Systeme
Bisher existiert keine spezielle Rechtsprechung zur Erzeugung von Werken durch KI, die den Stil bekannter Künstler oder Schriftsteller nachahmen. Aus dem deutschen Urheberrecht geht jedoch hervor, dass ein Stil selbst nicht schutzfähig ist. Daher ist es generell zulässig, mittels eines KI-Systems Werke zu erstellen und zu veröffentlichen, die sich an den Stil existierender Künstler oder Autoren anlehnen. Dies bedeutet, dass Urheber von Originalwerken nach deutschem Recht keine Ansprüche geltend machen können, wenn ein KI-System Werke in ihrem Stil produziert und verbreitet.
Die Nutzung solcher Stilnachahmungen kann auch durch § 51a UrhG abgedeckt sein, der seit 2021 Karikaturen, Parodien und Pastiches im deutschen Urheberrecht regelt. Diese Bestimmung erlaubt die Vervielfältigung zum Zweck der Stil- oder Ideennachahmung, auch wenn das Originalwerk urheberrechtlich oder durch verwandte Schutzrechte gesichert ist. Dabei ist jedoch eine inhaltliche oder künstlerische Auseinandersetzung mit dem Originalwerk notwendig.
Die Abgrenzung zur illegalen Reproduktion urheberrechtlich geschützter Werke kann jedoch schwierig sein. Mittels gezielter Prompts könnte ein KI-System Outputs erstellen, die urheberrechtlich geschützten Werken sehr ähnlich sind. Würde der Output eine exakte Kopie oder lediglich eine marginale Abänderung eines Originals darstellen und genutzt werden, wäre die rechtliche Bewertung entsprechend negativ.