FachartikelLegal KI & ChatGPT

Generative KI und das Urheberrecht – eine schwierige Beziehung

Spätestens durch die Etablierung massentauglicher generativer KI-Anwendungen wie ChatGPT im Herbst 2022 treten die Herausforderungen von generativer KI für das Urheberrecht besonders deutlich hervor und erhalten durch die Fähigkeit zur Erstellung kreativ anmutender Gestaltungen von hoher Qualität eine erhebliche Brisanz. Denn während die autonome Generierung werkähnlicher Gebilde bislang noch wenigen Personengruppen vorbehalten war, versetzt die Markteinführung generativer KI in Form von Webanwendungen und Apps nunmehr jeden beliebigen Anwender ohne jegliche Vorkenntnisse in die Lage, beliebig viele „Werke“ mithilfe frei gewählter Spracheingaben (sog. Prompts) hervorzubringen. In vielen Fällen weisen die generierten Ergebnisse werkähnlichen Charakter auf, von dem man bislang angenommen hatte, er sei allein Kreativschaffenden und deren Fertigkeiten vorbehalten.

Urheberrecht und KI: es ist kompliziert

Doch welche Folgen ergeben sich hieraus für das Urheberrecht? Bei näherer Betrachtung sind diese vielschichtig, komplex und zudem geeignet, dass herkömmliche Urheberrecht und seine tradierten Grundsätze ins Wanken zu bringen. Dabei darf nicht übersehen werden, dass die Kommerzialisierung generativer KI-Systeme auch dazu dienen soll, die bislang bestehenden Verwertungsmöglichkeiten von Urhebern und Leistungsschutzberechtigten zu substituieren: Während die Wertschöpfung im kreativen Bereich bislang den Rechteinhabern und Verwertern zugewiesen war, führt die Etablierung generativer Massenanwendungen für jedermann zu einer Verlagerung der wirtschaftlichen Erlöse auf die Entwickler und Anbieter der jeweiligen KI Systeme.

Dies hat selbst für Legal Tech-Anwendungen eine gewisse Bedeutung. So können KI Systeme im Rechtsbereich aus urheberrechtlicher Sicht zwar ohne weiteres mit Gesetzestexten oder Urteilen trainiert werden, weil derartige Sprachwerke unabhängig von ihrem gestalterischen Niveau als gemeinfrei gelten. Beim Training mithilfe geschützter wissenschaftlicher Texte wird jedoch die Frage aufgeworfen, ob dies in urheberrechtskonformer Weise möglich ist.

Die Nutzung von Werken durch eine generative KI

Generative KI-Anwendungen vermögen grundsätzlich nur dann qualitativ hochwertige Ergebnisse hervorzubringen, wenn sie mit einer Vielzahl vorbestehender Werke trainiert werden. Damit stellt sich die entscheidende Frage, ob und unter welchen Bedingungen dies überhaupt rechtlich zulässig ist. Zudem ist die Möglichkeit zu bedenken, dass vorbestehende Werke zufällig im Wege der autonomen Generierung kopiert werden können.

Wie verhält es sich also mit dem Training eines generativen KI-Systems und der autonomen Erzeugung werkähnlicher Gebilde aus Sicht des Urheberrechts?

Wenn es nur darum gehen würde, den Informationsgehalt bestehender Werke ausschließlich im Sinne einer Rezeption durch eine KI zu erfassen, würde dies keine urheberrechtlich relevante Nutzungshandlung darstellen. In der Regel können KI-Systeme die zugrunde liegenden Strukturen eines Werks aber nicht in dieser Form erfassen, hierfür wird eine Vervielfältigung benötigt. Sobald zum Zwecke des Trainings einer KI Vervielfältigungsstücke geschützter Werke angefertigt werden müssen, liegen relevante Nutzungshandlungen vor. Diese können nur zulässig sein, wenn sie infolge einschlägiger Schrankenbestimmungen gesetzlich erlaubt sind oder entsprechend lizenziert wurden.

Kann das Training durch Schranken erlaubt sein?

Nachdem die Erstellung von Vervielfältigungen zwecks Training einer KI nicht allein flüchtiger, sondern zumindest vorübergehend Natur sind (vgl. § 16 UrhG), kann die Schranke des § 44a Nr. 2 UrhG keine Anwendung finden. Ohnehin stellt sich die Frage, ob eine flüchtige Vervielfältigung von Werken für das Training einer KI, die hierdurch zur Generierung vergleichbarer Erzeugnisse befähigt werden soll, vom Zweck der Schrankenregelung – der Ermöglichung einer rechtmäßigen Nutzung – überhaupt noch gedeckt wäre.

Da zumindest vorübergehend Vervielfältigungen vorhanden sein müssen, um eine generative KI entsprechend anlernen zu können, wird die für das Text und Data Mining vorgesehene Schranke des § 44b UrhG häufig als recht umfassender Ausweg aus diesem Dilemma vorgeschlagen und diskutiert. Leider liegen die Dinge aber nicht so einfach.

Zum einen enthält die Schranke selbst gewisse Einschränkungen, die sich etwa daraus ergeben, dass die vervielfältigten Werke rechtmäßig zugänglich sein müssen oder ein Nutzungsvorbehalt erklärt werden kann. Auch dürfen Vervielfältigungen nur solange vorhanden sein, wie sie für das Text und Data Mining erforderlich sind, was bereits die dauerhafte Erstellung von Trainingsdatenbanken ausschließt. Weitaus problematischer erscheint jedoch, dass die Vorschrift des § 44b UrhG bei ihrer Einführung nicht für Fälle wie das Training einer generativen KI gedacht war und allein die automatisierte Analyse von digitalen oder digitalisierten Werken zur Gewinnung von Informationen über Muster, Trends und Korrelationen privilegiert werden sollte. Das Training eines generativen KI-Systems geht über diesen privilegierten Zweck aber hinaus, nachdem es hier nicht allein um ein Training zur Analyse oder Mustererkennung z.B. von Bild- und Sprachmaterial geht: Die KI soll vielmehr auf Basis der vervielfältigten Werke dazu die Lage versetzt werden, vergleichbare Erzeugnisse herstellen zu können. Auch unter Beachtung des unionsrechtlich geforderten Drei-Stufen-Tests, wonach die reguläre Verwertung von Werken nicht beeinträchtigt sein darf (vgl. Art. 7 Abs. 2 der DSM-RL i.V.m. Art. 5 Abs. 5 der InfoSoc-RL), erscheint die Berufung auf die Schranke des § 44b UrhG seitens der Entwickler und Anbieter generativer KI daher ausgeschlossen.

Weitere Schrankenregelungen sind nicht anwendbar, da in der Regel schon der jeweils durch die Schranke privilegierte Zweck nicht einschlägig sein wird. So geht es etwa nicht um eine diskursive Auseinandersetzung mit bestehenden Werken im Sinne einer öffentlichen Meinungsbildung (vgl. § 49 oder § 51 UrhG) und mangels Privatheit der Vervielfältigungen kann auch die praktisch bedeutsame Schranke des § 53 UrhG keine Anwendung finden. Man könnte allein noch darüber nachdenken, ob die zum Zwecke des Pastiche neu geschaffene Schranke des § 51a UrhG für das Training einer KI relevant sein kann. Beim Training einer KI fehlt es allerdings an einer inhaltlichen Auseinandersetzung mit dem vorbestehenden Werk, vielmehr sollen allein dessen stilistischen Eigenheiten herausdestilliert und zum Teil des „Werkzeugkastens“ der KI gemacht werden.

Letztendlich erscheint es damit ausgeschlossen, dass sich Entwickler oder Anbieter von generativen KI-Systemen zur Legitimierung des Trainings auf urheberrechtliche Schrankenbestimmungen berufen können. In der Konsequenz ist daher festzuhalten, dass die Unternehmen, die im Geltungsbereich des UrhG eine generative KI unter Rückgriff auf urheberrechtlich geschützte Werke trainieren, dies ohne entsprechende Lizenzierung nicht in rechtskonformer Weise tun können.

Kann das Training mit geschützten Werken lizenziert werden?

Dies führt nun zur weiteren Frage, ob und auf welchem Wege eine solche Lizenzierung gegenwärtig überhaupt zu erreichen ist. Zunächst ist festzustellen, dass das Training einer KI unter Verwendung geschützter Werke angesichts der hiermit verbundenen wirtschaftlichen Bedeutung als eigenständige und neue Nutzungs- und Verwertungshandlung anzusehen ist. Damit stellt sich aber schon das grundlegende Problem, dass die Rechteinhaber im Verhältnis zu den Verwertern dieses Verwertungsrecht jedenfalls in den bisherigen Verträgen nicht eingeräumt haben werden und es in solch einem Fall wegen der Zweckübertragungsregel nach § 31 Abs. 5 UrhG bei dem Urheber verbleibt. Dieselbe Schwierigkeit besteht im Verhältnis der Rechteinhaber zu den jeweiligen Verwertungsgesellschaften, nachdem die Wahrnehmungsverträge ein Recht zur Vervielfältigung zwecks Training einer generativen KI bislang nicht vorsehen. Zudem ist zu beachten, dass die Erstellung von Vervielfältigungen unter Einsatz von Webscrapern im Internet auch Werke privaten Ursprungs erfasst, deren Verwertung nicht beabsichtigt ist, die aber dennoch urheberrechtlich geschützt sind.

Fazit: Training einer generativen KI nur unter Verstoß gegen das UrhG möglich

Im Ergebnis kann das Training eines generativen KI-Systems nach den deutschen urheberrechtlichen Regelungen und den tatsächlichen Gegebenheiten also nicht in rechtskonformer Weise erfolgen. Es fehlt aktuell noch an den notwendigen vertraglichen Regelungen sowie den passenden Instrumenten, mit denen eine umfassende und flächendeckende Lizenzierung des Trainings einer generativen KI möglich ist. Notwendig wäre hierfür zunächst die Anpassung der Berechtigungsverträge zwischen den Rechteinhabern und den Verwertungsgesellschaften. Im nächsten Schritt könnte darüber nachgedacht werden, entsprechende Tarife aufzustellen und kollektive Lizenzen mit erweiterter Wirkung nach §§ 51 ff. VGG zu vergeben.

Ohne ein entsprechendes Tätigwerden der Verwertungsgesellschaften wird ein rechtlich zulässiges Training generativer KI im Geltungsbereich des UrhG nicht möglich sein. Hierbei besteht allerdings die grundlegende Schwierigkeit, dass die betroffenen Rechteinhaber zunächst darin einwilligen müssten, dass die Verwertungsgesellschaften das Training einer generativen KI unter Verwendung der Werke der Rechteinhaber lizenzieren dürfen. Im Ergebnis würde das aber bedeuten, dass die Rechteinhaber in gewissem Umfang einer Substituierung ihrer eigenen Tätigkeit zustimmen. Dies erscheint ausgeschlossen.

Autor: Dr. Daniel Kögel ist Rechtsanwalt der Kanzlei Witzel Erb Backu & Partner in München. Als Fachanwalt für Urheber- und Medienrecht ist er insbesondere im Urheber- und IT-Recht tätig, zudem im gewerblichen Rechtsschutz. Dabei besteht eine besondere Affinität zu Rechtsfragen im Zusammenhang von Künstlicher Intelligenz und Legal Tech.

- WERBUNG -