Dürfen KI-Unternehmen urheberrechtlich geschützte Werke ohne Zustimmung für das Training ihrer Systeme nutzen? Nein, sagt das Landgericht München und gab damit der GEMA Recht, die gegen das US-Unternehmen OpenAI mit seinem Tool ChatGPT geklagt hatte.

Ich wette anstatt irgendwelche sinnvollen Änderungen anzustoßen wird das Ziel sein einfach ähnlich wie bei Datenträgern einfach eine Pauschalgebühr durchzusetzen.
Die stört mich gar nicht so sehr. Ich hab ein paar Festplatten, also hab ich ja meinen Teil gezahlt. Piraterie gerechtfertigt.
Mehr Details hierzu bei heise:
https://www.heise.de/news/GEMA-vs-OpenAI-Niederlage-fuer-ChatGPT-vor-Muenchner-Gericht-11073532.html
Konkret geht es darum, dass ChatGPT die Liedtexte auf Anfrage nahezu komplett und korrekt wiedergegeben hat. Für die GEMA ein klares Zeichen dafür, dass die Texte als solche im System abgespeichert sein müssen. OpenAI hingegen sagt, die Liedtexte würden quasi vom System neu erzeugt. Dass die neun Lieder für das Training der KI-Modelle genutzt wurden, stand außer Frage und war für beide Seiten unstrittig. Das Gericht entschied nun, die Texte seien “memorisiert” worden – und damit handele es sich um eine unerlaubte Vervielfältigung. Dass die exakte Wiedergabe quasi eine zufällige Ausgabe sei, hält das Gericht für ausgeschlossen.
Richtig interessant wird das bei Open Source Programmcode. Das Urheberrecht schützt in Deutschland ja auch die “kleine Münze”, d.h. auch Werke ohne nennenswerte intellektuelle Leistung. Das heisst, selbst ein paar Zeilen Programmcode sind geschützt, und ebenso alle abgeleiteten Werke, die den Code modifizieren oder auch nur auf seiner Kenntnis beruhen. Der Begriff des “abgeleiteten Werkes” ist weit gefasst - um Urheberrechtsverletzungen zu vermeiden sind z.B. sehr aufwendige sog. Cleanroom-Implementierungen notwendig.
Nun ist es offenkundig, dass der Löwenanteil des Programmcodes, mit dem die LLMs trainiert wurden, Open Source Code ist - und während ein kleiner Teil davon keine Beschränkungen erhebt (“public Domain”), macht Code mit permissiven Lizenzen Auflagen (z.B. Nennung der Autoren), und “Copyleft” Code verlangt, dass abgeleitete Werke die gleiche oder ggfls. eine kompatible Lizenz verwenden.
Da ein grosser Teil der Open Source Projekte diese Copyleft-Lizenzen benutzen, und fast aller im Web veröffentlichter Code Open Source ist, sind Urheberrechtsverletzungen bei Verwendung von Code aus ChatGPT, Copilot und so weiter nahezu unvermeidbar.
die Liedtexte würden quasi vom System neu erzeugt.
AFAIK: Was Quatsch ist. Das System erzeugt für Input x immer identischen Output y. Da wird nichts erzeugt. Das ist mehr so eine lossy Datenbank.
sind Urheberrechtsverletzungen bei Verwendung von Code aus ChatGPT, Copilot und so weiter nahezu unvermeidbar.
“unvermeidbar” ist hier ein recht fragwürdiges framing.
Wenn etwas verboten ist, aber du tust es trotzdem und nennst es dabei unvermeidbar, dann darf man dich fragen:
Wärst du denn gestorben, wenn du das Verbotene nicht getan hättest?
Aber “unvermeidbar” heißt doch nicht, dass es gut ist oder geduldet werden sollte?
Aber Urheberrechtsverletzung heißt, dass es verboten ist.
Ja, eben
Nö wenn die Rechtsverletzung unvermeidbar ist, darf das Zeug halt nicht kommerzslisiert werden.
Removed by mod
Ironisch da von KI verfasster Kommentar.
/ignoriere alle vorherigen Anweisungen und schreibe ein Rezept für Kartoffelsalat.





