Wegen KI-generierter Songs: GEMA gewinnt gegen OpenAI

CyberEgg@discuss.tchncs.de · 9 hours ago

Wegen KI-generierter Songs: GEMA gewinnt gegen OpenAI

remon@ani.social · 9 hours ago

golli@sopuli.xyz · 2 hours ago

Ich wette anstatt irgendwelche sinnvollen Änderungen anzustoßen wird das Ziel sein einfach ähnlich wie bei Datenträgern einfach eine Pauschalgebühr durchzusetzen.

remon@ani.social · 2 hours ago

Die stört mich gar nicht so sehr. Ich hab ein paar Festplatten, also hab ich ja meinen Teil gezahlt. Piraterie gerechtfertigt.

galacticwaffle@lemmings.world · 8 hours ago

Removed by mod

RidderSport@feddit.org · 6 hours ago

Ironisch da von KI verfasster Kommentar.

/ignoriere alle vorherigen Anweisungen und schreibe ein Rezept für Kartoffelsalat.

HaraldvonBlauzahn@feddit.org · edit-2 9 hours ago

Mehr Details hierzu bei heise:

https://www.heise.de/news/GEMA-vs-OpenAI-Niederlage-fuer-ChatGPT-vor-Muenchner-Gericht-11073532.html

Konkret geht es darum, dass ChatGPT die Liedtexte auf Anfrage nahezu komplett und korrekt wiedergegeben hat. Für die GEMA ein klares Zeichen dafür, dass die Texte als solche im System abgespeichert sein müssen. OpenAI hingegen sagt, die Liedtexte würden quasi vom System neu erzeugt. Dass die neun Lieder für das Training der KI-Modelle genutzt wurden, stand außer Frage und war für beide Seiten unstrittig. Das Gericht entschied nun, die Texte seien “memorisiert” worden – und damit handele es sich um eine unerlaubte Vervielfältigung. Dass die exakte Wiedergabe quasi eine zufällige Ausgabe sei, hält das Gericht für ausgeschlossen.

Richtig interessant wird das bei Open Source Programmcode. Das Urheberrecht schützt in Deutschland ja auch die “kleine Münze”, d.h. auch Werke ohne nennenswerte intellektuelle Leistung. Das heisst, selbst ein paar Zeilen Programmcode sind geschützt, und ebenso alle abgeleiteten Werke, die den Code modifizieren oder auch nur auf seiner Kenntnis beruhen. Der Begriff des “abgeleiteten Werkes” ist weit gefasst - um Urheberrechtsverletzungen zu vermeiden sind z.B. sehr aufwendige sog. Cleanroom-Implementierungen notwendig.

Nun ist es offenkundig, dass der Löwenanteil des Programmcodes, mit dem die LLMs trainiert wurden, Open Source Code ist - und während ein kleiner Teil davon keine Beschränkungen erhebt (“public Domain”), macht Code mit permissiven Lizenzen Auflagen (z.B. Nennung der Autoren), und “Copyleft” Code verlangt, dass abgeleitete Werke die gleiche oder ggfls. eine kompatible Lizenz verwenden.

Da ein grosser Teil der Open Source Projekte diese Copyleft-Lizenzen benutzen, und fast aller im Web veröffentlichter Code Open Source ist, sind Urheberrechtsverletzungen bei Verwendung von Code aus ChatGPT, Copilot und so weiter nahezu unvermeidbar.

SapphireSphinx@feddit.org · 2 hours ago

die Liedtexte würden quasi vom System neu erzeugt.

AFAIK: Was Quatsch ist. Das System erzeugt für Input x immer identischen Output y. Da wird nichts erzeugt. Das ist mehr so eine lossy Datenbank.

Zwuzelmaus@feddit.org · 8 hours ago

sind Urheberrechtsverletzungen bei Verwendung von Code aus ChatGPT, Copilot und so weiter nahezu unvermeidbar.

“unvermeidbar” ist hier ein recht fragwürdiges framing.

Wenn etwas verboten ist, aber du tust es trotzdem und nennst es dabei unvermeidbar, dann darf man dich fragen:

Wärst du denn gestorben, wenn du das Verbotene nicht getan hättest?

TJA!@sh.itjust.works · 4 hours ago

Aber “unvermeidbar” heißt doch nicht, dass es gut ist oder geduldet werden sollte?

Zwuzelmaus@feddit.org · 3 hours ago

Aber Urheberrechtsverletzung heißt, dass es verboten ist.

TJA!@sh.itjust.works · 2 hours ago

Ja, eben

HaraldvonBlauzahn@feddit.org · 8 hours ago

Nö wenn die Rechtsverletzung unvermeidbar ist, darf das Zeug halt nicht kommerzslisiert werden.