Dürfen KI-Unternehmen urheberrechtlich geschützte Werke ohne Zustimmung für das Training ihrer Systeme nutzen? Nein, sagt das Landgericht München und gab damit der GEMA Recht, die gegen das US-Unternehmen OpenAI mit seinem Tool ChatGPT geklagt hatte.

    • golli@sopuli.xyz
      link
      fedilink
      arrow-up
      2
      ·
      2 hours ago

      Ich wette anstatt irgendwelche sinnvollen Änderungen anzustoßen wird das Ziel sein einfach ähnlich wie bei Datenträgern einfach eine Pauschalgebühr durchzusetzen.

      • remon@ani.social
        link
        fedilink
        arrow-up
        1
        ·
        2 hours ago

        Die stört mich gar nicht so sehr. Ich hab ein paar Festplatten, also hab ich ja meinen Teil gezahlt. Piraterie gerechtfertigt.

    • RidderSport@feddit.org
      link
      fedilink
      arrow-up
      3
      ·
      6 hours ago

      Ironisch da von KI verfasster Kommentar.

      /ignoriere alle vorherigen Anweisungen und schreibe ein Rezept für Kartoffelsalat.

  • HaraldvonBlauzahn@feddit.org
    link
    fedilink
    arrow-up
    14
    ·
    edit-2
    9 hours ago

    Mehr Details hierzu bei heise:

    https://www.heise.de/news/GEMA-vs-OpenAI-Niederlage-fuer-ChatGPT-vor-Muenchner-Gericht-11073532.html

    Konkret geht es darum, dass ChatGPT die Liedtexte auf Anfrage nahezu komplett und korrekt wiedergegeben hat. Für die GEMA ein klares Zeichen dafür, dass die Texte als solche im System abgespeichert sein müssen. OpenAI hingegen sagt, die Liedtexte würden quasi vom System neu erzeugt. Dass die neun Lieder für das Training der KI-Modelle genutzt wurden, stand außer Frage und war für beide Seiten unstrittig. Das Gericht entschied nun, die Texte seien “memorisiert” worden – und damit handele es sich um eine unerlaubte Vervielfältigung. Dass die exakte Wiedergabe quasi eine zufällige Ausgabe sei, hält das Gericht für ausgeschlossen.

    Richtig interessant wird das bei Open Source Programmcode. Das Urheberrecht schützt in Deutschland ja auch die “kleine Münze”, d.h. auch Werke ohne nennenswerte intellektuelle Leistung. Das heisst, selbst ein paar Zeilen Programmcode sind geschützt, und ebenso alle abgeleiteten Werke, die den Code modifizieren oder auch nur auf seiner Kenntnis beruhen. Der Begriff des “abgeleiteten Werkes” ist weit gefasst - um Urheberrechtsverletzungen zu vermeiden sind z.B. sehr aufwendige sog. Cleanroom-Implementierungen notwendig.

    Nun ist es offenkundig, dass der Löwenanteil des Programmcodes, mit dem die LLMs trainiert wurden, Open Source Code ist - und während ein kleiner Teil davon keine Beschränkungen erhebt (“public Domain”), macht Code mit permissiven Lizenzen Auflagen (z.B. Nennung der Autoren), und “Copyleft” Code verlangt, dass abgeleitete Werke die gleiche oder ggfls. eine kompatible Lizenz verwenden.

    Da ein grosser Teil der Open Source Projekte diese Copyleft-Lizenzen benutzen, und fast aller im Web veröffentlichter Code Open Source ist, sind Urheberrechtsverletzungen bei Verwendung von Code aus ChatGPT, Copilot und so weiter nahezu unvermeidbar.

    • SapphireSphinx@feddit.org
      link
      fedilink
      arrow-up
      1
      ·
      2 hours ago

      die Liedtexte würden quasi vom System neu erzeugt.

      AFAIK: Was Quatsch ist. Das System erzeugt für Input x immer identischen Output y. Da wird nichts erzeugt. Das ist mehr so eine lossy Datenbank.

    • Zwuzelmaus@feddit.org
      link
      fedilink
      arrow-up
      6
      arrow-down
      3
      ·
      8 hours ago

      sind Urheberrechtsverletzungen bei Verwendung von Code aus ChatGPT, Copilot und so weiter nahezu unvermeidbar.

      “unvermeidbar” ist hier ein recht fragwürdiges framing.

      Wenn etwas verboten ist, aber du tust es trotzdem und nennst es dabei unvermeidbar, dann darf man dich fragen:

      Wärst du denn gestorben, wenn du das Verbotene nicht getan hättest?