Hi, wenn du dieses Briefing in voller Länge lesen möchtest, kannst du hier Mitglied werden. Falls du noch nicht überzeugt bist, hier einige Argumente, die für eine Mitgliedschaft bei uns sprechen 😄

  • Unsere Arbeit wurde für den Grimme-Online-Award nominiert und mit dem Netzwende-Award für innovativen Journalismus ausgezeichnet.
  • Mehr als 8000 Menschen aus Medien, Wirtschaft, Politik und Wissenschaft lesen unsere Briefings jede Woche.
  • Mitglieder erhalten zwei Briefings pro Woche, können unserem Slack-Team beitreten und sich dort mit Hunderten Social-Media-Profis vernetzen.

Es wäre uns eine Ehre, wenn wir dich bei uns als zahlendes Mitglied begrüßen dürfen! Nur so können wir unsere Arbeit nachhaltig anbieten. Danke, Martin & Simon

Jetzt Mitglied werden

Was ist

Zwei Urteile in zwei Tagen: US-Gerichte in Kalifornien haben am Dienstag und Mittwoch Copyright-Klagen gegen Anthropic und Meta abgewiesen. Geklagt hatten jeweils Autorïnnen, die den Unternehmen vorwarfen, Bücher ohne Einverständnis zum Training von Sprachmodellen verwendet und dabei gegen das Urheberrecht verstoßen zu haben.

Die Richter sehen das anders und stellen in beiden Fällen keine Urheberrechtsverletzung fest. Sie begründen das allerdings auf ganz unterschiedliche Weise. Zudem kommen beide Freisprüche mit jeweils einer großen Einschränkung daher, die KI-Konzernen in Zukunft noch größeren Ärger bereiten könnte.

Warum das wichtig ist

Generative KI basiert auf der Kreativität der Menschheit. OpenAI, Google, Anthropic und Meta füttern ihre Modelle mit allen Texten, Fotos und Videos, die sie in die Finger bekommen können.

Teils handelt es sich um frei verfügbare Inhalte. In einigen Fällen schließen die Konzerne Lizenzverträge ab und erwerben die Rechte – aber längst nicht immer. Alle großen Sprachmodelle aus dem Silicon Valley wurden mit großen Mengen urheberrechtlich geschütztem Material trainiert, oft gegen den Willen der Schöpferinnen und Verwerter.

Ein paar Zahlen:

  • Der Atlantic soll einzelne Reporterïnnen mit Gehältern von 200.000 bis 300.000 Dollar pro Jahr abgeworben haben. Das wurde in der Branche mit Erstaunen aufgenommen und als wenig nachhaltig beurteilt – so viel kann doch kein Medienunternehmen auf Dauer zahlen. Viele Journalisten verdienen ein Zehntel dieser Summen.
  • Die Gehälter für KI-Entwicklerinnen sind oft siebenstellig. Meta soll Mitarbeitenden von OpenAI Einstiegsboni von bis zu 100 Millionen Dollar angeboten haben. Trotzdem haben die meisten abgelehnt, Geld spielt für die meisten ohnehin kaum noch eine Rolle.
  • Die beiden Start-ups der ehemaligen OpenAI-Angestellten Ilya Sutskever und Mira Murati werden mit 32 und zehn Milliarden Dollar bewertet – ohne dass sie bislang ein konkretes Produkt oder auch nur einen Plan für die künftige Entwicklung veröffentlicht haben.
  • Damit sind sie beide bereits jetzt mehr wert als die New York Times, die mit Abstand größte und erfolgreichste Zeitung der Welt. Der Verlag hat wie kaum ein anderes Medium den digitalen Wandel vorangetrieben und Millionen Menschen zu Abonnenten gemacht. Trotzdem wetten Investoren lieber auf KI-Start-ups, die bislang bloß ein vages Versprechen anbieten können.

Das Geschäftsmodell vieler Medien wackelte schon lange, bevor irgendjemand wusste, wofür LLM steht. Kreative Berufe waren bis auf wenige Ausnahmen noch nie besonders gut bezahlt. Das hat wenig bis gar nichts mit KI zu tun.

Trotzdem besteht ein Ungleichgewicht. Auf der einen Seite stehen Schriftsteller, Künstlerinnen, Musiker und Journalistinnen, die nur mit Mühe von ihrer Arbeit leben können. Auf der anderen Seite verdienen KI-Konzerne Milliarden und tragen mit ihren Produkten teils entscheidend dazu bei, dass kreative Arbeit weiter an Wert verliert.

Ist das fair? Das hängt davon ab, wen man fragt. Am Ende spielt das aber keine Rolle, von Moral kann man sich nichts kaufen. Die entscheidende Frage lautet: Ist das legal?

Bislang gibt es darauf keine eindeutige Antwort. In den USA laufen Dutzende Prozesse, die klären sollen, ob das Training und der Output von Sprachmodellen das Urheberrecht verletzt (Wired). Verhandelt werden Klagen von Autoren und Musikerinnen, aber auch von Verlagen, Verwertungsgesellschaften und Labels.

Anthropic: Fair use, aber …

  • Der zuständige Richter William Alsup hat entschieden (Document Cloud), dass Anthropic sein LLM Claude mit Millionen Büchern trainieren durfte, ohne die Urheberïnnen um Erlaubnis zu fragen. Geklagt hatten drei Autorinnen und Autoren, deren Werke Anthropic verwendet hatte.
  • Das Urteil ist aber kein uneingeschränkter Erfolg für das Unternehmen. Alsup stellte gleichzeitig fest, dass Anthropic bei der Beschaffung der Bücher teils gegen Urheberrechte verstoßen hat.
  • Anfang 2021 lud Ben Mann, einer der Mitgründer von Anthropic, 196.440 illegal kopierte Bücher aus dem Netz herunter. Kurz darauf erweiterte er die Schattenbibliothek um mindestens fünf Millionen weitere Bücher aus der Piraterie-Datenbank LibGen, für die er ebenfalls keinen Cent zahlte.
  • Dieses Vorgehen war rechtswidrig, urteilte Alsup. Jetzt wird in einem neuen Verfahren verhandelt, wie viel Entschädigung Anthropic den Autorinnen und Verlagen zahlen muss. Je nachdem, welchen Experten man fragt, stehen drei- bis sechsstellige Summen im Raum – pro Buch. Das könnte teuer werden.
  • Als legal stufte Alsup die bemerkenswerte Buchbeschaffungspraxis von Tom Turvey ein. Der frühere Google-Manager kam 2024 zu Anthropic und erhielt eine ungewöhnliche Aufgabe: Besorge alle Bücher der Welt und vermeide dabei so viel "juristischen, praktischen und geschäftlichen Aufwand" wie möglich.
  • Turvey und sein Team kauften Millionen gedruckte Bücher, viele davon gebraucht, lösten die Seiten aus dem Einband, scannten alles ein und vernichteten die Originale. Die digitale Bibliothek aus PDF-Dokumenten diente als Grundlage für das LLM-Training.
  • Mit seiner Entscheidung erklärte Alsup das Vorgehen zum sogenannten Fair Use. Das US-Urheberrecht erlaubt es, geschützte Werke unter Umständen auch ohne Erlaubnis des Rechteinhabers zu verwenden.
  • Dabei werden vier unterschiedliche Faktoren geprüft: die Art der Nutzung, die Art der Werke, der Umfang der Kopien sowie die Auswirkungen auf den Markt.
  • Im Fall von Anthropic handle es sich eindeutig um transformative Nutzung, die aus dem Ausgangsmaterial ein neues Werk mit anderem Zweck macht. Das gab den Ausschlag für das Urteil.
  • "Autoren können niemanden davon ausschließen, ihre Werke zum Training oder Lernen zu nutzen", schreibt Alsup in der Begründung und vergleicht Sprachmodelle mit Schülerïnnen, die mithilfe von Büchern lesen lernen. "Wie jeder Leser, der ein Schriftsteller werden möchte, replizieren die Sprachmodelle von Anthropic das Ausgangsmaterial nicht – sondern erzeugen etwas Anderes."

Meta: Fair use, aber …

  • Rund 24 Stunden nach Alsups Entscheidung fällte der zweite Richter sein Urteil in einem ähnlichen Verfahren. Dieses Mal hatten 13 Autorïnnen Meta verklagt, darunter prominente Namen wie Sarah Silverman, Ta-Nehisi Coates und Junot Díaz.
  • Sie warfen Meta vor, für das Training der Llama-Modelle auf Dokumente von LibGen zugegriffen zu haben – jener Schattenbibliothek, die auch Anthropic und vermutlich viele weitere KI-Unternehmen nutzten.
  • Der zuständige Richter Vince Chhabria gab Meta recht und wies die Klage ab. Das Urteil ist aber mindestens genauso ambivalent wie die Entscheidung im Fall Anthropic.

Dieser Artikel ist nur für zahlende Mitglieder

Jetzt Mitglied werden und vollen Zugriff auf alle Artikel erhalten.

Jetzt Mitglied werden Hast du schon einen Account? Einloggen