HIX AI
Zusammenbruch
Einfach
Heim > Entdecken > Apple, Anthropic und andere Tech-Giganten nutzten heimlich YouTube Videos, um KI zu trainieren

Apple, Anthropic und andere Tech-Giganten nutzten heimlich YouTube Videos, um KI zu trainieren

Geschrieben von
ArticleGPT

Überprüft und auf Fakten geprüft vom HIX.AI-Team

2 Minuten LesezeitJul 18, 2024
Apple, Anthropic und andere Tech-Giganten nutzten heimlich YouTube Videos, um KI zu trainieren

Kurzgesagt

Technologiegiganten wie Apple und Anthropic haben angeblich Untertitel von YouTube Videos verwendet, um KI zu trainieren, was Bedenken hinsichtlich der Datenrechte und der fairen Verwendung aufkommen lässt.

Kürzlich wurde bekannt, dass Apple, Anthropic, Nvidia und Salesforce unter anderem YouTube Untertitel nutzten, um ihre KI-Systeme zu trainieren. Dieser Datensatz besteht aus Untertiteln, die aus über 170.000 YouTube Videos extrahiert wurden, die zu mehr als 48.000 Kanälen gehören .

„Apple hat Daten für seine KI von mehreren Unternehmen bezogen“, so Content Creator Marques Brownleeone. In seinem X-Post enthüllte er, dass Apple riesige Datenmengen, darunter auch Transkripte, aus YouTube Videos gescrapt hat.

Der YouTube Untertitel-Datensatz ist Teil einer größeren Sammlung namens The Pile, die von der gemeinnützigen Organisation EleutherAI entwickelt wurde. Diese Sammlung soll auch außerhalb großer Technologieunternehmen einen wertvollen Datensatz für die KI-Entwicklung bereitstellen.

Neben den YouTube Transkripten enthält The Pile Datensätze aus verschiedenen Quellen, darunter Bücher, Wikipedia-Artikel, Reden des Europäischen Parlaments und sogar E-Mails von Enron. The Pile wird immer beliebter, da Apple es zum Trainieren seines OpenELM-KI-Modells verwendet hat und das KI-Modell von Salesforce mehr als 86.000 Mal heruntergeladen wurde.

Ethische und rechtliche Auswirkungen

Verstoß gegen die Nutzungsbedingungen von YouTube

Die Verwendung von YouTube Inhalten, insbesondere in Form von kopierten Untertiteln, zum Trainieren von KI-Modellen wirft Fragen zu möglichen Verstößen gegen die Nutzungsbedingungen von YouTube auf.

YouTube -CEO Neal Mohan hatte zuvor erklärt, dass die Verwendung von Videoinhalten, einschließlich Transkripten, zum Trainieren von KI gegen die Bedingungen der Plattform verstoßen würde. OpenAI hat nicht bekannt gegeben, ob es Sora auf der Grundlage von YouTube Inhalten trainiert.

Fehlende Zustimmung der Inhaltsersteller

Eine der größten Sorgen im Zusammenhang mit der Verwendung von YouTube Videos für das KI-Training ist die fehlende Zustimmung der Urheber. Viele Inhaltsersteller drückten ihre Frustration über die unbefugte Verwendung ihrer Arbeit aus, insbesondere wenn es sich um gelöschte Videos oder solche von Erstellern handelt, die ihre Online-Präsenz inzwischen gelöscht haben.

Kreative wie David Pakman von „The David Pakman Show“ und Julia Walsh, CEO von Complexly, äußerten ihren Frust und betonten, wie viel Aufwand und Ressourcen sie in die Produktion von Inhalten investieren.

Reaktionen der Unternehmen auf die Vorwürfe

Als Reaktion auf die Vorwürfe erklärte Sprecherin Jennifer Martinez von Anthropic, dass ihre Nutzung des The Pile-Datensatzes lediglich „eine sehr kleine Teilmenge“ der YouTube Untertitel umfasse und nicht gegen die Servicebedingungen von YouTube verstoße.

Basierend auf 3 Suchquellen

3 Quellen

Apple, Anthropic, and other companies used YouTube videos to train AI

YouTube has said using creators’ content to train AI systems would violate its terms of service — so what happens if they did?

Investigation finds companies are training AI models with YouTube content without permission

YouTube video transcripts funneled into model training data without alerting content creators

YouTube creators surprised to find Apple and others trained AI on their videos

Once again, EleutherAI's data frustrates professional content creators.

Auf dieser Seite

  • Ethische und rechtliche Auswirkungen
  • Reaktionen der Unternehmen auf die Vorwürfe