HIX AI
Instorten
Eenvoudig
Thuis > Ontdekken > Apple, Anthropic en andere techgiganten gebruikten in het geheim YouTube video's om AI te trainen

Apple, Anthropic en andere techgiganten gebruikten in het geheim YouTube video's om AI te trainen

Geschreven door
ArticleGPT

Beoordeeld en op feiten gecontroleerd door het HIX.AI-team

2 minuten lezenJul 18, 2024
Apple, Anthropic en andere techgiganten gebruikten in het geheim YouTube video's om AI te trainen

In een notendop

Technologiegiganten als Apple en Anthropic hebben naar verluidt video-ondertiteling YouTube gebruikt om AI te trainen, waardoor zorgen zijn ontstaan over datarechten en eerlijk gebruik.

Onlangs is onthuld dat onder meer Apple, Anthropic, Nvidia en Salesforce YouTube -ondertitels gebruikten om hun AI-systemen te trainen. Deze dataset bestaat uit ondertitels afkomstig uit ruim 170.000 YouTube video's, behorend tot ruim 48.000 kanalen .

“Apple heeft gegevens voor hun AI bij verschillende bedrijven betrokken”, aldus contentmaker Marques Brownleeone. Hij onthulde in zijn X-post dat Apple enorme hoeveelheden gegevens, inclusief transcripties, van YouTube video's heeft geschraapt.

De YouTube Subtitles-dataset maakt deel uit van een grotere verzameling genaamd The Pile, ontwikkeld door de non-profitorganisatie EleutherAI. Deze verzameling heeft tot doel een waardevolle dataset voor AI-ontwikkeling te bieden aan mensen buiten de grote technologiebedrijven.

Naast de YouTube transcripties omvat The Pile datasets uit verschillende bronnen, waaronder boeken, Wikipedia-artikelen, toespraken van het Europees Parlement en zelfs e-mails van Enron. The Pile wint aan populariteit, omdat Apple het gebruikte om zijn OpenELM AI-model te trainen, en het AI-model van Salesforce is meer dan 86.000 keer gedownload.

Ethische en juridische implicaties

Schending van de servicevoorwaarden van YouTube

Het gebruik van YouTube inhoud, met name in de vorm van geschraapte ondertitels, voor het trainen van AI-modellen roept vragen op over mogelijke schendingen van de servicevoorwaarden van YouTube .

YouTube -CEO Neal Mohan verklaarde eerder dat het gebruik van videocontent, inclusief transcripties, om AI te trainen in strijd zou zijn met de voorwaarden van het platform. OpenAI heeft niet bekendgemaakt of het Sora traint op basis van YouTube inhoud.

Gebrek aan toestemming van makers van inhoud

Een van de grootste zorgen rond het gebruik van YouTube video’s voor AI-training is het gebrek aan toestemming van de makers. Veel makers van inhoud uitten hun frustratie over het ongeoorloofde gebruik van hun werk, vooral als het gaat om verwijderde video's of video's van makers die sindsdien hun online aanwezigheid hebben verwijderd.

Makers als David Pakman van "The David Pakman Show" en Julia Walsh, CEO van Complexly, uitten hun frustraties en benadrukten de moeite en middelen die zij investeren in het produceren van inhoud.

Reacties van bedrijven op de beschuldigingen

In reactie op de beschuldigingen verklaarde woordvoerder Jennifer Martinez van Anthropic dat hun gebruik van de dataset The Pile slechts “een zeer kleine subset” van YouTube ondertitels omvat en niet in strijd is met de servicevoorwaarden van YouTube .

Gebaseerd op 3 zoekbronnen

3 bronnen

Apple, Anthropic, and other companies used YouTube videos to train AI

YouTube has said using creators’ content to train AI systems would violate its terms of service — so what happens if they did?

Investigation finds companies are training AI models with YouTube content without permission

YouTube video transcripts funneled into model training data without alerting content creators

YouTube creators surprised to find Apple and others trained AI on their videos

Once again, EleutherAI's data frustrates professional content creators.

Op deze pagina

  • Ethische en juridische implicaties
  • Reacties van bedrijven op de beschuldigingen