HIX AI
Runtuh
Sederhana
Rumah > Menemukan > Apple, Anthropic, dan Raksasa Teknologi Lainnya Diam-diam Menggunakan Video YouTube untuk Melatih AI

Apple, Anthropic, dan Raksasa Teknologi Lainnya Diam-diam Menggunakan Video YouTube untuk Melatih AI

Ditulis oleh
ArticleGPT

Ditinjau dan diperiksa faktanya oleh Tim HIX.AI

2 menit membacaJul 18, 2024
Apple, Anthropic, dan Raksasa Teknologi Lainnya Diam-diam Menggunakan Video YouTube untuk Melatih AI

Pendeknya

Raksasa teknologi seperti Apple dan Anthropic diduga menggunakan teks video YouTube untuk melatih AI, sehingga menimbulkan kekhawatiran tentang hak data dan penggunaan wajar.

Baru-baru ini terungkap bahwa Apple, Anthropic, Nvidia, dan Salesforce antara lain memanfaatkan subtitle YouTube untuk melatih sistem AI mereka. Kumpulan data ini terdiri dari subtitel yang diambil dari lebih dari 170.000 video YouTube , milik lebih dari 48.000 saluran .

“Apple mengambil data untuk AI mereka dari beberapa perusahaan”, menurut pembuat konten Marques Brownleeone. Dia mengungkapkan dalam postingan X-nya bahwa Apple mengambil sejumlah besar data, termasuk transkrip, dari video YouTube .

Kumpulan data Subtitel YouTube adalah bagian dari koleksi lebih besar yang disebut The Pile, yang dikembangkan oleh organisasi nirlaba EleutherAI. Koleksi ini bertujuan untuk menyediakan kumpulan data berharga untuk pengembangan AI bagi pihak-pihak di luar perusahaan teknologi besar.

Selain transkrip YouTube , The Pile mencakup kumpulan data dari berbagai sumber, termasuk buku, artikel Wikipedia, pidato dari Parlemen Eropa, dan bahkan email dari Enron. Pile semakin populer karena Apple menggunakannya untuk melatih model AI OpenELM-nya, dan model AI Salesforce telah diunduh lebih dari 86.000 kali.

Implikasi Etis dan Hukum

Pelanggaran terhadap persyaratan layanan YouTube

Penggunaan konten YouTube , khususnya dalam bentuk teks tergores, untuk melatih model AI menimbulkan pertanyaan tentang potensi pelanggaran terhadap persyaratan layanan YouTube .

CEO YouTube Neal Mohan sebelumnya menyatakan bahwa penggunaan konten video, termasuk transkrip, untuk melatih AI akan melanggar ketentuan platform. OpenAI belum mengungkapkan apakah mereka melatih Sora berdasarkan konten YouTube .

Kurangnya persetujuan dari pembuat konten

Salah satu kekhawatiran utama seputar penggunaan video YouTube untuk pelatihan AI adalah kurangnya persetujuan dari pembuatnya. Banyak pembuat konten mengungkapkan rasa frustrasi mereka atas penggunaan karya mereka secara tidak sah, terutama terkait dengan video yang dihapus atau video milik pembuat konten yang telah menghapus kehadiran online mereka.

Pembuat konten seperti David Pakman dari "The David Pakman Show" dan Julia Walsh, CEO Complexly, menyuarakan rasa frustrasi mereka, menekankan upaya dan sumber daya yang mereka investasikan dalam memproduksi konten.

Tanggapan perusahaan terhadap tuduhan tersebut

Menanggapi tuduhan tersebut, Juru Bicara Anthropic Jennifer Martinez menyatakan bahwa pemanfaatan kumpulan data The Pile hanya mencakup “sebagian kecil” subtitle YouTube , dan tidak melanggar persyaratan layanan YouTube .

Berdasarkan 3 sumber pencarian

3 sumber

Apple, Anthropic, and other companies used YouTube videos to train AI

YouTube has said using creators’ content to train AI systems would violate its terms of service — so what happens if they did?

Investigation finds companies are training AI models with YouTube content without permission

YouTube video transcripts funneled into model training data without alerting content creators

YouTube creators surprised to find Apple and others trained AI on their videos

Once again, EleutherAI's data frustrates professional content creators.

Di halaman ini

  • Implikasi Etis dan Hukum
  • Tanggapan perusahaan terhadap tuduhan tersebut