HIX AI
ทรุด
เรียบง่าย
บ้าน > ค้นพบ > Apple, Anthropic และยักษ์ใหญ่ด้านเทคโนโลยีอื่นๆ แอบใช้วิดีโอ YouTube เพื่อฝึก AI

Apple, Anthropic และยักษ์ใหญ่ด้านเทคโนโลยีอื่นๆ แอบใช้วิดีโอ YouTube เพื่อฝึก AI

เขียนโดย
ArticleGPT

ตรวจสอบและตรวจสอบข้อเท็จจริงโดย ทีมงาน HIX.AI

อ่าน 2 นาทีJul 18, 2024
Apple, Anthropic และยักษ์ใหญ่ด้านเทคโนโลยีอื่นๆ แอบใช้วิดีโอ YouTube เพื่อฝึก AI

โดยสังเขป

บริษัทยักษ์ใหญ่ด้านเทคโนโลยี เช่น Apple และ Anthropic ถูกกล่าวหาว่าใช้คำบรรยายวิดีโอ YouTube เพื่อฝึก AI ทำให้เกิดความกังวลเกี่ยวกับสิทธิ์ในข้อมูลและการใช้งานโดยชอบธรรม

ล่าสุดมีการเปิดเผยว่า Apple, Anthropic, Nvidia และ Salesforce และอื่นๆ ใช้คำบรรยาย YouTube เพื่อฝึกระบบ AI ของพวกเขา ชุดข้อมูลนี้ประกอบด้วยคำบรรยายที่แยกมาจาก วิดีโอ YouTube มากกว่า 170,000 รายการจากช่องมากกว่า 48,000 ช่อง

“Apple ได้รวบรวมข้อมูลสำหรับ AI จากหลายบริษัท” ตามที่ผู้สร้างเนื้อหา Marques Brownleeone กล่าว เขาเปิดเผยในโพสต์ X ของเขาว่า Apple คัดลอกข้อมูลจำนวนมหาศาล รวมถึงการถอดเสียงจากวิดีโอ YouTube

ชุดข้อมูลคำบรรยาย YouTube เป็นส่วนหนึ่งของคอลเลกชันขนาดใหญ่ที่เรียกว่า The Pile ซึ่งพัฒนาโดยองค์กรไม่แสวงหาผลกำไร EleutherAI คอลเลกชันนี้มีจุดมุ่งหมายเพื่อมอบชุดข้อมูลอันมีค่าสำหรับการพัฒนา AI ให้กับบริษัทเทคโนโลยีขนาดใหญ่ภายนอก

นอกเหนือจากการถอดเสียง YouTube แล้ว The Pile ยังรวมชุดข้อมูลจากแหล่งต่างๆ รวมถึงหนังสือ บทความ Wikipedia สุนทรพจน์จากรัฐสภายุโรป และแม้แต่อีเมลจาก Enron The Pile กำลังได้รับความนิยม เนื่องจาก Apple ใช้เพื่อฝึกโมเดล OpenELM AI และมีการดาวน์โหลดโมเดล AI ของ Salesforce มากกว่า 86,000 ครั้ง

ผลกระทบทางจริยธรรมและกฎหมาย

การละเมิดข้อกำหนดในการให้บริการของ YouTube

การใช้เนื้อหา YouTube โดยเฉพาะในรูปแบบคำบรรยายที่คัดลอกมา เพื่อฝึกอบรมโมเดล AI ทำให้เกิดคำถามเกี่ยวกับการละเมิดข้อกำหนดในการให้บริการของ YouTube ที่อาจเกิดขึ้น

Neal Mohan CEO ของ YouTube ระบุไว้ก่อนหน้านี้ว่าการใช้เนื้อหาวิดีโอรวมถึงการถอดเสียงเพื่อฝึก AI จะขัดต่อข้อกำหนดของแพลตฟอร์ม OpenAI ไม่ได้เปิดเผยว่ากำลังฝึก Sora ตามเนื้อหา YouTube หรือไม่

ขาดความยินยอมจากผู้สร้างเนื้อหา

ข้อกังวลหลักประการหนึ่งเกี่ยวกับการใช้วิดีโอ YouTube สำหรับการฝึกอบรม AI คือการขาดความยินยอมจากผู้สร้าง ผู้สร้างเนื้อหาจำนวนมากแสดงความคับข้องใจกับการนำผลงานของตนไปใช้งานโดยไม่ได้รับอนุญาต โดยเฉพาะอย่างยิ่งเมื่อพูดถึงวิดีโอที่ถูกลบหรือจากผู้สร้างที่ได้ลบการแสดงตนทางออนไลน์ออกไปแล้ว

ผู้สร้างเช่น David Pakman จาก "The David Pakman Show" และ Julia Walsh ซีอีโอของ Complexly กล่าวถึงความคับข้องใจโดยเน้นความพยายามและทรัพยากรที่พวกเขาลงทุนในการผลิตเนื้อหา

การตอบสนองของบริษัทต่อข้อกล่าวหา

เพื่อตอบสนองต่อข้อกล่าวหา โฆษก Jennifer Martinez จาก Anthropic ระบุว่าการใช้ชุดข้อมูล The Pile ของพวกเขามีเพียง "ชุดย่อยที่น้อยมาก" ของคำบรรยาย YouTube เท่านั้น และไม่ละเมิดข้อกำหนดในการให้บริการของ YouTube

อิงตามแหล่งค้นหา 3

3 แหล่งที่มา

Apple, Anthropic, and other companies used YouTube videos to train AI

YouTube has said using creators’ content to train AI systems would violate its terms of service — so what happens if they did?

Investigation finds companies are training AI models with YouTube content without permission

YouTube video transcripts funneled into model training data without alerting content creators

YouTube creators surprised to find Apple and others trained AI on their videos

Once again, EleutherAI's data frustrates professional content creators.

บนหน้านี้

  • ผลกระทบทางจริยธรรมและกฎหมาย
  • การตอบสนองของบริษัทต่อข้อกล่าวหา