HIX AI
ทรุด
เรียบง่าย
บ้าน > ค้นพบ > มานุษยวิทยาท้าทายแนวทางปฏิบัติในการเปรียบเทียบ AI ในปัจจุบันด้วยความคิดริเริ่มด้านเงินทุนใหม่

มานุษยวิทยาท้าทายแนวทางปฏิบัติในการเปรียบเทียบ AI ในปัจจุบันด้วยความคิดริเริ่มด้านเงินทุนใหม่

เขียนโดย
ArticleGPT

ตรวจสอบและตรวจสอบข้อเท็จจริงโดย ทีมงาน HIX.AI

อ่าน 2 นาทีJul 02, 2024
มานุษยวิทยาท้าทายแนวทางปฏิบัติในการเปรียบเทียบ AI ในปัจจุบันด้วยความคิดริเริ่มด้านเงินทุนใหม่

โดยสังเขป

โปรแกรมใหม่ของ Anthropic ซึ่งเปิดตัวเมื่อวันจันทร์ จะกระจายเงินทุนให้กับองค์กรภายนอกที่สามารถพัฒนาเกณฑ์มาตรฐานเพื่อประเมินประสิทธิภาพและผลกระทบของโมเดล AI ได้อย่างมีประสิทธิภาพ

Anthropic กำลังเปิดตัวโครงการริเริ่มด้านเงินทุนใหม่เพื่อจัดการกับปัญหาที่ต้องเผชิญกับแนวทางปฏิบัติในการเปรียบเทียบ AI ในปัจจุบัน โดยที่เกณฑ์มาตรฐานที่มีอยู่จำกัดความสามารถในการประเมินประสิทธิภาพและอิทธิพลของโมเดล AI

เกณฑ์มาตรฐานที่มีอยู่มักจะขาดความแม่นยำในการแสดงวิธีที่คนทั่วไปใช้ระบบ AI พวกเขาล้มเหลวในการจับความแตกต่างและความซับซ้อนของการใช้งานจริง นำไปสู่ความสามารถที่จำกัดในการเสนอข้อมูลเชิงลึกที่สำคัญเกี่ยวกับประสิทธิภาพของโมเดล AI

นอกจากนี้ เกณฑ์มาตรฐานจำนวนมากเหล่านี้ยังได้รับการพัฒนาก่อนการกำเนิดของ AI เจนเนอเรชั่นสมัยใหม่ ทำให้เกิดคำถามเกี่ยวกับความเกี่ยวข้องและการบังคับใช้

ความคิดริเริ่มการระดมทุนของมานุษยวิทยา

โปรแกรมนี้มีเป้าหมายเพื่อระบุและให้ทุนแก่องค์กรบุคคลที่สามที่สามารถสร้างเกณฑ์มาตรฐานที่สามารถวัดความสามารถขั้นสูงในโมเดล AI ได้อย่างมีประสิทธิภาพ

“การลงทุนของเราในการประเมินเหล่านี้มีจุดมุ่งหมายเพื่อยกระดับความปลอดภัยของ AI ทั้งด้าน โดยมอบเครื่องมืออันมีค่าที่เป็นประโยชน์ต่อระบบนิเวศทั้งหมด” Anthropic เผยแพร่ในบล็อกอย่างเป็นทางการ

ความจำเป็นสำหรับการวัดประสิทธิภาพใหม่ที่สามารถประเมินโมเดล AI ได้อย่างแม่นยำยิ่งขึ้นนั้นเป็นเรื่องเร่งด่วน “การพัฒนาการประเมินคุณภาพสูงที่เกี่ยวข้องกับความปลอดภัยยังคงเป็นความท้าทาย และความต้องการก็แซงหน้าอุปทาน” เพิ่มในบล็อก

พื้นที่มุ่งเน้นสำหรับเกณฑ์มาตรฐานใหม่

เกณฑ์มาตรฐานใหม่ของ Anthropic จะมุ่งเน้นไปที่การประเมินความสามารถขั้นสูงของโมเดล AI โดยเฉพาะอย่างยิ่งในส่วนที่เกี่ยวข้องกับความปลอดภัยของ AI และผลกระทบทางสังคม

เกณฑ์มาตรฐานเหล่านี้จะประเมินความสามารถของโมเดลในการทำงานที่มีผลกระทบอย่างมีนัยสำคัญ เช่น การโจมตีทางไซเบอร์ การปรับปรุงอาวุธ และการบงการหรือการหลอกลวงบุคคลผ่านการปลอมแปลงข้อมูลหรือข้อมูลที่ผิด

นอกจากนี้ Anthropic ยังมีเป้าหมายที่จะพัฒนา "ระบบเตือนภัยล่วงหน้า" เพื่อระบุและประเมินความเสี่ยงด้าน AI ที่เกี่ยวข้องกับความมั่นคงและการป้องกันประเทศ แม้ว่ารายละเอียดเกี่ยวกับระบบนี้จะไม่ได้รับการเปิดเผยในบล็อกโพสต์ แต่ Anthropic เน้นย้ำถึงความมุ่งมั่นในการจัดการกับความเสี่ยงเหล่านี้

โครงการให้ทุนสนับสนุนจะสนับสนุนการวิจัยเกี่ยวกับเกณฑ์มาตรฐานสำหรับงาน "จากต้นทางถึงปลายทาง" โดยสำรวจศักยภาพของ AI ในขอบเขตต่างๆ

งานเหล่านี้รวมถึงการอำนวยความสะดวกในการวิจัยทางวิทยาศาสตร์ การพูดในหลายภาษา การลดอคติ และการกรองความเป็นพิษ

Anthropic มุ่งมั่นที่จะพัฒนาแพลตฟอร์มใหม่ที่ช่วยให้ผู้เชี่ยวชาญเฉพาะด้านสามารถสร้างการประเมินของตนเอง และดำเนินการทดลองอย่างกว้างขวางที่เกี่ยวข้องกับผู้ใช้หลายพันคน

บริษัทได้จ้างผู้ประสานงานเฉพาะสำหรับโครงการริเริ่มนี้ และกำลังสำรวจโอกาสในการได้รับหรือขยายโครงการที่มีศักยภาพในการขยายขนาด

CEO Dario Amodei เน้นย้ำถึงผลกระทบในวงกว้างของ AI และความจำเป็นในการแก้ปัญหาอย่างละเอียดเพื่อจัดการกับปัญหาความไม่เท่าเทียมกันที่อาจเกิดขึ้น

ในการให้สัมภาษณ์กับนิตยสาร Time Amodei เน้นย้ำถึงความสำคัญของการค้นหาโซลูชันที่นอกเหนือไปจาก Universal Basic Income เพื่อให้แน่ใจว่าความก้าวหน้าในเทคโนโลยี AI จะเป็นประโยชน์ต่อสาธารณชนในวงกว้าง

อิงตามแหล่งค้นหา 2

2 แหล่งที่มา

Anthropic looks to fund a new, more comprehensive generation of AI benchmarks

Anthropic is launching a program to fund the development of new types of benchmarks capable of evaluating the performance and impact of AI models, including generative models like its own Claude.

Google's Alphabet And Amazon-Backed Anthropic Lead Effort To Redefine AI Evaluation Standards

Anthropic’s new program, revealed on Monday, will allocate funds to third-party organizations capable of creating benchmarks that can effectively evaluate the performance and impact of AI models

บนหน้านี้

  • ความคิดริเริ่มการระดมทุนของมานุษยวิทยา