Anthropic, mevcut kıyaslamaların yapay zeka modellerinin performansını ve etkisini değerlendirme yeteneğini sınırladığı mevcut yapay zeka kıyaslama uygulamalarının karşılaştığı sorunları çözmek için yeni bir finansman girişimi sunuyor.
Mevcut kıyaslamalar genellikle ortalama bir kişinin yapay zeka sistemlerini nasıl kullandığını doğru bir şekilde temsil etmekte yetersiz kalıyor. Gerçek dünya kullanımının nüanslarını ve karmaşıklıklarını yakalamakta başarısız oluyorlar, bu da yapay zeka modeli performansına ilişkin önemli içgörüler sunma becerisinin sınırlı olmasına yol açıyor.
Ek olarak, bu kriterlerin birçoğu, modern üretken yapay zekanın ortaya çıkmasından önce geliştirildi ve bu durum, bunların alaka düzeyi ve uygulanabilirliği hakkında soru işaretleri yarattı.
Anthropic'in Finansman Girişimi
Program, yapay zeka modellerindeki gelişmiş yetenekleri etkili bir şekilde ölçebilecek kıyaslamalar oluşturabilen üçüncü taraf kuruluşları belirlemeyi ve finanse etmeyi amaçlıyor.
Anthropic, resmi blogunda şunları yayınladı : "Bu değerlendirmelere yaptığımız yatırım, tüm ekosisteme fayda sağlayan değerli araçlar sağlayarak yapay zeka güvenliği alanının tamamını yükseltmeyi amaçlıyor."
Yapay zeka modellerini etkili bir şekilde ve daha doğru bir şekilde değerlendirebilecek yeni ölçütlere duyulan ihtiyaç acildir; "Yüksek kaliteli, güvenlikle ilgili değerlendirmeler geliştirmek zorlu olmaya devam ediyor ve talep, arzı geride bırakıyor." bloga eklendi.
Yeni Karşılaştırmalar için Odak Alanları
Anthropic'in yeni kriterleri, özellikle yapay zeka güvenliği ve toplumsal sonuçlarla ilgili olarak yapay zeka modellerinin gelişmiş yeteneklerini değerlendirmeye odaklanacak.
Bu kriterler, bir modelin siber saldırılar, silah geliştirme ve derin sahtekarlıklar veya yanlış bilgiler yoluyla bireylerin manipülasyonu veya aldatılması gibi önemli sonuçları olan görevleri yerine getirme yeteneğini değerlendirecek.
Ayrıca Anthropic, ulusal güvenlik ve savunmayla ilgili yapay zeka risklerini belirlemek ve değerlendirmek için bir "erken uyarı sistemi" geliştirmeyi amaçlıyor. Bu sistemle ilgili ayrıntılar blog yazısında açıklanmasa da Anthropic, bu riskleri ele alma konusundaki kararlılığını vurguluyor.
Finansman programı aynı zamanda yapay zekanın çeşitli alanlardaki potansiyelini keşfederek "uçtan uca" görevler için kıyaslama araştırmalarını da destekleyecek.
Bu görevler arasında bilimsel araştırmayı kolaylaştırmak, çok sayıda dilde konuşmak, önyargıları azaltmak ve toksisiteyi filtrelemek yer alıyor.
Anthropic, konu uzmanlarının kendi değerlendirmelerini yapmalarına ve binlerce kullanıcıyı içeren kapsamlı denemeler yürütmelerine olanak tanıyan yeni platformlar geliştirmeyi amaçlıyor.
Şirket, bu girişim için özel bir koordinatör görevlendirdi ve ölçeklenebilirlik potansiyeli olan projeleri satın alma veya genişletme fırsatlarını araştırıyor.
CEO Dario Amodei, yapay zekanın daha geniş etkisini ve olası eşitsizlik sorunlarının üstesinden gelmek için kapsamlı çözümlerin gerekliliğini vurguladı.
Time Magazine ile yaptığı röportajda Amodei, yapay zeka teknolojisindeki ilerlemelerin daha geniş kamuya fayda sağlamasını sağlamak için Evrensel Temel Gelirin ötesinde çözümler bulmanın önemini vurguladı.