Meta'nın Temel Yapay Zeka Araştırması (FAIR) ekibi yakın zamanda beş yeni yapay zeka (AI) araştırma modeli yayınladı. Bu modeller, görüntüden metne ve metinden müziğe dönüştürmenin yanı sıra gelişmiş kod tamamlama ve yapay zeka tarafından oluşturulan konuşmanın algılanması da dahil olmak üzere geniş kapsamlı uygulamalara sahiptir.
Bukalemun Modeli: Görüntüler ve Metin Üretimi
Piyasaya sürülen dikkate değer modellerden biri, hem görüntü hem de metin oluşturabilen karma modlu modellerden oluşan bir aile olan Chameleon'dur.
Tek modlu sonuçlara odaklanan geleneksel modellerin aksine Chameleon, hem metin hem de görsellerden oluşan girdiyi işleyebilir ve çıktı olarak metin ve görsellerden oluşan bir kombinasyon oluşturabilir. Bu özellik, görüntüler için yaratıcı başlıklar oluşturmak veya tamamen yeni sahneler oluşturmak için metin istemlerini ve görüntüleri kullanmak gibi yeni olasılıkların önünü açıyor.
Çoklu Token Tahmin Modeli
Meta'nın FAIR ekibi, çoklu belirteç tahmini adı verilen yeni bir yaklaşımı tanıtarak kod tamamlama modellerinde de önemli ilerlemeler kaydetti. Önceki tek kelime yaklaşımından farklı olarak bu yeni yöntem, dil modellerini gelecekte birden fazla kelimeyi aynı anda tahmin edecek şekilde eğitiyor ve bu da AI Modellerinin kelimeleri daha hızlı tahmin edecek şekilde eğitilmesine yardımcı oluyor.
JASCO: Yapay Zeka Müzik Üretimi
Meta'nın FAIR ekibi tarafından piyasaya sürülen üçüncü model, AI müzik üretimi üzerinde gelişmiş kontrol sunan JASCO'dur. Yalnızca metin girişlerine dayanan mevcut metinden müziğe modellerden farklı olarak JASCO, akorlar ve vuruşlar dahil olmak üzere çeşitli girişleri kabul ederek müzik oluşturmada daha fazla çok yönlülük ve yaratıcılığa olanak tanır.
AudioSeal: Yapay Zeka Tarafından Oluşturulan Konuşmanın Yerini Bulma
AudioSeal, yapay zeka tarafından oluşturulan ses kliplerine filigran yerleştirebilen çığır açıcı bir sistemdir. Bu teknik, daha uzun ses parçacıkları içinde yapay zeka tarafından oluşturulan bölümlerin hassas bir şekilde tespit edilmesini sağlayarak yanlış bilgilerin ve dolandırıcılıkların belirlenmesi için değerli bir araç sağlar.
Metinden Görüntüye Modellerde Çeşitliliğin Geliştirilmesi
Metinden resme modellerin dünyanın coğrafi ve kültürel çeşitliliğini yansıtmasını sağlamak için Meta'nın FAIR ekibi, bu modellerdeki potansiyel coğrafi eşitsizlikleri değerlendirmek üzere otomatik göstergeler geliştirdi.
Meta, geniş ölçekli bir açıklama çalışması yürüterek ve kapsamlı geri bildirim toplayarak, metinden resme modellerin değerlendirmelerini iyileştirmeyi ve yapay zeka tarafından oluşturulan görüntülerde çeşitliliği teşvik etmeyi amaçlıyor.
Coğrafi eşitsizlikler değerlendirme kodlarının ve ek açıklamalarının yayınlanması, araştırmacıların üretken modellerinin temsilini ve kapsayıcılığını geliştirmelerine olanak tanıyacaktır.
Meta'nın Yapay Zeka Geliştirmeye Yatırdığı Çabalar
Meta'nın yapay zeka geliştirmeye olan bağlılığı, yapay zekaya ve metaveri geliştirme bölümü Reality Labs'e yaptığı önemli sermaye harcamalarında açıkça görülüyor.
Harcamaların 2024 sonuna kadar 35 milyar ila 40 milyar dolar[1] arasına ulaşması öngörülen Meta, yapay zeka asistanları, artırılmış gerçeklik uygulamaları ve iş yapay zekaları da dahil olmak üzere çeşitli yapay zeka hizmetleri ve platformları oluşturmayı hedefliyor.
“Yapay zeka asistanımızdan artırılmış gerçeklik uygulamaları ve gözlüklerine, yaratıcıların topluluklarıyla etkileşim kurmasına ve hayranların etkileşime girebileceği API'lere (uygulama programlama arayüzleri), her zaman düşündüğümüz iş yapay zekalarına kadar bir dizi farklı yapay zeka hizmeti geliştiriyoruz. Meta CEO'su Mark Zuckerberg, işlerin eninde sonunda platformumuzu kullanacağını vurguladı.