HIX AI
Yıkılmak
Basit
Ev > Keşfetmek > Meta'nın FAIR Ekibi, Görüntüden Metne ve Metinden Müziğe Dönüştürme için Yapay Zeka Modellerini Yayınladı

Meta'nın FAIR Ekibi, Görüntüden Metne ve Metinden Müziğe Dönüştürme için Yapay Zeka Modellerini Yayınladı

Tarafından yazılmıştır
ArticleGPT

HIX.AI Ekibi tarafından incelendi ve doğruluğu kontrol edildi

4 dakikalık okumaJun 25, 2024
Meta'nın FAIR Ekibi, Görüntüden Metne ve Metinden Müziğe Dönüştürme için Yapay Zeka Modellerini Yayınladı

Kısaca

Meta, hem metin hem de görüntü oluşturabilen ve daha büyük ses alıntılarında yapay zeka tarafından oluşturulan konuşmayı tespit edebilen modeller de dahil olmak üzere beş yeni yapay zeka araştırma modelini açıkladı.

Meta'nın Temel Yapay Zeka Araştırması (FAIR) ekibi yakın zamanda beş yeni yapay zeka (AI) araştırma modeli yayınladı. Bu modeller, görüntüden metne ve metinden müziğe dönüştürmenin yanı sıra gelişmiş kod tamamlama ve yapay zeka tarafından oluşturulan konuşmanın algılanması da dahil olmak üzere geniş kapsamlı uygulamalara sahiptir.

Bukalemun Modeli: Görüntüler ve Metin Üretimi

Piyasaya sürülen dikkate değer modellerden biri, hem görüntü hem de metin oluşturabilen karma modlu modellerden oluşan bir aile olan Chameleon'dur.

Tek modlu sonuçlara odaklanan geleneksel modellerin aksine Chameleon, hem metin hem de görsellerden oluşan girdiyi işleyebilir ve çıktı olarak metin ve görsellerden oluşan bir kombinasyon oluşturabilir. Bu özellik, görüntüler için yaratıcı başlıklar oluşturmak veya tamamen yeni sahneler oluşturmak için metin istemlerini ve görüntüleri kullanmak gibi yeni olasılıkların önünü açıyor.

Çoklu Token Tahmin Modeli

Meta'nın FAIR ekibi, çoklu belirteç tahmini adı verilen yeni bir yaklaşımı tanıtarak kod tamamlama modellerinde de önemli ilerlemeler kaydetti. Önceki tek kelime yaklaşımından farklı olarak bu yeni yöntem, dil modellerini gelecekte birden fazla kelimeyi aynı anda tahmin edecek şekilde eğitiyor ve bu da AI Modellerinin kelimeleri daha hızlı tahmin edecek şekilde eğitilmesine yardımcı oluyor.

JASCO: Yapay Zeka Müzik Üretimi

Meta'nın FAIR ekibi tarafından piyasaya sürülen üçüncü model, AI müzik üretimi üzerinde gelişmiş kontrol sunan JASCO'dur. Yalnızca metin girişlerine dayanan mevcut metinden müziğe modellerden farklı olarak JASCO, akorlar ve vuruşlar dahil olmak üzere çeşitli girişleri kabul ederek müzik oluşturmada daha fazla çok yönlülük ve yaratıcılığa olanak tanır.

AudioSeal: Yapay Zeka Tarafından Oluşturulan Konuşmanın Yerini Bulma

AudioSeal, yapay zeka tarafından oluşturulan ses kliplerine filigran yerleştirebilen çığır açıcı bir sistemdir. Bu teknik, daha uzun ses parçacıkları içinde yapay zeka tarafından oluşturulan bölümlerin hassas bir şekilde tespit edilmesini sağlayarak yanlış bilgilerin ve dolandırıcılıkların belirlenmesi için değerli bir araç sağlar.

Metinden Görüntüye Modellerde Çeşitliliğin Geliştirilmesi

Metinden resme modellerin dünyanın coğrafi ve kültürel çeşitliliğini yansıtmasını sağlamak için Meta'nın FAIR ekibi, bu modellerdeki potansiyel coğrafi eşitsizlikleri değerlendirmek üzere otomatik göstergeler geliştirdi.

Meta, geniş ölçekli bir açıklama çalışması yürüterek ve kapsamlı geri bildirim toplayarak, metinden resme modellerin değerlendirmelerini iyileştirmeyi ve yapay zeka tarafından oluşturulan görüntülerde çeşitliliği teşvik etmeyi amaçlıyor.

Coğrafi eşitsizlikler değerlendirme kodlarının ve ek açıklamalarının yayınlanması, araştırmacıların üretken modellerinin temsilini ve kapsayıcılığını geliştirmelerine olanak tanıyacaktır.

Meta'nın Yapay Zeka Geliştirmeye Yatırdığı Çabalar

Meta'nın yapay zeka geliştirmeye olan bağlılığı, yapay zekaya ve metaveri geliştirme bölümü Reality Labs'e yaptığı önemli sermaye harcamalarında açıkça görülüyor.

Harcamaların 2024 sonuna kadar 35 milyar ila 40 milyar dolar[1] arasına ulaşması öngörülen Meta, yapay zeka asistanları, artırılmış gerçeklik uygulamaları ve iş yapay zekaları da dahil olmak üzere çeşitli yapay zeka hizmetleri ve platformları oluşturmayı hedefliyor.

“Yapay zeka asistanımızdan artırılmış gerçeklik uygulamaları ve gözlüklerine, yaratıcıların topluluklarıyla etkileşim kurmasına ve hayranların etkileşime girebileceği API'lere (uygulama programlama arayüzleri), her zaman düşündüğümüz iş yapay zekalarına kadar bir dizi farklı yapay zeka hizmeti geliştiriyoruz. Meta CEO'su Mark Zuckerberg, işlerin eninde sonunda platformumuzu kullanacağını vurguladı.

3 arama kaynağına dayalı

3 kaynaklar

Meta Releases AI Models That Generate Both Text and Images

Meta has released five new artificial intelligence (AI) research models, including ones that can generate both text and images and that can detect AI-generated speech within larger audio snippets.

Releasing New AI Research Models to Accelerate Innovation at Scale

Today, Meta’s Fundamental AI Research team is publicly releasing several models to accelerate future research and allow others to innovate and apply AI at scale.

Meta has created a way to watermark AI-generated speech

The tool, called AudioSeal, could eventually help tackle the growing use of voice cloning tools for scams and misinformation.

Bu sayfada

  • Bukalemun Modeli: Görüntüler ve Metin Üretimi
  • Çoklu Token Tahmin Modeli
  • JASCO: Yapay Zeka Müzik Üretimi
  • Metinden Görüntüye Modellerde Çeşitliliğin Geliştirilmesi
  • Meta'nın Yapay Zeka Geliştirmeye Yatırdığı Çabalar