Google DeepMind'ın robot ekibi yakın zamanda Google RT-2 robotlarına Gemini AI kullanarak öğrenmeyi ve çevrelerine uyum sağlamayı nasıl öğrettiklerini gösteren bir araştırma makalesi yayınladı.
Ekip, yalnızca geleneksel programlama yöntemlerine güvenmek yerine, robotları eğitmek için videolar kullanıyor ve onların insan stajyerlere benzer bir şekilde öğrenmelerine olanak tanıyor. Robotlar, evler veya ofisler gibi belirlenen alanların video turlarını kaydederek çevreleriyle ilgili bilgileri izleyebilir ve alabilir.
Google Robotları Gemini AI ile Geziniyor
Modelin işlevselliği, sözel ve görsel çıktılara izin vererek robotların mevcut bilgilerine dayanarak görevleri yerine getirmesine olanak tanıyor ve robotların çevreleriyle insan davranışına benzer şekillerde etkileşime girme potansiyelini sergiliyor.
Pratik testlerde Gemini ile çalışan robotların çalıştırılabileceği 9000 metrekarelik geniş bir alan var ve robotların 50'den fazla farklı kullanıcı talimatını yüzde 90'lık bir başarı oranıyla başarıyla takip edebildiği ortaya çıktı.
Bu yüksek düzeyde doğruluk, yapay zeka destekli robotlar için ev işlerine yardımcı olmak veya işyerinde daha karmaşık görevleri gerçekleştirmek de dahil olmak üzere çok sayıda gerçek dünya uygulamasının önünü açıyor.
Robotlar, uzun bir bağlam penceresi sağlayan Gemini 1.5 Pro üretken yapay zeka modeliyle donatılmıştır. Bu, yapay zekanın çoklu görev yapmasına ve bilgileri verimli bir şekilde işlemesine olanak tanıyarak robotların çevreleri hakkında ayrıntılı bilgi edinmesine olanak tanır.
Örneğin, bir kullanıcı belirli bir içeceğin bulunup bulunmadığını sorduğunda robot buzdolabına gidebilir, içindekileri görsel olarak değerlendirebilir ve ardından bu bilgiye dayalı bir yanıt verebilir. Bu düzeydeki anlayış ve uygulama, yapay zeka destekli robotların yeteneklerinde önemli bir ilerlemeyi temsil ediyor.
Gemini 1.5 Pro ile elde edilen umut verici sonuçlara rağmen hâlâ aşılması gereken zorluklar var. Robotların şu anda her bir talimatı işlemesi 10 ila 30 saniye sürüyor; bu, çoğu durumda insan yürütmesiyle karşılaştırıldığında daha yavaştır.
Ek olarak, gerçek dünya ortamlarının karmaşıklığı ve öngörülemezliği, robotların yön bulma yetenekleri açısından zorluk teşkil ediyor.
Gemini ile çalışan robotlar henüz kitlesel ticarileşmeye hazır olmasa da, çeşitli endüstrilerdeki potansiyel etkileri ümit vericidir. Gemini 1.5 Pro gibi yapay zeka modellerinin robot teknolojisine entegre edilmesiyle sağlık, nakliye ve temizlik işleri gibi sektörler dönüştürülebilir.