ทีมวิทยาการหุ่นยนต์ของ Google DeepMind เพิ่งตีพิมพ์ผลงานวิจัยที่แสดงให้เห็นว่าพวกเขากำลังสอนหุ่นยนต์ RT-2 ของ Google ให้เรียนรู้และปรับให้เข้ากับสภาพแวดล้อมโดยใช้ Gemini AI ได้อย่างไร
แทนที่จะอาศัยวิธีการเขียนโปรแกรมแบบดั้งเดิมเพียงอย่างเดียว ทีมงานใช้วิดีโอเพื่อฝึกหุ่นยนต์ ทำให้พวกเขาเรียนรู้ในลักษณะที่คล้ายกับเด็กฝึกงาน ด้วยการบันทึกวิดีโอทัวร์ในพื้นที่ที่กำหนด เช่น บ้านหรือสำนักงาน หุ่นยนต์จะสามารถรับชมและดูดซับข้อมูลเกี่ยวกับสภาพแวดล้อมของพวกเขาได้
หุ่นยนต์ของ Google นำทางด้วย Gemini AI
ฟังก์ชันการทำงานของแบบจำลองช่วยให้สามารถส่งออกทั้งทางวาจาและภาพ ทำให้หุ่นยนต์สามารถทำงานได้ตามความรู้ที่มีอยู่ และแสดงให้เห็นถึงศักยภาพของหุ่นยนต์ในการโต้ตอบกับสภาพแวดล้อมในลักษณะที่คล้ายกับพฤติกรรมของมนุษย์
ในการทดสอบภาคปฏิบัติ หุ่นยนต์ที่ขับเคลื่อนโดย Gemini มีพื้นที่กว้างถึง 9,000 ตารางฟุต และปรากฎว่าหุ่นยนต์สามารถทำตามคำแนะนำของผู้ใช้ที่แตกต่างกันได้มากกว่า 50 แบบด้วย อัตราความสำเร็จ 90 เปอร์เซ็นต์
ความแม่นยำระดับสูงนี้เปิดการใช้งานจริงมากมายสำหรับหุ่นยนต์ที่ขับเคลื่อนด้วย AI รวมถึงช่วยเหลืองานบ้านหรือทำงานที่ซับซ้อนมากขึ้นในที่ทำงาน
หุ่นยนต์ได้รับการติดตั้งโมเดล AI กำเนิด Gemini 1.5 Pro ซึ่งช่วยให้มีหน้าต่างบริบทที่ยาวได้ ช่วยให้ AI สามารถทำงานหลายอย่างพร้อมกันและประมวลผลข้อมูลได้อย่างมีประสิทธิภาพ ทำให้หุ่นยนต์สามารถเรียนรู้เกี่ยวกับสภาพแวดล้อมได้อย่างละเอียด
ตัวอย่างเช่น หากผู้ใช้ถามว่ามีเครื่องดื่มใดจำหน่ายหรือไม่ หุ่นยนต์สามารถนำทางไปยังตู้เย็น ประเมินสิ่งที่บรรจุอยู่ในนั้นด้วยสายตา จากนั้นให้คำตอบตามข้อมูลนั้น ความเข้าใจและการดำเนินการในระดับนี้แสดงถึงความก้าวหน้าที่สำคัญในขีดความสามารถของหุ่นยนต์ที่ขับเคลื่อนด้วย AI
แม้ว่าจะได้ผลลัพธ์ที่น่าพอใจด้วย Gemini 1.5 Pro แต่ก็ยังมีความท้าทายให้เอาชนะ ปัจจุบันหุ่นยนต์ใช้เวลาประมาณ 10 ถึง 30 วินาทีในการประมวลผลแต่ละคำสั่ง ซึ่งช้ากว่าเมื่อเทียบกับการดำเนินการของมนุษย์ในกรณีส่วนใหญ่
นอกจากนี้ ความซับซ้อนและความไม่แน่นอนของสภาพแวดล้อมในโลกแห่งความเป็นจริงยังก่อให้เกิดความท้าทายต่อความสามารถในการนำทางของหุ่นยนต์อีกด้วย
แม้ว่าหุ่นยนต์ที่ขับเคลื่อนด้วย Gemini ยังไม่พร้อมสำหรับการค้าขายในวงกว้าง แต่ผลกระทบที่อาจเกิดขึ้นในอุตสาหกรรมต่างๆ ก็มีแนวโน้มดี การบูรณาการโมเดล AI เช่น Gemini 1.5 Pro เข้ากับวิทยาการหุ่นยนต์ สามารถเปลี่ยนแปลงภาคส่วนต่างๆ เช่น การดูแลสุขภาพ การขนส่ง และการดูแลทำความสะอาดได้