HIX AI
ทรุด
เรียบง่าย
บ้าน > ค้นพบ > DeepMind ของ Google เปิดเผยว่าหุ่นยนต์ปรับตัวและเรียนรู้สภาพแวดล้อมโดยใช้ Gemini AI ได้อย่างไร

DeepMind ของ Google เปิดเผยว่าหุ่นยนต์ปรับตัวและเรียนรู้สภาพแวดล้อมโดยใช้ Gemini AI ได้อย่างไร

เขียนโดย
ArticleGPT

ตรวจสอบและตรวจสอบข้อเท็จจริงโดย ทีมงาน HIX.AI

อ่าน 2 นาทีJul 12, 2024
DeepMind ของ Google เปิดเผยว่าหุ่นยนต์ปรับตัวและเรียนรู้สภาพแวดล้อมโดยใช้ Gemini AI ได้อย่างไร

โดยสังเขป

DeepMind ใช้ทัวร์ชมวิดีโอและ Gemini 1.5 Pro เพื่อฝึกหุ่นยนต์สำหรับการนำทางและทำงานให้เสร็จสิ้น

ทีมวิทยาการหุ่นยนต์ของ Google DeepMind เพิ่งตีพิมพ์ผลงานวิจัยที่แสดงให้เห็นว่าพวกเขากำลังสอนหุ่นยนต์ RT-2 ของ Google ให้เรียนรู้และปรับให้เข้ากับสภาพแวดล้อมโดยใช้ Gemini AI ได้อย่างไร

แทนที่จะอาศัยวิธีการเขียนโปรแกรมแบบดั้งเดิมเพียงอย่างเดียว ทีมงานใช้วิดีโอเพื่อฝึกหุ่นยนต์ ทำให้พวกเขาเรียนรู้ในลักษณะที่คล้ายกับเด็กฝึกงาน ด้วยการบันทึกวิดีโอทัวร์ในพื้นที่ที่กำหนด เช่น บ้านหรือสำนักงาน หุ่นยนต์จะสามารถรับชมและดูดซับข้อมูลเกี่ยวกับสภาพแวดล้อมของพวกเขาได้

หุ่นยนต์ของ Google นำทางด้วย Gemini AI

ฟังก์ชันการทำงานของแบบจำลองช่วยให้สามารถส่งออกทั้งทางวาจาและภาพ ทำให้หุ่นยนต์สามารถทำงานได้ตามความรู้ที่มีอยู่ และแสดงให้เห็นถึงศักยภาพของหุ่นยนต์ในการโต้ตอบกับสภาพแวดล้อมในลักษณะที่คล้ายกับพฤติกรรมของมนุษย์

ในการทดสอบภาคปฏิบัติ หุ่นยนต์ที่ขับเคลื่อนโดย Gemini มีพื้นที่กว้างถึง 9,000 ตารางฟุต และปรากฎว่าหุ่นยนต์สามารถทำตามคำแนะนำของผู้ใช้ที่แตกต่างกันได้มากกว่า 50 แบบด้วย อัตราความสำเร็จ 90 เปอร์เซ็นต์

ความแม่นยำระดับสูงนี้เปิดการใช้งานจริงมากมายสำหรับหุ่นยนต์ที่ขับเคลื่อนด้วย AI รวมถึงช่วยเหลืองานบ้านหรือทำงานที่ซับซ้อนมากขึ้นในที่ทำงาน

หุ่นยนต์ได้รับการติดตั้งโมเดล AI กำเนิด Gemini 1.5 Pro ซึ่งช่วยให้มีหน้าต่างบริบทที่ยาวได้ ช่วยให้ AI สามารถทำงานหลายอย่างพร้อมกันและประมวลผลข้อมูลได้อย่างมีประสิทธิภาพ ทำให้หุ่นยนต์สามารถเรียนรู้เกี่ยวกับสภาพแวดล้อมได้อย่างละเอียด

ตัวอย่างเช่น หากผู้ใช้ถามว่ามีเครื่องดื่มใดจำหน่ายหรือไม่ หุ่นยนต์สามารถนำทางไปยังตู้เย็น ประเมินสิ่งที่บรรจุอยู่ในนั้นด้วยสายตา จากนั้นให้คำตอบตามข้อมูลนั้น ความเข้าใจและการดำเนินการในระดับนี้แสดงถึงความก้าวหน้าที่สำคัญในขีดความสามารถของหุ่นยนต์ที่ขับเคลื่อนด้วย AI

แม้ว่าจะได้ผลลัพธ์ที่น่าพอใจด้วย Gemini 1.5 Pro แต่ก็ยังมีความท้าทายให้เอาชนะ ปัจจุบันหุ่นยนต์ใช้เวลาประมาณ 10 ถึง 30 วินาทีในการประมวลผลแต่ละคำสั่ง ซึ่งช้ากว่าเมื่อเทียบกับการดำเนินการของมนุษย์ในกรณีส่วนใหญ่

นอกจากนี้ ความซับซ้อนและความไม่แน่นอนของสภาพแวดล้อมในโลกแห่งความเป็นจริงยังก่อให้เกิดความท้าทายต่อความสามารถในการนำทางของหุ่นยนต์อีกด้วย

แม้ว่าหุ่นยนต์ที่ขับเคลื่อนด้วย Gemini ยังไม่พร้อมสำหรับการค้าขายในวงกว้าง แต่ผลกระทบที่อาจเกิดขึ้นในอุตสาหกรรมต่างๆ ก็มีแนวโน้มดี การบูรณาการโมเดล AI เช่น Gemini 1.5 Pro เข้ากับวิทยาการหุ่นยนต์ สามารถเปลี่ยนแปลงภาคส่วนต่างๆ เช่น การดูแลสุขภาพ การขนส่ง และการดูแลทำความสะอาดได้

อิงตามแหล่งค้นหา 3

3 แหล่งที่มา

Google's AI robots are learning from watching movies – just like the rest of us

Google DeepMind's robotics team is teaching robots to learn how a human intern would: by watching a video.

Google says Gemini AI is making its robots smarter

DeepMind is using video tours and Gemini 1.5 Pro to train robots to navigate and complete tasks.

Google is using GeminiAI to make its robots smarter and better, here’s how

Google is empowering the robots to be more flexible and adaptable by remembering and understanding their environment, thanks to Gemini 1.5 Pro model

บนหน้านี้

  • หุ่นยนต์ของ Google นำทางด้วย Gemini AI