Google的機器人團隊最近發表了一篇研究論文,展示了他們如何使用Gemini AI 教導Google的 RT-2 機器人學習並適應環境。
該團隊並沒有僅僅依賴傳統的程式設計方法,而是使用影片來訓練機器人,讓它們以類似於人類實習生的方式學習。透過錄製家庭或辦公室等指定區域的視訊遊覽,機器人可以觀察並吸收周圍環境的資訊。
Google機器人使用Gemini AI 進行導航
該模型的功能允許口頭和視覺輸出,使機器人能夠根據現有知識執行任務,並展示機器人以類似於人類行為的方式與環境互動的潛力。
在實際測試中,有一個9000平方英尺的廣闊區域來操作Gemini驅動的機器人,事實證明,機器人可以成功地遵循50多種不同的用戶指令, 成功率高達90% 。
這種高精度為人工智慧驅動的機器人帶來了許多現實世界的應用,包括協助做家事或在工作場所執行更複雜的任務。
這些機器人配備了Gemini 1.5 Pro 生成式 AI 模型,可實現長上下文視窗。這使得人工智慧能夠有效率地執行多任務和處理訊息,使機器人能夠詳細了解其環境。
例如,如果用戶詢問是否有特定飲料,機器人可以導航到冰箱,並直觀地評估其內容,然後根據該資訊提供答案。這種理解和執行程度代表了人工智慧機器人能力的顯著進步。
儘管Gemini 1.5 Pro 取得了可喜的成果,但仍有挑戰需要克服。目前,機器人需要 10 到 30 秒的時間來處理每條指令,在大多數情況下,這比人類的執行速度要慢。
此外,現實環境的複雜性和不可預測性為機器人的導航能力帶來了挑戰。
儘管Gemini驅動的機器人尚未準備好大規模商業化,但它們對各行業的潛在影響是有希望的。將Gemini 1.5 Pro 等人工智慧模式整合到機器人技術中,可以改變醫療保健、運輸和清潔工作等產業。