

這兩項名為 ALOHA Unleashed 和 DemoStart 的 AI 系統,分別專注於雙臂操作和多手指機械手的模擬學習。
Google DeepMind 近日發表了兩項最新的人工智慧 (AI) 進展,目的提升機器人的靈巧度,讓機器人能更精準地操控物體,執行更複雜的任務。這兩項名為 ALOHA Unleashed 和 DemoStart 的 AI 系統,分別專注於雙臂操作和多手指機械手的模擬學習。
一直以來,先進的 AI 機器人大多隻能使用單臂進行拾取和放置物體等簡單動作。而 Google DeepMind 最新推出的 ALOHA Unleashed 系統,則賦予了機器人雙臂協調操作的能力,使其能夠執行更精細、更複雜的任務。
ALOHA Unleashed 系統建立在 ALOHA 2 平臺之上,該平臺源自史丹佛大學開發的低成本開源雙手遙控操作硬體系統 ALOHA。
與之前的系統相比,ALOHA 2 擁有兩隻更靈活的機械手臂,可以輕鬆進行遙控操作,用於訓練和資料收集。這讓機器人能夠透過更少的演示次數,就能學習新任務。
ALOHA Unleashed 的訓練過程包括數據收集和機器學習兩個階段。
首先,研究人員透過遠程操控機器人執行繫鞋帶、掛衣服等複雜任務,收集演示資料。
接著,他們運用類似於 Imagen 模型生成圖像的擴散方法,從隨機雜訊中預測機器人的動作,幫助機器人學習數據並獨立執行相同的任務。
透過 ALOHA Unleashed 系統,Google DeepMind 的機器人已經學會了許多需要雙手協調才能完成的任務,例如繫鞋帶、晾衣服、修理其他機器人、插入齒輪,甚至清理廚房。
控制一隻靈巧的機械手本身就是一項複雜的任務,而隨著手指、關節和傳感器的增加,任務的複雜性也會隨之提升。
為瞭解決這個問題,Google DeepMind 推出了一項名為 DemoStart 系統。
該系統使用強化學習演算法,幫助機器人在模擬環境中學習靈活的操作行為,尤其適用於多指機械手等複雜的機械結構。
DemoStart 會先從簡單的狀態開始學習,隨著時間推移,逐漸學習更困難的狀態,直到完全掌握任務。
與從現實世界範例中學習相比,DemoStart 只需要 1/100 的模擬演示次數就能在模擬環境中學會解決相同的任務。
在模擬環境中,機器人已經成功學會了多種任務,例如將特定顏色的方塊重新定向、擰緊螺母和螺栓以及整理工具,成功率超過 98%。
在現實環境中,機器人在方塊重新定向和抬起任務中也達到了 97% 的成功率,在需要高度手指協調和精準度的插座插入任務中則達到了 64%。
DemoStart 是基於 Google DeepMind 的開源物理模擬器 MuJoCo 所開發。
透過結合強化學習和少量演示學習,DemoStart 的漸進式學習方法可以自動生成「課程」來彌補模擬與真實的差距。隨著學習的進展,DemoStart 會逐步增加模擬環境的複雜度,使其越來越接近真實世界。並將知識從模擬環境轉移到實體機器人,以此減少運行物理實驗所需的成本和時間。
為了進行更深入、更高階的機器人學習實驗,Google DeepMind 還與 Shadow Robot 合作開發了一款名為 DEX-EE 的三指機械手,並使用 DemoStart 對其進行了測試(即本文首圖)。
Google DeepMind 指出,機器人技術是人工智慧研究的一個獨特領域,它展現了人工智慧方法在現實世界中的應用效果。 例如,大型語言模型可以告訴你如何擰緊螺栓或繫鞋帶,但即使它被嵌入到機器人中,它也無法親自執行這些任務。
Google DeepMind 相信,總有一天,人工智慧機器人將能夠在家中、工作場所和其他更多場景中幫助人們完成各種任務。 而靈巧度研究,包括文中提到的高效和通用的學習方法,將有助於實現這一目標。
儘管距離機器人能夠像人類一樣輕鬆、精準地抓取和操控物體還有很長的路要走,但 Google DeepMind 的研究成果無疑是邁向這一目標的重要一步。
:Sherlock
快加入 INSIDE Google News 按下追蹤,給你最新、最 IN 的科技新聞!