機器人的技術創新任務主要在于人形機器人關鍵技術的突破,其中在人形機機器人本體上的重要技術任務在于開發基于人工智能大模型的人形機器人“大腦”與
開發控制人形機器人運動的“小腦”。大模型作為最爆火的人工智能概念,推動了人形機器人大腦的形成,助力人形機器人具有人的感知、交互與決策能力;對
于控制系統仍在切入中。
感知、交互與決策
多模態大模型增強人機交互,實現
對人類意圖的理解,對復雜外部環
境的理解與認知,助力形成決策:
大模型可直接用于對環境的理解, 并通過提示詞使之輸出結構化內
容如控制代碼、任務分解等指令
利用多模態大模型對環境進行建
模, 實現具身智能對空間信息的
多模態理解
機器人能夠從數據中學習決策與
規劃策略,基礎模型為機器人決
策與規劃引入了豐富的先驗知識。
控制
大模型在控制上的助力主要集中于大模型處理環境觀察與提示,輸出動作序
列,動作序列可以是一系列關節角度或末端執行器的位姿與夾爪開合數據,
這些序列將直接用于控制機器人的運動。
原生機器人大模型ERA-42, 展示了與自研五指靈巧手星動XHAND1 結合后的靈巧操作能力,能夠完成超過100種復雜靈巧的 操作任務,是真正的具身大模型
普渡機器人提出了 Robot-to-Everything 架構,實現萬物互聯,全場景的智能生態;率先完成了專用、類人形、人形三類機 器人的完整產品布局
機器人像人一樣使用工具的靈巧手,是提升機器人柔性操作能力的關鍵部件,是柔性制造避不開的一環;靈巧手工程量占據Optimus工程量的50%,靈巧手是機器人走向“好用”的關鍵
欠驅動手硬件集成度高,整體系統簡潔高效、體積小、質量輕,便于進行動力學分析;存在功能性不足,對于精度要求比較高的手指精巧控制無法勝任
具有完全可重復的運動軌跡,適合某些功能性和精細操作較高的場合,在工業場合, 例如組裝、測量等情況下有更好的表現,沒有合理的運動學分析控制時,整體的靈活性差
機器人的觸感靈巧手Linker Hand具備20個主動自由度,包括柔性電子皮膚,實現精細觸覺感知,構建全球最大的靈巧操作數據集,包含了大量的人手操作數據,覆蓋了各 種復雜的抓取和操作任務
當人們認為機器人是有意圖的代理時,他們的大腦以類似的方式處理自己和機器人的行動結果,意圖歸因在人機交互中起著至關重要的作用,可能包括通過言語指令等非交互性手段來調整人們對機器人意圖的感知
移動機器人系統用于解決探索性化學中的三個主要問題以及根據數據決定下一步做什么,移動機器人做出與人類研究人員相同或相似的決定比人類快得多
大模型可加快人形機器人復雜任務訓練速度,提升任務生成速度及縮短理解周期;1 提升人形機器人語言處理能力 2 提升人形機器人場景理解能力 3 提升人形機器人運動控制能力 4 提升人形機器人數據訓練能力
NLP 大模型在語言的歧義、文化差異及多樣化、情感分析困難;CV 大模型算法處理復雜;多模態大模型融合不同模態的信息并提高模型的標識能力
NLP 大模型是人工智能領域的重要研究方向,CV大模型是指基于深度學習的計算機視覺模型,多模態大模型是指將文本、圖像、視頻、音頻等多模態信息聯合起來進行訓練的模型
機器人大腦提高人形機器人的人-機-環境共融交互能力,支撐全場景落地應用;機器人小腦提升人形機器人非 結構化環境下全身協調魯棒移動、靈巧操作及人機交互能力