技術(shù)革新+巨頭入局+政策激勵(lì),多維度催化人形機(jī)器人落地
技術(shù)進(jìn)步+巨頭入局+政策激勵(lì)加速 2023 年人形機(jī)器人產(chǎn)業(yè)發(fā)展。2023 年 ChatGPT 等大 語(yǔ)言模型超預(yù)期發(fā)展,增強(qiáng)人形機(jī)器人交互能力,拓寬其應(yīng)用領(lǐng)域;硬件方面,特斯拉等 科技公司紛紛入局,有望加快產(chǎn)業(yè)鏈技術(shù)進(jìn)步。我們認(rèn)為人形雙足機(jī)器人為通用機(jī)器人的 最優(yōu)解,因?yàn)槿祟惿鐣?huì)的種種事物都按照人類的生理結(jié)構(gòu)進(jìn)行設(shè)計(jì),貼近人類形態(tài)的雙足 機(jī)器人更能適應(yīng)種類多樣的任務(wù),達(dá)到通用的目的,隱形成本較小。隨著科技龍頭入局、 ChatGPT 等 AI 技術(shù)加速、相關(guān)政策密集落地,作為“具身智能”理想載體的人形機(jī)器人 在多種因素的推動(dòng)下有望快速發(fā)展。
大模型幫助機(jī)器人思考學(xué)習(xí),推動(dòng)具身智能發(fā)展。英偉達(dá)創(chuàng)始人兼 CEO 黃仁勛在 ITF World 2023 半導(dǎo)體大會(huì)上表示,AI 下一個(gè)浪潮將是“具身智能”,即能夠理解、推理物理 世界并與物理世界互動(dòng)的智能系統(tǒng)。微軟、Google、英偉達(dá)等大廠均積極開展具身智能相 關(guān)研究。微軟基于 ChatGPT 的強(qiáng)大自然語(yǔ)言理解和推理能力生成控制機(jī)器人的相關(guān)代碼; 英偉達(dá) VIMA 基于 T5 模型,將文本和多模態(tài)輸入交錯(cuò)融合,結(jié)合歷史信息預(yù)測(cè)機(jī)器人的 下一步行動(dòng)動(dòng)作;英偉達(dá) OPTIMUS 使用任務(wù)運(yùn)動(dòng)規(guī)劃器來(lái)自動(dòng)生成足夠的機(jī)器人軌跡數(shù) 據(jù),然后訓(xùn)練 Transformer 視覺-運(yùn)動(dòng)策略,進(jìn)而預(yù)測(cè)機(jī)器人動(dòng)作;谷歌 RT-2 則通過(guò) VLM 與機(jī)器人數(shù)據(jù)的結(jié)合,賦予機(jī)器人語(yǔ)義理解和基本推理能力。大模型不斷進(jìn)步提升人形機(jī) 器人交互能力,推動(dòng)具身智能發(fā)展。
特斯拉機(jī)器人快速迭代,24 年有望在工廠投入使用。2021 年特斯拉在 AI Day 上首次提 出其人形機(jī)器人 Optimus 的渲染圖;2022 年 AI Day 上,特斯拉推出原型機(jī),在沒有外接 線纜的情況下實(shí)現(xiàn)了緩慢行走與揮手;2023 年 5 月股東大會(huì)上,特斯拉人形機(jī)器人已經(jīng) 可以實(shí)現(xiàn)流暢的行走與抓取物品,靈活度較原型機(jī)大大提高。2023 年 7 月 20 日,馬斯克 表示,目前特斯拉人形機(jī)器人擎天柱的制造數(shù)量為 10 臺(tái)左右,將會(huì)在 2023 年 11 月左右 對(duì)特斯拉自己設(shè)計(jì)的執(zhí)行器進(jìn)行行走等測(cè)試,明年人形機(jī)器人有望率先在內(nèi)部工廠投入使 用。在應(yīng)用場(chǎng)景方面,除了工廠以外,公司還考慮將人形機(jī)器人與 Neuralink 結(jié)合,為殘 障人士提供義肢應(yīng)用場(chǎng)景有望不斷拓展。
多方玩家布局人形機(jī)器人,百舸爭(zhēng)流加快硬件變革。除特斯拉外,國(guó)內(nèi)外多家公司積極研 發(fā)人形機(jī)器人并取得快速進(jìn)步。2019 年波士頓動(dòng)力機(jī)器人 Atlas 掌握“體操”技巧,能夠 連續(xù)的跳躍、翻滾;2022 年 8 月,小米發(fā)布人形機(jī)器人“Cyberone”;2023 年 4 月 1X technologies 機(jī)器人 EVE 應(yīng)用于美國(guó)和歐洲部分地區(qū)的商業(yè)場(chǎng)景;優(yōu)必選、傅利葉所生產(chǎn) 機(jī)器人都具備行走,與人協(xié)同完成動(dòng)作等功能;三星宣布將于 2023 年 10 月闡述其 “Semicon 人形機(jī)器人”計(jì)劃。各高校實(shí)驗(yàn)室也在積極嘗試各種技術(shù)路徑研發(fā)人形機(jī)器人, 清華大學(xué)交叉信息研究院陳建宇團(tuán)隊(duì)機(jī)器人“小星”采用準(zhǔn)直驅(qū)力控方案,可完成多種動(dòng) 作。多方玩家并驅(qū)爭(zhēng)先,有望加速人形機(jī)器人硬件升級(jí)。
政策密集出臺(tái),加速人形機(jī)器人產(chǎn)業(yè)化進(jìn)程。2023 年 6 月 28 日,北京印發(fā)《北京市機(jī)器 人產(chǎn)業(yè)創(chuàng)新發(fā)展行動(dòng)方案(2023-2025 年)》,強(qiáng)調(diào)要對(duì)標(biāo)國(guó)際領(lǐng)先人形機(jī)器人產(chǎn)品,支持 企業(yè)和高校院所開展人形機(jī)器人研發(fā)和工程化,目標(biāo)在 2025 年前實(shí)現(xiàn)百臺(tái)(套)級(jí)人形 機(jī)器人原型機(jī)的生產(chǎn),并在 3-4 個(gè)典型場(chǎng)景中開展示范性應(yīng)用。十四五以來(lái),中央和地方 陸續(xù)推出支持人形機(jī)器人產(chǎn)業(yè)發(fā)展的政策,如《“十四五”機(jī)器人產(chǎn)業(yè)發(fā)展規(guī)劃》、《“機(jī)器 人”應(yīng)用行動(dòng)實(shí)施方案》、《山東省制造業(yè)創(chuàng)新能力提升三年行動(dòng)計(jì)劃(2023-2025 年)》、 《深圳市加快推動(dòng)人工智能高質(zhì)量發(fā)展高水平應(yīng)用行動(dòng)方案(2023-2024 年)》等。多地 利好政策有望推動(dòng)人形機(jī)器人加快工程化和產(chǎn)業(yè)化。
決策層:大模型賦予機(jī)器人“大腦”,具身智能迎來(lái)曙光
大模型使機(jī)器人理解自然語(yǔ)言,增強(qiáng)泛化能力
大模型為機(jī)器人裝上“大腦”,提升其理解能力與泛化能力。谷歌 DeepMind 于 2023 年 7 月 28 日推出全球首個(gè)控制機(jī)器人的視覺-語(yǔ)言-動(dòng)作(VLA)模型 RT-2;斯坦福大學(xué)李飛飛教 授研究團(tuán)隊(duì)于 2023 年 7 月 12 日推出 VoxPoser,通過(guò)大語(yǔ)言模型加視覺語(yǔ)言模型指導(dǎo)機(jī) 器人行動(dòng)。搭載此類模型的機(jī)器人可以像 ChatGPT 一樣被操縱,可理解自然語(yǔ)言指令并 且無(wú)需預(yù)定義的運(yùn)動(dòng)原語(yǔ)或額外的數(shù)據(jù)和訓(xùn)練,具身智能迎來(lái)曙光(具身智能指具有身體 并支持物理交互的智能體,可借助智能算法實(shí)現(xiàn)理解推理并與物理世界互動(dòng))。大模型的 發(fā)展使機(jī)器人更容易理解人類指令并執(zhí)行動(dòng)作以完成更好的交互,人形機(jī)器人產(chǎn)業(yè)化進(jìn)度 有望加快。
RT-2/VoxPoser 實(shí)現(xiàn)自然語(yǔ)言編程,機(jī)器人“善解人意”。RT-2/VoxPoser 的一大突破是 使機(jī)器人可以理解自然語(yǔ)言指令,無(wú)需復(fù)雜的編程語(yǔ)言便可完成人機(jī)交互。RT-2 模型建 立在視覺-語(yǔ)言模型(VLM)的基礎(chǔ)上,賦予機(jī)器人語(yǔ)義理解和基本推理能力,使其可以聽 懂并自主推理出已滅絕動(dòng)物(恐龍)和哪種飲料最適合疲憊的人(能量飲料);李飛飛團(tuán)隊(duì) VoxPoser 模型只需接收到“打開上面的抽屜,小心花瓶!”類似的指令即可執(zhí)行任務(wù);在 前華為天才少年彭志輝創(chuàng)業(yè)公司智元機(jī)器人所發(fā)布的視頻中,機(jī)器人也可根據(jù)簡(jiǎn)單的文字 或語(yǔ)音指令對(duì)桌面上不同顏色的方塊進(jìn)行選取、調(diào)位和疊放等操作。
無(wú)需訓(xùn)練即可完成復(fù)雜指令且產(chǎn)生涌現(xiàn)能力,未知場(chǎng)景下 RT-2 模型泛化能力翻倍。新模 型的另一大突破是無(wú)需預(yù)定義的運(yùn)動(dòng)原語(yǔ)或額外的數(shù)據(jù)和訓(xùn)練,模型泛化能力增強(qiáng),加速 機(jī)器人通用化。過(guò)去算法下實(shí)現(xiàn)機(jī)器人扔垃圾的動(dòng)作需訓(xùn)練機(jī)器人區(qū)分、撿起、扔掉垃圾 各個(gè)步驟,而 RT-2 可以將網(wǎng)絡(luò)相關(guān)知識(shí)傳給機(jī)器人,使其無(wú)需明確的訓(xùn)練即可學(xué)會(huì)扔垃 圾。面對(duì)之前從未見過(guò)的任務(wù)情形,RT-2 成功率達(dá)到 62%,泛化性能較 RT-1 提高一倍。 而 VoxPoser 用大模型指導(dǎo)機(jī)器人如何與環(huán)境進(jìn)行交互,達(dá)到在無(wú)需額外數(shù)據(jù)和訓(xùn)練的情 況下完成各種任務(wù),并且涌現(xiàn)出了 4 種行為能力,可以自主分步完成任務(wù),掌握評(píng)估方法, 根據(jù)最新要求做出判斷進(jìn)而調(diào)整輸出動(dòng)作。
RT-2 泛化能力還體現(xiàn)在其思維鏈(CoT)助其進(jìn)行多階段語(yǔ)義推理,完成更復(fù)雜任務(wù)。 DeepMind 研究團(tuán)隊(duì)展示了將思維鏈推理納入 RT-2 中使其能夠進(jìn)行多階段語(yǔ)義推理,他們 用少量的“增強(qiáng)”數(shù)據(jù)微調(diào)一個(gè) RT-2-PaLM-E 變種,增強(qiáng)數(shù)據(jù)中加入了“Plan”步驟, 使得 VLM 首先用自然語(yǔ)言描述機(jī)器人將要采取的動(dòng)作的目的,然后再給出預(yù)測(cè)的機(jī)器人 動(dòng)作標(biāo)記。例如:“指示:我餓了。計(jì)劃:選擇 rxbar 巧克力。行動(dòng):1 128 124 136 121 158 111 255。”通過(guò)實(shí)驗(yàn)結(jié)果可以觀察到,具有思維鏈推理的 RT-2 能夠回答更復(fù)雜的命 令。
決策結(jié)果到運(yùn)動(dòng)控制映射方式改變,機(jī)器人實(shí)現(xiàn)“手腦協(xié)調(diào)”
此前大模型產(chǎn)出的策略需要借助低級(jí)別策略或 API 才能完成對(duì)機(jī)器人的運(yùn)動(dòng)控制。視覺語(yǔ) 言模型生成的結(jié)果到機(jī)器人動(dòng)作的映射方式,主要取決于該預(yù)測(cè)結(jié)果的層級(jí)。之前模型中 預(yù)測(cè)結(jié)果處于高級(jí)別設(shè)計(jì)層級(jí):以 Google PaLM-E 和微軟 ChatGPT for Robotics 為例, PaLM-E 實(shí)現(xiàn)了對(duì)具身任務(wù)的決策方案預(yù)測(cè),但不涉及機(jī)器人動(dòng)作的實(shí)際控制,需要依賴 低級(jí)別的現(xiàn)成策略或規(guī)劃器來(lái)將決策方案“翻譯”為機(jī)器人動(dòng)作。微軟默認(rèn)提供控制機(jī)器 人的低層級(jí) API,ChatGPT 輸出是更高層級(jí)的代碼,需調(diào)用到機(jī)器人低層級(jí)的庫(kù)或 API, 從而實(shí)現(xiàn)對(duì)機(jī)器人動(dòng)作的映射和控制。RT-2 和 VoxPoser 預(yù)測(cè)結(jié)果已經(jīng)到了低級(jí)別動(dòng)作層 級(jí),不需要再經(jīng)過(guò)復(fù)雜的翻譯即可將高層級(jí)設(shè)計(jì)映射到低層級(jí)動(dòng)作。
RT-2 輸出字符串可直接對(duì)應(yīng)到機(jī)器人的坐標(biāo)、旋轉(zhuǎn)角等信息。RT-2 動(dòng)作控制采用的方法 是將機(jī)器人動(dòng)作表示為另一種語(yǔ)言,即文本 token,并與 Web 規(guī)模的視覺-語(yǔ)言數(shù)據(jù)集一 起訓(xùn)練。代表機(jī)器人動(dòng)作的文本字符串可以是機(jī)器人動(dòng)作 token 編號(hào)的序列,例如「1 128 91 241 5 101 127 217」,該字符串以一個(gè)標(biāo)志開始,該標(biāo)志指示機(jī)器人是繼續(xù)還是終止當(dāng) 前情節(jié),然后機(jī)器人根據(jù)指示改變末端執(zhí)行器的位置和旋轉(zhuǎn)以及機(jī)器人抓手等命令。由于 動(dòng)作被表示為文本字符串,因此機(jī)器人執(zhí)行動(dòng)作命令就像執(zhí)行字符串命令一樣簡(jiǎn)單。這種 表示方式允許谷歌對(duì)現(xiàn)有的視覺-語(yǔ)言模型進(jìn)行微調(diào),并將其轉(zhuǎn)換為視覺-語(yǔ)言-動(dòng)作模型。
Voxposer 規(guī)劃結(jié)果直接為機(jī)器人運(yùn)行軌跡。Voxposer 的動(dòng)作控制實(shí)現(xiàn)過(guò)程是首先給定環(huán) 境信息(用相機(jī)采集 RGB-D 圖像)和自然語(yǔ)言指令,之后 LLM(大語(yǔ)言模型)根據(jù)這些 內(nèi)容編寫代碼,所生成代碼與 VLM(視覺語(yǔ)言模型)進(jìn)行交互,指導(dǎo)系統(tǒng)生成相應(yīng)的操作 指示地圖(3D Value Map),之后動(dòng)作規(guī)劃器將生成的 3D 地圖作為目標(biāo)函數(shù),直接合成 最終操作軌跡。在用 LLM 和 VLM 將語(yǔ)言指令映射為 3D 地圖的過(guò)程中,系統(tǒng)利用“感興 趣的實(shí)體(entity of interest)”來(lái)引導(dǎo)機(jī)器人進(jìn)行操作,也就是通過(guò) 3D Value Map 中標(biāo)記 的值來(lái)反應(yīng)哪個(gè)物體是對(duì)它具有“吸引力”的,哪些物體是具有“排斥性”,比如在打開 抽屜的例子中,抽屜就是“吸引”的,花瓶是“排斥”的。
感知層:聚焦力傳感器應(yīng)用,機(jī)器人知“輕重”懂交互
人形機(jī)器人需借助多種傳感器識(shí)別自身運(yùn)動(dòng)狀態(tài)和環(huán)境狀況,收集多模態(tài)數(shù)據(jù)以供交互。 具身智能重點(diǎn)在于具有身體體驗(yàn)的能力,與環(huán)境交互獲得視、聽、觸覺等多模態(tài)數(shù)據(jù)再做 出反應(yīng),需要模型與傳感器等硬件相互配合。李飛飛教授團(tuán)隊(duì)在介紹 Voxposer 的論文中 提到,具身智能依賴于外部感知模塊,在需要整體視覺推理或理解細(xì)粒度物體幾何形狀的 任務(wù)中具有局限性,需要更高級(jí)的視覺傳感器或其他傳感方式。因此人形機(jī)器人產(chǎn)業(yè)化不 僅需要大模型完成決策,還需要傳感器等硬件不斷升級(jí)進(jìn)行配合,提供多模態(tài)數(shù)據(jù)。
六維力/關(guān)節(jié)扭矩傳感器為力控核心,使人形機(jī)器人知“輕重”
力傳感發(fā)展仍處初期,六維力傳感器和關(guān)節(jié)扭矩傳感器是核心。在機(jī)器人多種感知中,力 覺感知及對(duì)應(yīng)的力傳感器發(fā)展較慢,但其在人形機(jī)器人的運(yùn)動(dòng)控制中起重要作用,可以增 強(qiáng)機(jī)器人本體感知及獲取環(huán)境物理信息的能力。力傳感器是人形機(jī)器人感測(cè)力和力矩信息 的主流選擇,可協(xié)助機(jī)器人完成精細(xì)和智能的操作任務(wù)。人形機(jī)器人力感知主要包括兩種 模式,一種使用末端的六維力傳感器,一種使用關(guān)節(jié)扭矩傳感器。人形機(jī)器人旋轉(zhuǎn)、線性 執(zhí)行結(jié)構(gòu)類似于人類關(guān)節(jié),對(duì)于力的感知相對(duì)簡(jiǎn)單,可采用關(guān)節(jié)扭矩傳感器;而對(duì)于人形 機(jī)器人末端執(zhí)行器(如腕部、踝部)在執(zhí)行操作的過(guò)程中,力的方向和作用點(diǎn)都在三維空 間內(nèi)隨機(jī)變化,測(cè)量需要精確處理,六維力傳感器更符合需求。
六維力傳感器精度高、獲取力信息最全面。六維力傳感器是一類可以同時(shí)檢測(cè) X、Y、Z 三軸方向的力和繞三個(gè)坐標(biāo)軸方向的力矩的傳感器,目前已應(yīng)用于協(xié)作機(jī)器人和康復(fù)醫(yī)療 機(jī)器人中,可以增強(qiáng)機(jī)器人與人協(xié)同的安全性。六維力傳感器測(cè)量維度最高,可以提供最 全面的力覺信息,其具有高精度、高靈敏度、快速響應(yīng)、高耐用性和可靠性的特點(diǎn),可以 輕松檢測(cè)到微小的力的變化,實(shí)時(shí)記錄和傳輸數(shù)據(jù),滿足各種應(yīng)用的需求。相較于三維力 傳感器,六維力傳感器適用于力的作用點(diǎn)離傳感器標(biāo)定參考點(diǎn)距離較遠(yuǎn),且隨機(jī)變化,測(cè) 量精度要求較高的情況。同時(shí)機(jī)器人可以利用獲得的力矩信息推算受力部件的姿態(tài),監(jiān)測(cè) 力矩是否在安全范圍內(nèi),有效避免傳感器的過(guò)載損壞。
六維力傳感器主要用于人形機(jī)器人腕部及踝部。六維力傳感器可裝載于機(jī)器人的腕部、踝 部等核心關(guān)節(jié)處,讓機(jī)器人知“輕重”、懂交互,真正實(shí)現(xiàn)類人的運(yùn)動(dòng)能力。雙足機(jī)器人 由于有腳掌的存在,其在落足時(shí)會(huì)產(chǎn)生力矩,測(cè)量該力矩的大小和方向是運(yùn)動(dòng)控制中的重 要一環(huán)。六維力傳感器可搭載于雙足機(jī)器人腳踝處,測(cè)量各方向的力和力矩,并由控制器 通過(guò)分析傳感器輸出的各維度數(shù)據(jù),得出落腳時(shí)的受力狀態(tài),從而對(duì)機(jī)器人姿態(tài)進(jìn)行調(diào)整。 六維力傳感器還適用于人形機(jī)器人手腕關(guān)節(jié)處,機(jī)械手在執(zhí)行抓取或裝配工作時(shí),會(huì)受到 各方向的力,有六維力傳感器作為感知元件,機(jī)器人才能精準(zhǔn)執(zhí)行這些工作,甚至做到 “穿針引線”。
關(guān)節(jié)扭矩傳感器增強(qiáng)機(jī)器人本體感知。關(guān)節(jié)扭矩傳感器將扭轉(zhuǎn)力矩引起的物理變化轉(zhuǎn)換成 精確的電信號(hào),從而形成對(duì)機(jī)器人單關(guān)節(jié)力矩的測(cè)量和記錄。機(jī)器人本體感知依賴關(guān)節(jié)扭 矩傳感器感測(cè)各個(gè)關(guān)節(jié)扭力,獲得各個(gè)部位受力情況,提供機(jī)器人整體的姿態(tài)及位置信息。 關(guān)節(jié)扭矩傳感器可以實(shí)時(shí)反饋高質(zhì)量扭矩信號(hào),迅速識(shí)別接觸并立即降低力和速度,因?yàn)?該傳感器距離電機(jī)較近,避免了機(jī)器人機(jī)械本體動(dòng)態(tài)特性的干擾,帶寬更高,動(dòng)態(tài)響應(yīng)更 快。關(guān)節(jié)扭矩傳感器本質(zhì)測(cè)量一維力,但要抵抗五維力的干擾,抗干擾能力要求高。
高價(jià)值高壁壘,六維力傳感器面臨動(dòng)靜態(tài)特性及解耦問題
進(jìn)口六維力傳感器價(jià)格昂貴,國(guó)內(nèi)外產(chǎn)品在多方面仍存在差距。2022 年,在接受高工機(jī) 器人采訪時(shí),坤維科技創(chuàng)始人熊琳表示:“一臺(tái)高性能的進(jìn)口力傳感器的價(jià)格頂?shù)蒙蠂?guó)內(nèi) 一臺(tái)協(xié)作機(jī)器人的價(jià)格,導(dǎo)致國(guó)內(nèi)機(jī)器人行業(yè)用不起,加之標(biāo)校能力和生產(chǎn)方式等多方面 的約束,國(guó)內(nèi)多數(shù)六維力傳感器廠商無(wú)法滿足產(chǎn)能需求,阻礙了第三代工業(yè)機(jī)器人的發(fā) 展。”高性能六維傳感器價(jià)格從幾千到上萬(wàn)不等,價(jià)值量較高。國(guó)內(nèi)參與者主要是鑫精誠(chéng)、 宇立儀器(安川電機(jī)、KUKA、ABB 的力傳感器合作商)、坤維科技(供貨給節(jié)卡、遨博、 睿爾曼、大族等國(guó)內(nèi)協(xié)作機(jī)器人廠商),但國(guó)產(chǎn)六維力傳感器與外資主流傳感器在靈敏度、 串?dāng)_、抗過(guò)載能力及維間耦合誤差等方面仍存在差距。
應(yīng)變片式為當(dāng)前六維力傳感器主流,硅應(yīng)變傳感器在穩(wěn)定性、信噪比、剛度方面表現(xiàn)較好。 根據(jù) GGII,六維力傳感器根據(jù)傳感元件的不同主要分為三種基本類型:應(yīng)變片式、光學(xué)式 以及壓電/電容式。應(yīng)變片式可分為金屬電阻應(yīng)變片和硅應(yīng)變片,當(dāng)基體受力發(fā)生應(yīng)力變化 時(shí),應(yīng)變片也一起產(chǎn)生變形,使應(yīng)變片的阻值發(fā)生變化。壓電/電容式中,電容是通過(guò)極距 的變化導(dǎo)致電壓變化,壓電則是通過(guò)形變改變電荷。光學(xué)式則通常使用光柵或其他光纖技 術(shù)檢測(cè)光功率并將其轉(zhuǎn)換為電能。目前市場(chǎng)應(yīng)用的大部分是基于應(yīng)變片式的測(cè)量,其具有 靈敏度高、測(cè)量范圍大、可靠性高、技術(shù)成熟等優(yōu)點(diǎn)。其中硅應(yīng)變傳感器在穩(wěn)定性、信噪 比、剛度方面有比較優(yōu)勢(shì)。
應(yīng)變片式傳感器的彈性體結(jié)構(gòu)是關(guān)鍵,一體化和 Stewart 并聯(lián)為主流。應(yīng)變片式六維力傳 感器的彈性體結(jié)構(gòu)設(shè)計(jì)是核心問題,傳感器的結(jié)構(gòu)受到其應(yīng)用場(chǎng)合的限制,而力敏感元件 的形式和布置直接影響傳感器的靈敏度、剛度、動(dòng)態(tài)性能、維間耦合等,很大程度上決定 傳感器性能的優(yōu)劣。六維力傳感器的典型結(jié)構(gòu)設(shè)計(jì)主要是一體化結(jié)構(gòu)(豎梁、橫梁)和 Stewart 并聯(lián)結(jié)構(gòu)。以 Waston 腕力傳感器為典型代表的豎梁結(jié)構(gòu)橫向效應(yīng)好、結(jié)構(gòu)簡(jiǎn)單、 承載能力強(qiáng),但豎向效應(yīng)差、維間干擾大、靈敏度較低;十字橫梁結(jié)構(gòu)靈敏度高、易加工, 易于標(biāo)定,但存在維間耦合和徑向效應(yīng);Stewart 平臺(tái)中彈性體采用復(fù)合式結(jié)構(gòu),該類傳 感器具有結(jié)構(gòu)緊湊、承載能力強(qiáng)、誤差不累積等優(yōu)點(diǎn)。
六維力傳感器選型難度大,技術(shù)難點(diǎn)集中于保持優(yōu)良的靜態(tài)性能、動(dòng)態(tài)性能和低維間耦合。 六維力傳感器選型難點(diǎn)在于應(yīng)用多樣性、復(fù)雜性。由于傳感器量程和精度成反比關(guān)系,選 擇合適量程的傳感器才能使精度達(dá)到最大;同時(shí)在復(fù)雜應(yīng)用場(chǎng)景下,傳感器本體是否能適 應(yīng)應(yīng)用場(chǎng)景也需要考慮;此外還要綜合考慮精密機(jī)構(gòu)當(dāng)中的傳感器如何安裝在狹小空間內(nèi), 如何與機(jī)構(gòu)融為一體等問題。六維力傳感器選型四個(gè)核心步驟為確定量程需求——確定使 用環(huán)境——確定機(jī)械出線需求——確定通訊方式。六維力矩傳感器技術(shù)難點(diǎn)集中于需兼顧 優(yōu)良的靜態(tài)性能、動(dòng)態(tài)性能和低維間耦合。未來(lái)六維力矩傳感器需要六維聯(lián)合加載標(biāo)定設(shè) 備等先進(jìn)儀器、動(dòng)態(tài)特性優(yōu)化和矢量運(yùn)算中的解耦算法解決技術(shù)難點(diǎn)。
難點(diǎn)一:六維力傳感器非線性特性顯著,需要更為復(fù)雜的六維聯(lián)合加載標(biāo)定。標(biāo)定是指通 過(guò)加載理論值的載荷并同時(shí)記錄傳感器輸出的對(duì)應(yīng)原始信號(hào)的方式,獲得六維力傳感器內(nèi) 部算法的各個(gè)參數(shù),建立傳感器原始信號(hào)和受力之間的映射關(guān)系。標(biāo)定解耦是六維力傳感 器提高精度的主要方法,因此標(biāo)定工作在傳感器的研發(fā)過(guò)程中扮演著重要角色。現(xiàn)有標(biāo)定 裝置存在較多局限性,如加載載荷有限、無(wú)法進(jìn)行復(fù)合加載、無(wú)法加載所有維度正負(fù)方向、 維間耦合較大等。這些局限性因素限制了六維力傳感器標(biāo)定的有效性,影響其最終使用精 度,只有采用六維力聯(lián)合加載標(biāo)定,才能使傳感器的準(zhǔn)度更好、串?dāng)_更低。
難點(diǎn)二:實(shí)際應(yīng)用條件復(fù)雜,動(dòng)態(tài)性能優(yōu)化算法仍需提升。六維力傳感器使機(jī)器人實(shí)現(xiàn)柔 順化、智能化控制,因此在動(dòng)載荷下性能指標(biāo)要求更高。在實(shí)際的力/力矩測(cè)量過(guò)程中,被 測(cè)信號(hào)大多是動(dòng)態(tài)信號(hào),如機(jī)器人打磨拋光時(shí)的接觸力、物體高速運(yùn)動(dòng)過(guò)程中的稱重和炮 彈發(fā)射過(guò)程時(shí)的后座力等,這些信號(hào)屬于快速時(shí)變信號(hào),動(dòng)態(tài)性能較差的傳感器跟蹤測(cè)量 這些信號(hào)難度較大。且當(dāng)前動(dòng)態(tài)性能的分析方法很難獲得完全意義的沖擊信號(hào)和階躍信號(hào), 造成感應(yīng)系統(tǒng)的精度下降。當(dāng)前業(yè)界主要使用優(yōu)化自身結(jié)構(gòu)、形狀等方法提高動(dòng)態(tài)性能, 國(guó)內(nèi)外學(xué)者還嘗試?yán)脛?dòng)態(tài)補(bǔ)償濾波器、遺傳算法、神經(jīng)網(wǎng)絡(luò)算法等智能算法來(lái)提高傳感 器的動(dòng)態(tài)性能。
難點(diǎn)三:維間耦合問題無(wú)法徹底避免,解耦算法紛繁復(fù)雜。理想的六維力傳感器,每一方 向輸出通道的電壓值僅取決于該方向作用力/力矩的大小,與其余五個(gè)方向作用力/力矩大 小無(wú)關(guān)。但是由于傳感器的結(jié)構(gòu)設(shè)計(jì)、機(jī)械加工的精度、貼片技術(shù)、應(yīng)變片橫向效應(yīng)與檢 測(cè)方式等方面的原因,幾乎每一維作用到傳感器上的力/力矩分量都會(huì)對(duì)傳感器的各路輸出 信號(hào)產(chǎn)生影響,造成維間耦合問題。因此需要解耦算法來(lái)對(duì)六維力傳感器的輸出進(jìn)行解耦, 消除維間干擾,提高傳感器的測(cè)量精度。但當(dāng)前對(duì)于多維力傳感器的解耦問題并沒有統(tǒng)一 的處理方法,需根據(jù)實(shí)際情況及傳感器結(jié)構(gòu)進(jìn)行選擇和優(yōu)化。
六維力傳感器+本體感知帶來(lái)機(jī)器人手部物品姿態(tài)估計(jì)新解法
位姿估計(jì)是機(jī)器人領(lǐng)域重要問題,特殊環(huán)境下視覺反饋算法估計(jì)物品姿態(tài)可靠性較差。早 期位姿估計(jì)算法包括模板匹配和特征點(diǎn)檢測(cè),前者預(yù)構(gòu)建目標(biāo)位姿模板庫(kù),檢索得到最相 似模板圖像對(duì)應(yīng)位姿;后者提取目標(biāo)二維圖像特征,構(gòu)建關(guān)鍵點(diǎn)匹配后使用 N 點(diǎn)透視法解 算。這兩種方法依賴物體表面顏色紋理,受環(huán)境因素影響大。之后三維相機(jī)在機(jī)器人視覺 領(lǐng)域得到應(yīng)用,引入場(chǎng)景三維幾何信息提高目標(biāo)位姿估計(jì)精度,但其需要人工設(shè)計(jì)圖像特 征提取方式,泛化性能差。近期 PoseCNN 構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)自動(dòng)提取圖像特征,采用端 到端的方式回歸物體三維位姿,但總體來(lái)看基于視覺系統(tǒng)的位姿估計(jì)算法應(yīng)用場(chǎng)景受到較 大限制,在視覺被阻礙的環(huán)境中(狹窄空間進(jìn)行精細(xì)裝配或操作)估計(jì)結(jié)果可靠性較差。
六維力傳感器搭配本體感知提供機(jī)器人手部物品姿態(tài)估計(jì)新解法。2023 年 7 月,RSS 會(huì) 議上刊登了機(jī)器人感知手部物品姿態(tài)解決方案的論文,密歇根大學(xué)機(jī)器人系的 Andrea Sipos 和 Nima Fazeli 利用機(jī)器人本體感知(自身關(guān)節(jié)處扭矩傳感器的感知反饋)以及手 腕上六維力傳感器的觸覺反饋,并使用接觸粒子濾波器算法,定位接觸位置并估計(jì)物體姿 態(tài),簡(jiǎn)稱 SCOPE,該方法可精確的完成接觸位置的確定和物體姿態(tài)的估計(jì),有望推動(dòng)人 形機(jī)器人的位姿估計(jì)能力。
SCOPE 可精準(zhǔn)確定接觸位置,快速迭代估計(jì)物體姿態(tài)。SCOPE 方法是在接收到六維力 傳感器和關(guān)節(jié)扭矩傳感器的信號(hào)數(shù)據(jù)后,使用接觸粒子濾波器處理,完成物體姿態(tài)識(shí)別。 上述論文中的實(shí)驗(yàn)選用來(lái)源于德國(guó)宇航局的 Franka Emika Panda 機(jī)器人,其是一款高性 能七軸協(xié)作機(jī)器人,每個(gè)關(guān)節(jié)都配有扭矩傳感器,力控性能在同類型機(jī)器人里面處于領(lǐng)先 地位,手腕的六維力傳感器則是美國(guó)企業(yè) ATI 生產(chǎn)。在估計(jì)過(guò)程中雖然初始分布有較大的 誤差和高方差,但 SCOPE 可以在短短幾次迭代中以低方差估計(jì)物體姿態(tài)。并且實(shí)驗(yàn)發(fā)現(xiàn), 即使對(duì)于較小的,非凸形狀的工具,SCOPE 方法依然可以給出較為精確的姿態(tài)估計(jì)結(jié)果。
使用接觸粒子濾波器算法進(jìn)行采樣定位,提供準(zhǔn)確力信息。現(xiàn)有的物體姿態(tài)估計(jì)信號(hào)處理 算法可以分為三大類:幾何匹配、概率方法和機(jī)器學(xué)習(xí)方法。目前主流方法是使用概率方 法(粒子過(guò)濾器、SLAM 和蒙特卡洛方法等)來(lái)估計(jì)物體的姿勢(shì),其中粒子濾波器所需計(jì) 算量小,且在非線性情況下表現(xiàn)較好,常被用于定位、跟蹤物體等問題。Sipos 和 Fazeli 使用了兩個(gè)互補(bǔ)的接觸粒子濾波器(Contact Particle Filter):一個(gè)用于估計(jì)接觸位置,另 一個(gè)用于估計(jì)物體姿態(tài),都是在接收到關(guān)節(jié)處扭矩傳感器和手腕處六維力傳感器的信號(hào)后 進(jìn)行概率分布的計(jì)算更新,幫助去除來(lái)自環(huán)境的噪聲和不確定性,得到更準(zhǔn)確和可靠的接 觸力信息。
MultiSCOPE 實(shí)現(xiàn)多個(gè)接觸跨物體姿態(tài)估計(jì),助力機(jī)器人使用人類工具。Sipos 和 Fazeli 進(jìn)一步于 2023 年 6 月提出 MultiSCOPE,該方法使用本體感知和手腕處六維力傳感同時(shí) 估計(jì)兩個(gè)物體在未知配置情況下被兩個(gè)協(xié)同手臂抓取的姿態(tài)。該方法由單個(gè)物體的感知擴(kuò) 展到多接觸的交互,實(shí)現(xiàn)了跨動(dòng)作的物體姿態(tài)估計(jì)。在該實(shí)驗(yàn)中機(jī)器人手持扳手可以擰動(dòng) 一個(gè)螺釘,即機(jī)器人既可以感受到直接接觸的扳手形態(tài),又可以通過(guò)扳手和另一只手臂上 的力傳感器感受到螺釘?shù)臓顟B(tài)變化,估計(jì)兩個(gè)抓取物體的姿態(tài),從而完成多任務(wù)。該實(shí)驗(yàn) 的成功使機(jī)器人具備多物體的感知能力,有助于機(jī)器人操作人類工具完成多項(xiàng)任務(wù),提高 人形機(jī)器人多場(chǎng)景下的通用性。
六維力傳感器+本體感知技術(shù)使姿態(tài)估計(jì)向多模態(tài)+高效連續(xù)性發(fā)展。基于六維力傳感器和 本體感知的物體姿態(tài)估計(jì)技術(shù)為機(jī)器人感知并抓取物體提供了新解法。該方法可與其他方 法完成多模態(tài)互補(bǔ),在無(wú)遮擋場(chǎng)景中,視覺感知方法可以與 SCOPE 共同使用以提高性能: 比如機(jī)器人可以使用視覺反饋來(lái)初始化作用域和初步識(shí)別,提高感知效率。SCOPE 技術(shù) 未來(lái)的發(fā)展方向也會(huì)集中于減少收斂到準(zhǔn)確的物體姿態(tài)估計(jì)所需的動(dòng)作數(shù)量和連續(xù)的下一 步動(dòng)作選擇算法,以提高機(jī)器人抓取物體的連續(xù)性和高效性。SCOPE 與六維力傳感器的 結(jié)合有望加快人形機(jī)器人實(shí)際應(yīng)用。
執(zhí)行層:剛性驅(qū)動(dòng)器方案成熟,準(zhǔn)直驅(qū)方案滲透率有望提高
特斯拉采用成熟的剛性驅(qū)動(dòng)器方案,未來(lái)準(zhǔn)直驅(qū)方案滲透率有望提高。機(jī)器人關(guān)節(jié)驅(qū)動(dòng)器 按動(dòng)力來(lái)源可以分為液壓、氣動(dòng)、電驅(qū)等。液壓雖然功率高,但可靠性和精度低,噪音大, 成本高;氣動(dòng)柔順性好,安全性高,但精度差,時(shí)滯高。電驅(qū)因其精度、安靜、高效方面 的優(yōu)勢(shì)逐漸成為主流,其經(jīng)過(guò) 30 多年的發(fā)展,經(jīng)歷了從剛性驅(qū)動(dòng)器、彈性驅(qū)動(dòng)器到準(zhǔn)直 驅(qū)驅(qū)動(dòng)器的過(guò)程。特斯拉采用的是最早推出,也是相對(duì)成熟的剛性驅(qū)動(dòng)器方案。如果電機(jī) 和減速器性能沒有大幅提升的情況下,在雙足機(jī)器人領(lǐng)域剛性驅(qū)動(dòng)器將會(huì)逐步被取代。近 幾年新興的準(zhǔn)直驅(qū)驅(qū)動(dòng)器技術(shù)發(fā)展迅速,未來(lái)有望替代傳統(tǒng)的剛性驅(qū)動(dòng)器。
剛性驅(qū)動(dòng)器技術(shù)相對(duì)成熟,整體設(shè)計(jì)較難創(chuàng)新。1983 年,早稻田大學(xué)研究出剛性驅(qū)動(dòng)器 (TSA),自此 TSA 在雙足仿人機(jī)器人上廣泛應(yīng)用。結(jié)構(gòu)上,TSA 是常規(guī)無(wú)刷電機(jī)驅(qū)動(dòng)高 傳動(dòng)比減速器,有些在電機(jī)端增加剎車,在減速器和輸出端增加高剛性力矩傳感器。力矩 測(cè)量上,TSA 是基于電流或應(yīng)變片式力矩傳感器。控制上,TSA 控制簡(jiǎn)單,精度高。功率 和效率方面,TSA 無(wú)功率可調(diào),效率較低,安全性較差。TSA 整體設(shè)計(jì)方面已經(jīng)較難有創(chuàng) 新,在合適工作區(qū)間內(nèi)的最大輸出功率密度只能到 200-300W/kg,遠(yuǎn)沒有達(dá)到動(dòng)物肌肉的 500W/kg,同時(shí)也解決不了機(jī)器人受外部沖擊時(shí)零部件強(qiáng)度問題,目前的研究集中在優(yōu)化 設(shè)計(jì)上。
彈性驅(qū)動(dòng)器技術(shù)路線多樣,多數(shù)結(jié)構(gòu)和控制復(fù)雜。動(dòng)物利用剛?cè)岵?jì)的肌肉骨骼系統(tǒng)在運(yùn) 動(dòng)過(guò)程中儲(chǔ)存和釋放能量,調(diào)節(jié)能量在時(shí)間和功率密度上的不匹配,提高關(guān)節(jié)爆發(fā)力,同 時(shí)能夠?qū)崿F(xiàn)落地緩沖。1995 年,MIT 推出彈性驅(qū)動(dòng)器來(lái)模擬肌肉系統(tǒng)功能,使關(guān)節(jié)表現(xiàn)出 柔順、安全和高能量效率特性,目前已演化出 SEA、PEA、CEA 和 MEA 多種結(jié)構(gòu)。彈性 驅(qū)動(dòng)器多在剛性執(zhí)行器的基礎(chǔ)上串聯(lián)或并聯(lián)彈性體。力矩測(cè)量上與剛性傳感器較為類似。 控制上,多數(shù)彈性驅(qū)動(dòng)器方案結(jié)構(gòu)與控制復(fù)雜,精度一般。綜合來(lái)看,由于彈性體引入, 系統(tǒng)為欠驅(qū)動(dòng),給控制帶來(lái)了難度,尤其在機(jī)器人腿部使用,機(jī)器人整機(jī)的運(yùn)動(dòng)控制比較 難實(shí)現(xiàn)。
準(zhǔn)直驅(qū)驅(qū)動(dòng)器是新興技術(shù),編碼器和電機(jī)功率密度為其主攻方向。受限于工藝和技術(shù),電 機(jī)直驅(qū)的扭矩密度不能滿足機(jī)器人應(yīng)用的需求,因此,2016 年 Wensing 等推出準(zhǔn)直驅(qū)驅(qū) 動(dòng)器(PA),采用電機(jī)加低傳動(dòng)比減速器(如行星減速器)的方案,實(shí)現(xiàn)高帶寬力控和良 好的抗沖擊能力。2023 年 UCLA 也采用了類似的方案設(shè)計(jì)了不同于特斯拉的新型人形機(jī) 器人結(jié)構(gòu)。結(jié)構(gòu)上,PA 主要由高扭矩密度電機(jī)、低傳動(dòng)比減速器、編碼器和控制板等組 成。力矩測(cè)量上,PA 應(yīng)用電流環(huán)檢測(cè)。控制和效率上,PA 精度高,效率高。安全性上, PA 由于具有反驅(qū)特性,安全性好。PA 未來(lái)主攻方向是編碼器技術(shù)的創(chuàng)新和電機(jī)功率密度 的提高。
剛性驅(qū)動(dòng)器 VS 準(zhǔn)直驅(qū)驅(qū)動(dòng)器,成熟系統(tǒng) VS 高效新解法。結(jié)構(gòu)布局方面,剛性驅(qū)動(dòng)器是 常規(guī)無(wú)刷電機(jī)驅(qū)動(dòng)高傳動(dòng)比減速器,直接帶動(dòng)輸出端,有些設(shè)計(jì)在電機(jī)端增加剎車,在減 速器和輸出端增加高剛性力傳感器,準(zhǔn)直驅(qū)驅(qū)動(dòng)器是高扭矩密度電機(jī)驅(qū)動(dòng)低傳動(dòng)比減速器, 輸出端具有小慣量特性;力矩測(cè)量方面,剛性驅(qū)動(dòng)器是基于電流或應(yīng)變片式力矩傳感器, 準(zhǔn)直驅(qū)驅(qū)動(dòng)器是應(yīng)用電流環(huán)檢測(cè);控制方面,剛性驅(qū)動(dòng)器控制相對(duì)簡(jiǎn)單,精度高,準(zhǔn)直驅(qū) 驅(qū)動(dòng)器控制簡(jiǎn)單,精度相比剛性驅(qū)動(dòng)器來(lái)說(shuō)較低;能量特性方面,剛性驅(qū)動(dòng)器的效率較低, 而準(zhǔn)直驅(qū)的效率較高。安全性方面,剛性驅(qū)動(dòng)器的安全性比較差,準(zhǔn)直驅(qū)驅(qū)動(dòng)器由于具有 反驅(qū)特性,安全性好。
責(zé)任編輯:彭菁
-
執(zhí)行器
+關(guān)注
關(guān)注
5文章
375瀏覽量
19323 -
智能系統(tǒng)
+關(guān)注
關(guān)注
2文章
392瀏覽量
72423 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1205瀏覽量
24644 -
人形機(jī)器人
+關(guān)注
關(guān)注
2文章
423瀏覽量
16486 -
大模型
+關(guān)注
關(guān)注
2文章
2328瀏覽量
2483
原文標(biāo)題:人形機(jī)器人政策利好
文章出處:【微信號(hào):AIOT大數(shù)據(jù),微信公眾號(hào):AIOT大數(shù)據(jù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論