電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)近日,初創(chuàng)公司Mentee Robotics展示了旗下首款人形機(jī)器人的原型Menteebot。相較于波士頓動(dòng)力的電動(dòng)Atlas,以及特斯拉的擎天柱(Optimus),Menteebot名聲并不響。
不過,Mentee Robotics還是有名頭的,因?yàn)樗荕obileye核心創(chuàng)始人Amnon Shashua的另一個(gè)創(chuàng)業(yè)項(xiàng)目,該公司的另外兩位創(chuàng)始人分別為Mobileye首席技術(shù)官ShaiShalev-Shwartz、前FacebookAI研究總監(jiān)LiorWolf。
Menteebot最大的特色是據(jù)稱在所有操作層都接入了AI,注意這里面的區(qū)別,并不是圍繞AI模型打造一個(gè)機(jī)器人的“大腦”,而是在所有操作層都利用AI賦能。
全身布滿AI的Menteebot
Mentee Robotics表示,Menteebot是一款“可以指導(dǎo)的個(gè)性化人工智能機(jī)器人”,具備與人類相似的平衡和控制能力。剛剛提到,和以往的人形機(jī)器人有所不同,Menteebot渾身都布滿了AI,搭載有豐富的AI模型和AI算法,這讓Menteebot能夠更加受益于多模態(tài)AI模型的發(fā)展。同時(shí),人類可以使用自然語言來控制它。
通過演示視頻,Menteebot超強(qiáng)的AI能力至少表現(xiàn)在兩個(gè)方面,其一是更加自然的溝通能力,其二是超強(qiáng)的運(yùn)動(dòng)能力。
先看溝通能力,Menteebot搭載了更加豐富的自然語言模型,這使得它的控制不再受限于既定的指令。過往,人形機(jī)器人在溝通時(shí),存在模型內(nèi)和模型外能力的差距,此前我們也提到這個(gè)問題,當(dāng)某一項(xiàng)指令屬于模型訓(xùn)練范圍內(nèi)時(shí),人形機(jī)器人能夠表現(xiàn)出超強(qiáng)的能力,不過當(dāng)指令超出模型訓(xùn)練范圍之后,人形機(jī)器人就會(huì)顯得“不知所措”。
據(jù)悉,Menteebot可以與人類進(jìn)行自然的對(duì)話和交流。用戶只需通過自然語言向機(jī)器人發(fā)出命令,它便能理解并執(zhí)行相應(yīng)的任務(wù)。這其實(shí)要得益于Menteebot“大腦”模型中更加強(qiáng)大的人工智能算法、大型語言模型和軟件。Mentee Robotics稱,基于NeRF的實(shí)時(shí)三維映射和定位、復(fù)雜環(huán)境中的動(dòng)態(tài)導(dǎo)航等技術(shù),可實(shí)現(xiàn)復(fù)雜的推理,以完成任務(wù)和快速學(xué)習(xí)新任務(wù)。
Mentee Robotics特別提到,完成部署的Menteebot可以進(jìn)行更高級(jí)的訓(xùn)練以應(yīng)對(duì)復(fù)雜的任務(wù)或者場(chǎng)景,此時(shí)軟件會(huì)不斷模擬任務(wù)直到掌握為止,隨后機(jī)器人便能在現(xiàn)實(shí)世界中完成任務(wù)。
再看運(yùn)動(dòng)能力,Menteebot能夠完成更加復(fù)雜的行走姿態(tài),比如奔跑、側(cè)向行走,甚至轉(zhuǎn)身;也能夠執(zhí)行非常精細(xì)的操作,它能夠準(zhǔn)確地將餐具遞給人類,這得益于其手臂和手部的全方位運(yùn)動(dòng)能力和精確性。
為了提升Menteebot的行動(dòng)力,Mentee Robotics在這款機(jī)器人上集成了尖端的Sim2Real學(xué)習(xí),可實(shí)現(xiàn)逼真的步態(tài)和手部運(yùn)動(dòng),具有與人類相同的平衡和控制力,在舉起重物時(shí)還會(huì)調(diào)整步態(tài)。
Mentee Robotics表示,Menteebot機(jī)器人的量產(chǎn)版預(yù)計(jì)將于2025年第一季度部署,將由純視覺傳感、支持“前所未有的”靈活性的專用電動(dòng)馬達(dá)、完全集成的人工智能提供動(dòng)力。預(yù)計(jì)將分為家用版和商業(yè)版兩個(gè)版本。
Menteebot給人形機(jī)器人硬件創(chuàng)新帶來啟示
通過在所有操作層都接入AI,Menteebot機(jī)器人展示了強(qiáng)大的能力,包括溝通和運(yùn)動(dòng)。但這其實(shí)也給模型和算法的部署提出了更高的要求,包括Menteebot“大腦”里的核心芯片以及其他執(zhí)行單元里的芯片。
對(duì)于“大腦”里的核心芯片,首先要能夠支持多模態(tài)的AI大模型部署,并且需要對(duì)未來融入進(jìn)來的新模態(tài)留出部署空間。目前,應(yīng)用于人形機(jī)器人的大模型包括圖像識(shí)別模塊、語音識(shí)別模塊、文字轉(zhuǎn)語音模塊、對(duì)話系統(tǒng)模塊、導(dǎo)航模塊、多模態(tài)系統(tǒng)模塊和強(qiáng)化學(xué)習(xí)模塊等。核心芯片是這些模塊的載體,對(duì)于上述模塊,或者叫模態(tài)都需要能夠支持,即便是匯總歸結(jié),核心芯片也需要能夠完整支持視覺模塊、導(dǎo)航模塊、語言模塊和決策模塊這四大能力,這對(duì)核心芯片的算子豐富度提出了高要求。Menteebot發(fā)布之后,預(yù)計(jì)強(qiáng)化學(xué)習(xí)將上升為第五大基礎(chǔ)模塊,屆時(shí)軟件能力會(huì)不斷增強(qiáng),硬件冗余將成為一項(xiàng)重要的指標(biāo)。
第二個(gè)就是執(zhí)行單元如何強(qiáng)化AI能力,這就對(duì)MCU、FPGA等部件提出了新要求。就以MCU來說,當(dāng)前這一產(chǎn)品類別一個(gè)重要的發(fā)展方向就是:能夠在MCU上部署和執(zhí)行AI程序。實(shí)際上,產(chǎn)業(yè)界早就開始嘗試將AI部署在盡可能小的控制系統(tǒng)上,不過這個(gè)過程中也有很多挑戰(zhàn)。
首先要將AI模型部署在MCU上,就需要將這些模型轉(zhuǎn)化為C/C++代碼,這就需要對(duì)模型進(jìn)行非常精準(zhǔn)的量化,既要能夠保證模型的能力,同時(shí)也要盡量避免浮點(diǎn)運(yùn)算。這對(duì)MCU編譯器也有很高的要求,因?yàn)榱炕蟠a要部署到MCU里,需要經(jīng)過編譯器。
其次,當(dāng)MCU運(yùn)行AI模型之后,不能夠過度占用片上資源,也不能有太高的功耗。低功耗是至關(guān)重要的,因?yàn)樵谝粋€(gè)系統(tǒng)內(nèi),MCU器件的數(shù)量有很多,太高的功耗會(huì)影響系統(tǒng)整體的續(xù)航能力。
有人可能會(huì)說,MCU AI大可不必,但是要實(shí)現(xiàn)即時(shí)的AI效果,這是非常有必要的。
結(jié)語
Menteebot的發(fā)布堪稱人形機(jī)器人行業(yè)的黑馬,和電動(dòng)Atlas一樣讓人震撼。在所有操作層都接入AI,這是一個(gè)先進(jìn)的理念,也需要芯片作為核心硬件能夠更好地應(yīng)對(duì),其中高性能計(jì)算芯片需要支持多模態(tài),且強(qiáng)化學(xué)習(xí)模塊預(yù)計(jì)將上升為核心模塊;MCU AI對(duì)于即時(shí)性的提升是很有幫助的,但也很有挑戰(zhàn)性。-
機(jī)器人
+關(guān)注
關(guān)注
210文章
28191瀏覽量
206505 -
AI
+關(guān)注
關(guān)注
87文章
30106瀏覽量
268399 -
人形機(jī)器人
+關(guān)注
關(guān)注
2文章
421瀏覽量
16483
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論