當(dāng)我還在跟ChatGPT吹牛尬聊時(shí),有人已經(jīng)在拿它操控機(jī)器人了。
不是別人,正是OpenAI的金主爸爸、不久前剛拿ChatGPT“重新發(fā)明搜索引擎”的微軟。
到目前為止,開發(fā)者調(diào)教機(jī)器人不僅技術(shù)門檻高,還道阻且長:
工程師需要在工作流程回路中,不斷手寫新代碼和規(guī)范來糾正機(jī)器人行為;另外,操控不同的機(jī)器人可能需要不同的編程語言和環(huán)境。
而在ChatGPT的幫助下,工程師甚至不用手寫代碼——直接用人話描述想做什么,AI就能自動翻譯成機(jī)器語言。
這意味著,一方面專業(yè)人士與機(jī)器人的交互效率起飛;另一方面,技術(shù)門檻也降低一大截,外行人甚至也能參與調(diào)試,創(chuàng)造出更多使用方法。
舉個(gè)簡單的例子:讓無人機(jī)自動檢查貨架。
首先,操作者只需用自然語言給ChatGPT提出要求;然后,AI就能自動翻譯成代碼,并指揮無人機(jī)行動。(還可以規(guī)定無人機(jī)的飛行路徑。)
難怪特斯拉前AI主管Andrej Karpathy會調(diào)侃:
最新的熱門編程語言是英語。
一個(gè)AI指揮多種機(jī)器人
實(shí)際上,ChatGPT會玩兒的花樣可多了。
比如,一位操作者跟AI說:“我渴了,請幫我找個(gè)喝的。”
此時(shí)AI并不會直愣愣地就去找水了,而是會很機(jī)靈地反問:
請問你想喝哪種?這里有好幾種飲料,比如椰子水、可樂等等。
當(dāng)然操作者也不是吃素的,他并未直接告訴AI選哪個(gè),而是說:“我剛從健身房回來,請幫我找個(gè)健康點(diǎn)兒的飲料。”
然后更神奇的操作就開始了:
AI先是猜測他想喝椰子水,然后自己噼里啪啦寫出一段代碼(甚至還有注釋):
寫完就自己指揮無人機(jī)去找椰子水:
除了無人機(jī),ChatGPT還能輕松操控別的小機(jī)器人,包括攝像頭、機(jī)械臂等等。
比如讓攝像頭在房間里找出能加熱午飯的東西。
還有指揮機(jī)械臂拼出一個(gè)微軟的Logo。(悄悄夾帶私貨)
看到這些,有網(wǎng)友腦洞大開,有人發(fā)問:
他們是不是正在建立無所不能的天網(wǎng)?
還有人甚至調(diào)侃稱,AI可能連發(fā)射核彈的指令都會寫:
不過話說回來,其實(shí)離網(wǎng)友說的這些還差得遠(yuǎn),畢竟現(xiàn)在還是需要人類參與的。
怎么實(shí)現(xiàn)的?
從前文可以看出,這只靈活的AI不僅與人交流暢通無阻,而且和機(jī)器也能快速溝通。
這主要得益于微軟團(tuán)隊(duì)專門開發(fā)的一系列API和高級函數(shù)庫。
他們沒有讓ChatGPT背后的語言大模型(LLM),生成某固定種類的代碼;因?yàn)闄C(jī)器人是個(gè)多元化領(lǐng)域,這樣可能會在不同場景下涉及大量微調(diào)。
而在新穎的操作框架下,不同機(jī)器人,都有自己對應(yīng)的特定函數(shù)庫。
——一個(gè)AI,就能適應(yīng)不同的對象、不同的任務(wù)。
一方面,這些函數(shù)庫,能夠連接到機(jī)器人控制系統(tǒng)中管理底層硬件,以及執(zhí)行基本運(yùn)動的代碼和功能模塊。
另一方面,為了讓ChatGPT也能遵循函數(shù)庫的規(guī)則,預(yù)定義函數(shù)命名就很關(guān)鍵。清晰的函數(shù)名,能讓各API之間建立良好的功能連接,最終生成高質(zhì)量的回答。
其中一項(xiàng)要求,就是所有API名稱必須描述整體功能行為。例如,detect_object(object_name) 函數(shù)可以在內(nèi)部鏈接到OpenCV函數(shù)或計(jì)算機(jī)視覺模型。
設(shè)計(jì)好庫和API后,微軟給ChatGPT編寫了一個(gè)文本提示(prompt),描述目標(biāo)任務(wù),并明確說明函數(shù)庫中哪些函數(shù)可用;另外,這還能規(guī)定ChatGPT生成代碼用哪種編程語言。
值得一提的是,AI生成內(nèi)容效果,和人為提示的質(zhì)量呈正相關(guān)。為此,微軟還開發(fā)了一個(gè)協(xié)作開源平臺PromptCraft,任何人都能在此分享不同類機(jī)器人的Prompt策略。
到此,幕后部署基本完成,然后用戶就能通過“說人話”間接操控機(jī)器人了。
如果想要檢查AI生成的代碼是否有Bug,隨時(shí)都能在聊天框直接檢查,或通過模擬器測試,人類可以用自然語言指導(dǎo)AI進(jìn)行修正。
另外,還能到等到用戶對解決方案滿意為止,再在將ChatGPT生成代碼部署到機(jī)器人上。
最后,如果是你,會想用ChatGPT操控機(jī)器人做些什么呢?
審核編輯 :李倩
-
機(jī)器人
+關(guān)注
關(guān)注
210文章
28212瀏覽量
206556 -
編程語言
+關(guān)注
關(guān)注
10文章
1939瀏覽量
34601 -
ChatGPT
+關(guān)注
關(guān)注
29文章
1548瀏覽量
7496
原文標(biāo)題:ChatGPT已能操控機(jī)器人,工程師連代碼都不用寫,網(wǎng)友:微軟在搞天網(wǎng)?
文章出處:【微信號:vision263com,微信公眾號:新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論