人工智慧開啟了新一代機器人技術 Robotics 2.0,最大改變是從原先人工編寫程式而來的自動化,邁向了真正的自主學習。本文將嘗試揭開人工智慧(AI)應用的神秘面紗,協助讀者瞭解 AI 機器人將如何影響我們的未來,并釐清我們常常聽到,但卻著墨不多、甚至根本尚未全然理解的主題。
本文為「Robotics 2.0」系列文章的第一篇,講述機器人技術與 AI 對于各大產業和未來工作的影響。我們將討論 AI 將如何釋放機器人技術的潛力,這項新技術的挑戰和機會,以及這一切將如何影響我們的生產力、就業狀況、甚至日常生活。在人工智慧被大肆宣傳的當下,我們希望透過這些文章鼓勵更有建設性和全面性的探討。
重新定義機器人:揭開次世代 AI 機器人 Robotics 2.0 的神秘面紗
提到機器人,我們總有各式各樣天馬行空的想像:從 Softbank(軟銀集團)的社交機器人 Pepper、能輕松后空翻的 Boston Dynamics 公司機器人 Atlas、《魔鬼終結者》(Terminator)系列電影的人造人殺手,到電視影集《西方極樂園》(West World)中隨處可見、栩栩如生的擬真機器人角色。
我們常常聽到兩極化的觀點;有些人傾向高估機器人模仿人類的能力,認為機器終將取代人類,有些人則對新研究和技術的潛力太過悲觀。
在過去一年之中,許多創業、科技、新創業界的朋友都曾問過我,在 AI,尤其是深度強化學習和機器人技術的領域,究竟有哪些「實際」進展?
令人最為好奇的是:
AI 機器人和傳統機器人有什么不一樣?AI 機器人是否真有顛覆各大產業的潛力?它的能力和限制又是什么?
看來,想要瞭解現在的技術進步和產業格局,是出乎意料的困難,更不用說要對未來做出預測。藉由這篇文章,我嘗試揭開人工智慧應用于機器的神秘面紗,釐清這個我們常常聽到,但卻著墨不多、或根本未全然理解的主題。
首先必須回答的基本問題:什么是 AI 機器人(AI-enabled Robotics)?它們又有什么獨特之處?
機器人演進:從自動化到自主化
「機器學習解決了以往『對電腦困難,對人來說卻容易』的各種問題,或以更容易理解的方式來說,就是解決了『人類很難讓電腦也理解』的問題。」
— — Benedict Evans,安霍創投(a16z)
AI 所造就的機器人技術領域,最大成果是從原先的「自動化」(工程師藉由程式設計編寫規則,讓機器人遵守)邁向了真正的「自主學習」。
如果機器人只需要處理一件事情,那么,它到底有沒有人工智慧,差別其實看不出來;但是,如果機器人需要處理各式各樣的任務、或是回應人類與環境的變化,就需要一定程度的自主性才能勝任。
我們不妨借用下列不同等級的自駕車定義,一併解釋機器人的演變:
Level 0 — 無自動化:由人類操作機器,沒有機器人的參與。(機器人的普遍定義,是指有能力自行從事復雜動作的可程式化擬人機械)。
Level 1 — 單一自動化運作:單一功能已自動化,但不使用環境資訊。這是自動化與制造業中傳統的機器人使用現況。透過程式編輯,機器人能夠以高精度與速度重復執行特定工作;但直至目前為止,多數實際運用的機器人都無法感知或應變環境的變化。
Level 2 — 部分自動化:透過環境感知所輸入的特定功能,協助機器進行決策。例如某些機器人透過視覺感應器,識別并應付不同的對象:然而,傳統的電腦視覺,需要對每個對象進行預先登記和清楚的指示,且機器人還是缺乏處理變更、意外狀況、或是新對象的能力。
Level 3 — 條件式自主:機器控制了所有的環境監控行為,但仍需要人為檢查關注與(即時)介入。
Level 4 — 高度自主:在某些情況下、或是定義的區域內完全自主。
Level 5 — 完全自主:在任何狀況下均可完全自主,不需人為介入。
我們現在處于哪一種自主等級呢?
現在,工廠里多數機器人都是透過開放式迴路、或是非回饋方式予以控制。這意味著它們的運作與感測器回饋各自獨立、彼此互不影響(level 1)。
少數在工廠中的機器人,會根據感測器回饋而調整操作(level 2);此外還有協作型機器人(cobot),他們的操做更加簡單安全,因此能與人類共同作業。然而,相較于產業用機器人,這種機器人的精確度和速度卻相形失色。另外,雖然協作型機器人的程式化相對簡單,但它們仍然不具有自主學習性;每當工作內容或環境有所變動時,就需要由人類手動引導協作機器人進行調整,或是重新編寫程式,機器本身無法自主舉一反三,彈性應變。
深度學習(Deep Learning)和強化學習(Reinforcement Learning)能幫助機器人自主處理各種物件,將人類的介入程度降到最低。
我們已經開始看到一些使用 AI 機器人(level 3/4)的前導試行專案,例如「倉儲揀貨」就是一個很好的例子。在貨運倉庫中,員工需要根據客戶需求,將數百萬種不同的產品放入箱子里。傳統的電腦視覺沒辦法處理如此廣泛的物品類別,因為每個物品都需要事先登錄、并針對機器人需要採取的動作,先進行程式設計。
然而,現在由于深度學習和強化學習技術,機器人能夠開始自主學習處理各種物件,降低人類的介入程度。在機器人的學習過程中,可能會出現它未曾遇過的某些貨品,而需要人類的協助或示范(level 3)。但是,隨著機器人搜集更多的資料、從試驗和錯誤中學習(level 4),演算法也將日益改善,邁向完全自主。
就像自駕汽車產業一樣,機器人新創公司也採取了不同的策略:有些公司看好人類和機器人之間的合作,專注于 level 3 的研發;有些公司則相信,機器終將實現真正的完全自主,于是他們跳過 level 3,直接著眼于 level 4、甚至到 level 5。
這也是為什么我們很難評估現在產業自主程度的原因之一。
新創公司有可能自稱致力于研究 level 3/4 的自主系統,但實際上卻是大量委外,以人工遠端操控機器。在無法了解其內部軟體及 AI 產品發展程度的前提下,光從機器外觀看不出遠端操控和自主學習的差別。另一方面,目標為 level 4/5 的新創公司,萬一無法在短時間取得理想結果,可能反而降低了客戶的早期採用意愿、并導致早期階段的資料搜集更加困難。
在本文的后半部分,我將進一步討論新創公司的不同的商業策略思考。
AI 機器人的崛起:運用范圍不再侷限于倉儲管理
有趣的是,機器人的人工智慧應用潛能甚至高于無人車,因為機器人有各式各樣的應用與產業,因此從某種意義上說,機器人理當比汽車更容易實現 level 4 目標。
AI 機器手臂開始在倉庫中被採用,就是最好的例子。因為倉庫屬于「半受控」的環境,不確定性相對低。另外,揀貨作業雖然關鍵、但能容許錯誤。
至于自主居家型或手術機器人,則要等到更遙遠的未來才能實現;畢竟相關環境的變數更多,且有些任務具備不可逆性,以及一定程度的危險性。但是,可以預見的是,隨著技術精度、準確性、可靠性的與時俱進,我們將看到更多產業採用 AI 機器人。
許多產業還沒有使用機械手臂,主要原因在于傳統機器人和電腦視覺的限制。
目前世界上只有大約 300 萬臺機器手臂,其中大多數從事搬運、焊接、裝配等任務。到目前為止,除了汽車業和電子業以外,倉儲、農業和其他產業,幾乎都還沒有開始使用機械手臂;主要原因,就在于上述傳統機器人和電腦視覺的限制。
在接下來的幾十年中,隨著深度學習(DL)、強化學習(RL)、以及云端技術釋放出的機器人潛力,我們將看到新一代機器人帶來的爆炸式增長、并改變產業格局。其中,AI 機器人的成長契機有哪些?新創公司和現有業者,又採取了哪些不同的方法和商業模式,來因應新科技帶來的變化?
新世代 AI 機器人新創公司產業概況
接下來,我會介紹不同市場區隔中的幾間范例公司。這樣的概略介紹,當然無法涵蓋所有企業的狀況;歡迎你提供其他公司及應用案例,一起讓內容更加完備。
AI/Robotics 新創公司市場概況
研究新世代機器人新創產業結構,可以看到兩種截然不同的商業模式:垂直應用與水平應用。
1. 垂直應用
第一種是垂直應用:硅谷當地多數的新創公司,專注于為特定的垂直市場開發解決方案;如電子商務物流、制造業、農業等等。
這種提供完整解決方案的作法相當合理,畢竟相關技術還處于萌芽階段;公司不依賴他人提供關鍵模組或元件,而是建構端對端的解決方案。這種垂直整合的解決方案能更快進入市場,也能確保公司更全面掌握終端使用者的案例與效能表現。
但是,要找到像「倉庫分揀」這樣相對容易實現的應用案例,則沒有那么容易。倉庫揀貨是相對簡單的工作,客戶的投資意愿與技術可行性都較高,而且每個倉庫幾乎都有相同的揀貨需求。
但在其他產業(如制造業)中,裝配任務可能因工廠而各不相同;另外,在制造業中執行的任務,也需要更高的精度和速度,技術上相對困難。
目前具有學習能力的機器人,仍無法達到與封閉迴路機器人相同的精度。
盡管機器學習能讓機器人與時俱進,但目前透過機器學習運作的機器人,仍無法達到與封閉迴路機器人相同的精度,因為它需要累積嘗試錯誤的經驗,從錯誤中學習,逐漸進步。
這點說明了為什么 Mujin 和 CapSen 機器人這樣的新創公司,并未採用深度強化學習,反而選擇使用傳統電腦視覺。
然而,傳統電腦視覺要求每個物件都要事先登錄,終究還是缺乏擴充和適應變化的能力。一旦深度強化學習(DRL)達到了效能門檻、逐步成為產業主流,這種傳統方法終究會變得無用武之地。
此外,這些新創公司的另一個問題,在于它們的價值往往遭到高估。我們經常看到,新創公司在硅谷籌集了數千萬美元資金,卻無法承諾創造出任何真正具體的收入流。
對于創業者來說,「描繪」深度強化學習的美好未來,再容易也不過了;但現實則是,我們還需要數年的時間才能達到如此的成果。盡管這些公司離創造獲利還有一段距離,硅谷的創投仍愿意繼續押寶在這些人才優秀、技術先進的團隊上。
2. 水平應用
另一方面,水平應用則是更實用、卻比較罕見的模式。我們可以簡單將機器人技術簡化為感測(輸入)、處理、驅動(輸出)三個部分;除此之外,還有開發工具。(這里使用的「處理」一詞,同時概略涵蓋了控制器、機器學習、作業系統和機器人模組等等,各種不屬于感測或驅動的其他項目。)
我認為未來,這個領域將最具增長潛力。對于機器人的用戶來說,破碎而零細的市場是棘手的問題;因為所有的機器人制造商,都各自推展自家開發的語言和介面,使得系統整合商與終端使用者,都很難將機器人與相關系統進行整合。
隨著產業的逐漸成熟,有越來越多機器人應用到了汽車和電子廠以外的領域;因此我們更加需要標準的作業系統、通訊協定、介面,從而提高效率、并縮短上市時間。
舉例來說,美國波士頓的幾家新創公司正在研究相關的模組;例如 Veo Robotics 公司開發的安全模組,能讓工業機器人更安全地和人類協同工作;Realtime Robotics 公司則提供加速了機械手臂路徑的解決方案。
評論
查看更多