2023年,以聊天機器人ChatGPT爆火為代表,起起伏伏、整體向上的人工智能產業迎來了大模型時代。
回溯過往,人工智能的發展經歷了三個階段:
第一次是上世紀末的專家系統時代,特征是將專家的領域知識轉變為計算機模型,用以推理并得出與專家相同的結論。
第二次是不久前的“機器學習+深度學習”時代,在以CNN、RNN為代表的神經網絡的賦能下,比如車牌識別、人臉識別這類計算機視覺應用,識別準確率從過去的92%、93%,提高到了99%以上,在該階段有部分產品徹底實現了產品化、規模化應用。
第三次即是眼下的大模型時代,起源是2017年谷歌發表的一篇論文《AttentionIsAllYouNeed》,里面提出了革命性的Transformer深度神經網絡,一舉將深度學習的模型參數提高到了上億級別,并且在之后的迭代發展中,模型參數被逐步提升到了幾十億、幾百億甚至幾千億,意味著模型的復雜程度和學習能力逐步提高,越來越有接近人的表現。
換句話說,大模型產品并非采用上個時代模型參數受限的CNN、RNN架構,而是借助Transformer另起爐灶,達到了一種類似“小孩開竅”的「涌現」現象——當模型突破某個規模時,能力水平直線上升。
這樣一來,大模型能做的事情變得更多了,并且效果更好,比如文本生成、語言理解、知識對話、邏輯推理等等。
再由于Transformer是一項新技術,無論是傳統玩家還是新興企業都處在接近的起跑線,所以業界參與大模型的玩家非常多、類型非常廣,各方都希望通過大模型抓住新一輪產業機會。
此時,為了深入探究大模型與物聯網行業是否存在關聯?大模型是否將創新IoT產品或改善企業流程?物聯傳媒記者特別采訪了中科創達物聯網事業群副總裁楊新輝先生,基于中科創達近來在大模型領域的諸多動作,詢問行業及企業的詳細信息,希望增進大眾對大模型的了解。
中科創達大模型產品基本信息一覽:
產品名稱:中科創達魔方RUBIK大模型
產品規劃:全面覆蓋了從邊緣端(RUBIK Edge)、語言大模型(RUBIK Language)、多模態(RUBIK Multi-Modal)、機器人(RUBIK Robot)等大模型系列,并積極探索大模型在不同行業場景的落地應用。
以下是楊總和物聯傳媒的對話精選。
Part 1:
中科創達的大模型產品特征
物聯傳媒:根據2022年財報,中科創達的營收可以分出三類來源,分別是智能軟件業務、智能汽車業務、智能物聯網業務,三者營收占比均接近三分之一,并且智能物聯網業務較上年同期增長39%,增長僅次于汽車業務。請問對于智能物聯網業務,可否向我們簡單分享它的起源與發展方向。
楊新輝:中科創達成立于2008年,是全球領先的智能操作系統產品和技術提供商。得益于移動互聯網時代來自智能手機的爆發式需求,中科創達業績快速增長并于2015年在深交所上市。隨著發展向前推進,物聯網行業興起,中科創達物聯網業務最早開始于2016年,寄托了我們將操作系統從智能手機推進到物聯網的目標。
我們物聯網業務的定位是硬件產品及解決方案提供商,覆蓋從智能模組、參考設計、到整機,再到物聯網平臺的端到端完整方案。但中科創達的優勢還是操作系統及基于操作系統構建的軟件和解決方案,包括端側、邊緣側操作系統,再加上AI算法、平臺管理能力。
物聯傳媒:在所有業務中,了解到大模型是公司比較新的一項業務,公司基于哪些原因推出了大模型?
楊新輝:主要是基于對產業發展的洞察,大模型有望推動產業產生結構性的變化,雖然這還是一件長遠的事,但我們看得到趨勢正在形成,中科創達也愿意擁抱、布局新興技術來給產業賦能。
物聯傳媒:公司大模型產品的定位和用途是什么?
楊新輝:我們的大模型產品叫中科創達魔方RUBIK大模型,定位是在邊緣側和端側產品上優化交互,以及面向企業提供基于模型的AI服務。
為方便理解,可以將我們的業務拆分為兩部分:
一部分是產品創新,就是傳統的手機、汽車、物聯網業務,會通過大模型把AI能力補充上去,以創新內容交互的形式提高產品價值。比如市面上常見的語音實時轉寫終端,加入大模型能力后可以新增語篇規整、生成摘要、生成紀要等能力,顯著提高一些崗位的工作效率;再比如汽車場景,傳統座艙內不少用戶困擾于繁雜的表盤信息,加入大模型能力后,智能座艙的出現為用戶提供更直觀、準確的交互和指導,跨越式提高了用戶體驗。
另一部分是流程創新或稱為企業數字化轉型,這部分的熱門應用有智能客服、直播數字人等等。
物聯傳媒:現在中科創達魔方RUBIK大模型的應用規模如何?
楊新輝:坦白講現在整個大模型行業都還處于發展早期,B端客戶們也都還在理解、認知、思考、學習和研究大模型的階段,用量方面還有很大增長空間。
但中科創達也都一直在努力推動應用落地。
今年6月,我們與高通合資成立的公司創通聯達推出了旗下首款集成大模型的智能搬運機器人解決方案,使用戶可以通過自然語言與智能搬運機器人交互,提出服務指令。
7月份,我們與北京智源人工智能研究院共同成立“魔方未來聯合實驗室”,希望推進大模型技術創新與成果轉化,促進技術在智能汽車、智能機器人、智慧工業、智能物聯網等領域的應用落地。
Part2:
大模型與物聯網行業的相關性
物聯傳媒:會不會存在場景不需要用到大模型,直接用之前一代的人工智能版本就夠了呢?
楊新輝:這種情況是存在的。比如前面提的人臉識別、車牌識別應用,行業的成本、效率都足夠好了,大模型就不需要往那個領域創新。但比如多輪對話,要讓對方感知不到是機器人,就需要更換為大模型。大模型解決的是以前技術無法解決的問題。
物聯傳媒:我們前面聊了ChatGPT是一種大語言模型應用,但在實際的使用中,我個人感覺它在垂直領域產出有思想、有深度的內容還依然有不足。
楊新輝:對,這方面它還不是說要完全取代,但是大模型完全可以做好一個助理的角色了,包括收集過去的信息、整理資料、列出框架,并且耗時非常短。比如說寫高考作文,人寫完需要30分鐘,大模型只需要30秒。
而且我們認為,大模型的重要性是可以比擬工業革命時期蒸汽機的出現。當時,以蒸汽機為動力的機械使紡紗、織布工序從人工轉向自動,可能產生了10倍以上的產能提升;現在大模型出現,也在主打對智力工作進行替代或顯著增強。
打個比方,我們把人工智能的技術能力想象為一個水平面,技術的成熟和完善相當于水平面不斷被抬高,以至于蓋過了一些島嶼和陸地,這些島嶼和陸地就是人類承擔的部分工作。
這種情況下,假設說基于CNN、RNN技術構建的人臉識別、車牌識別等應用可以算是小模型,替代了10%的人類工作;那么到大模型應用里,對人類工作的替代率就可以達到30%-40%。
比例數據僅做參考,但根本上來說,大模型確實比此前幾代人工智能技術能做的事情更多了,甚至現在新型的大模型可以去通過圖靈測試,比如一些客服電話,可能當我們發現是機器人的時候,其實這個電話已經把想傳達、想詢問的信息說清楚了。
物聯傳媒:除了互聯網應用,大模型將最先在哪些物聯網場景有應用潛能?
楊新輝:今天我們談的大模型浪潮主要還是在AIGC大的范疇里,即基于人工智能做內容產生。物聯網場景里有內容產生的地方,比如說跟人有反復交互的產品類型,不管是語言還是圖像形式,大模型就會有突出的應用價值。
物聯傳媒:既然行業整體處于發展早期,公司在該賽道上有哪些具體規劃?
楊新輝:我們的模型會做一個長期的工作。
今年是先從語言模型開始,從百億規模參數一直到千億規模參數,大概會做五、六個檔次。其中參數規模相對最小的一類(比如說70億、130億或者300億以下參數),主要用在邊緣和端側設備上,這也是我們業務發展的重點。
到明年中期,預計多模態產品會出來,到時不止覆蓋語言,也會覆蓋圖像類應用,并且這些產品也將逐步應用在邊緣端和機器人領域。
物聯傳媒:我們應該怎么想象和理解大模型的發展潛能?
楊新輝:從產品角度來看,大模型就是一個軟件形態的生產效率工具,把它用上去了,工作效率有望大幅提升。
從更產業化的角度來說,市面上好多需求都是由新技術來驅動的,因為沒有新技術,用戶沒有替換的動力。大模型就是一項新技術。
比如現在我們看到一些品牌在醞釀、研發大模型手機,原因是用戶換機的意愿已經大幅降低,當未來大模型手機產品出來并且切中用戶痛點、爽點的時候,那就會驅動整個行業都用上大模型。其他很多行業也與此相似,大模型技術具有非常大的發展空間。
Part3:
大模型的建設與選型
物聯傳媒:您覺得大模型有沒有技術門檻?
楊新輝:大模型的技術門檻其實很高,壁壘主要有三個——數據、算力和算法,這三者分別代表了數據獲取及清理能力、投入資金水平、技術復雜度,除了部分頭部企業,很多公司無法長期投入在所有這些事上。
物聯傳媒:在客戶了解大模型產品時,勢必會看到行業中有不少開源產品,您是如何看待開源大模型的?
楊新輝:現在開源模型的確有很多,可能初步能滿足用戶使用的需求,但在商業場景,開源產品存在的風險不容忽視。
舉個簡單的例子,國外的開源模型可能就沒有做過與國內價值觀、風俗文化等方面的對齊,這才有模型區域化的趨勢,很難存在一個模型全球都好用。
另一方面,我們認為大模型并非是一個直接套用的標準化產品,它的商業模式更多是“產品+服務”,所以大模型應該有很多服務階段,比如對企業業務的咨詢、對數據的理解、對模型的訓練/部署/調優,本質上是一個非常復雜的工作,需要有非常復雜的、全棧的技術團隊才能把這件事做出來,這不是開源產品能保證效果的。
物聯傳媒:結合現在熱鬧的情況,您認為最終行業會留下多少大模型?
楊新輝:通用模型可能只會剩下幾個,但是在垂直行業領域,面向不同的數據基礎會存在很多的領域模型。
領域模型與通用模型的區別,就好像專科醫生與普科大夫,專科醫生勢必在專業領域里能力更強,并且會有非常多類型的專科醫生。
物聯傳媒:中科創達大模型產品的定位是專科醫生還是普科大夫?
楊新輝:我們還是會先訓練出一個普科大夫。因為從根本上說,中科創達的定位是提供基礎的、底層的技術,以第三方平臺的身份,幫助垂直領域有數據資產的企業更快構建屬于他們自己的模型而不用從0開始。
當然,后期當我們參與的行業、服務的企業、經驗的積累足夠多時,也就有機會直接向他們提供專業的垂直行業模型。
-
神經網絡
+關注
關注
42文章
4764瀏覽量
100542 -
人工智能
+關注
關注
1791文章
46872瀏覽量
237594 -
機器學習
+關注
關注
66文章
8378瀏覽量
132415 -
大模型
+關注
關注
2文章
2333瀏覽量
2489
原文標題:質疑大模型,理解大模型,用上大模型
文章出處:【微信號:ulinkmedia,微信公眾號:物聯傳媒】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論