落地方能檢驗技術真章。
9月7日,在一年一度的騰訊全球數字生態大會上,騰訊自研的通用大語言模型混元大模型正式亮相,并宣布正式通過騰訊云對外開放。企業用戶可以直接在騰訊云上調用混元API,或者將混元作為基底模型構建上層應用。
與市場上很多廠商都在爭先恐后的優先推進對話式大語言模型不同,騰訊在大模型落地探索上有著明顯不一樣的節奏和堅持。
最直接的節奏體感是騰訊的“不著急”——在廠商紛紛搶占今年三、四月份的第一波大模型時間卡位時,馬化騰直言“騰訊不急于做半成品”。所以直到6月,大眾才第一次正式看到騰訊的行業大模型,彼時,市場上已經在風風火火的上演著“百模大戰”。
細究這種“不著急”背后,也許并非是因為騰訊在戰略上“輕視”大模型的機會,而是他們認為大模型的價值核心不在時間窗口上,而在落地實踐中。畢竟,在馬化騰看來“大模型是互聯網百年不遇的機會,是類似發明電的工業革命一樣的機遇。”
這種更倡導落地的價值觀在當下正逐步成為行業共識——隨著更多大語言模型對外開放,科技公司除了在不斷打磨模型能力之外,也相繼走進了各行各業,踏上了場景落地探索的新征程。目前,云廠商在大模型的產業落地思路上基本已達成共識:MaaS(Model-as-a-Service)模式,落地行業,走在場景中,和客戶一起合作做垂類大模型。
如果大模型的價值核心在場景落地上,騰訊的解題思路是什么?
1.騰訊的選擇:實用主義
不同公司在發展大模型技術上思路不同,選擇的優先級也不同。有的公司更關心技術、參數,把追趕ChatGPT定為首要目標。有的公司更關心場景閉環,在早期階段就選擇把場景驗證納入技術探索的必經之路上。
騰訊的答案明顯是后者。從6月19日發布行業大模型之初,騰訊集團高級執行副總裁、云與智慧產業事業群CEO湯道生就強調了騰訊的大模型價值觀:“通用大模型不一定是滿足行業場景需求的最優解。企業需要有針對性的行業大模型,結合自己的數據做訓練或精調,在合理的成本下,打造實用性更高的智能服務。”
騰訊的這種價值可以用四個字來概括——實用主義。這也是騰訊做大模型貫穿始終的一條暗藏的主線。
一方面,實用主義意味著,騰訊云更關注大模型如何解決場景問題而不僅僅是參數大小。騰訊云副總裁、騰訊云智能負責人吳運聲曾直言:“幾億、幾十億、幾百億還是一千多億,我們并不關心模型參數的那個數字,我們更關注的怎么解決客戶的問題,希望用最有效,最低成本的手段去解決客戶的問題。”
另一方面,實用主義意味著,要更關心應該用什么技術組合?如何更有效率的解決問題?吳運聲提到:“就像舉重運動員要舉200斤的杠鈴,但作為游泳運動員舉100斤就夠了,作為體育室,我們提供200斤的杠鈴,但對于不同類型的運動員或者更多普通人,他們沒有必要都要用200斤的杠鈴練習。”
在他看來,在一些行業和具體的領域,數據量本身就沒那么大,用小參數成本低,效果也會更好。“我們希望以最低的成本,最合適的模型,最好的服務去讓客戶真正把技術用起來,解決它在場景中的問題。”吳運聲說。
他認為這是騰訊云一直在貫徹的技術實用主義:“從大模型整體思路來看,我們并不特別關注形式,而是注重技術產生的實際價值,以及在客戶業務中的價值體現。我們的核心出發點都是基于此。”
這種經驗和判斷來源于騰訊云在to B領域的多年深耕——大模型技術需要基于產業場景,與企業數據融合,才能釋放出最大的價值,“智能化的后半場,騰訊云智能在堅持投入AI技術研發的同時,一直專注于產業實踐,強調技術的務實可行和產品的安全可靠。”吳運聲提到。
對外,所有的技術最終都要面對場景的發問。深度學習之后,上一波AI熱潮的歸向也是如此。過去幾年中,更多AI公司在已經放下“標榜自身有多牛”的身段,轉而走向更落地的方向,尋找真正可規模化的場景。
對內,騰訊云也一直在踐行落實這種技術實用主義。作為騰訊云承擔大量前沿探索工作的關鍵部門,騰訊優圖實驗室也一直在堅持“研究和落地并重”的方針:一方面需要站在科技前沿探索更多的可能性,另一方面需要考慮技術能解決的實際問題,而非純粹的技術至上和論文至上。“研究、落地兩條腿走路,這是優圖從成立的第一天開始就在強調的重點方向。”吳運聲說道。
他認為,關心落地并不意味著不關注前沿研究。“我們的研究恰恰是以解決在落地中遇到的實際問題為前提,每年我們也會發布很多論文,但和其他家不同的地方在于,優圖幾乎70%、80%論文原點都是我們在實際場景中遇到的問題。基于問題,我們進行探索研究,最終抽象成學術層面的東西。”
技術要更實用也能顯現出價值,并不是一句空話。
2.實用主義的源頭:一線用戶的需求
實用主義并非是騰訊云的一家之言,騰訊依靠的是來自一線企業需求的真實反饋。正如湯道生所言:“企業需要的是在實際場景中真正解決了某個問題,而不是在100個場景中解決了70%-80%的問題。”
今年以來,騰訊云一直泡在一線和用戶溝通具體的需求。騰訊云副總裁、騰訊云智能研發負責人吳永堅告訴「甲子光年」,當前,企業客戶對于大模型的技術需求正在逐步變得更理性。“客戶在張開懷抱擁抱技術的同時提出了更多實用性的需求:有人關心大模型技術能夠結合產品上做更定制化;有人希望拓寬大模型更多元的知識來源,也有人希望生成精準的行業知識,準確率要有保障。”他認為,技術需要結合多種因素組合考量:“安全性、部署、成本等多重因素交織下,再去考慮技術的可達性。”
這些多樣化的需求意味著,單一模型很難滿足所有需求。“我們不會去強調技術有多強,而更側重于產品如何去解決客戶的實際問題。”
基于此,騰訊云打造了支撐實用主義落地的全套MaaS服務體系,并持續根據用戶需求進行迭代:基于自研的騰訊混元大模型,同時支持業內主流的開源模型應用,從技術底座、平臺能力和智能應用三個維度,助力客戶構建專屬大模型和智能應用,推動大模型在產業中的落地應用。
騰訊云MaaS解決方案,圖片來自騰訊
技術底座層包含算力工具和行業模型。算力方面,包含騰訊云今年4月發布的專為大模型訓練設計的新一代HCC高性能計算集群;依托自用的向量引擎(OLAMA)騰訊云也已經推出向量數據庫(Tencent Cloud VectorDB);以及自研的星脈計算網絡架構。“通過存儲、計算、網絡整體的升級,我們今天實現了訓練一輪萬億參數的模型在4天之內就可以完成,并讓訓練效率得到大幅提升,訓練時間得到保障,訓練成本下降很多。”騰訊云副總裁、騰訊云智能負責人、優圖實驗室負責人吳運聲提到。
平臺方面,騰訊云TI平臺是騰訊云大模型能力在行業落地的技術“殺手锏”:不僅包含此前就有的數據標注、訓練、評估、測試和部署等工具,還有可以進行更優訓練和推理加速“太極Angel”,以及從“業務分析、數據處理、大模型選擇”到“模型評測”的一體化完整方法論。吳運聲稱:“我們對企業在做模型精調過程中的精調、部署等方面的工具做了全棧式打造,可以讓每個想做自己模型的企業,基于TI平臺,用騰訊云的加速框架、基礎算力、開源工具,讓構筑行業模型變得更簡單。”
在2023年騰訊全球數字生態大會上,騰訊云對這套技術底座進行了新的升級:
平臺層,一方面,TI平臺也全面接入了Llama 2、Falcon、Dolly等主流開源模型,支持系列模型的直接部署調用、應用流程簡單。
工具鏈層,騰訊云為客戶提供了多款即插即用的產品,客戶只需加入自己獨有的場景數據進行精調訓練,就可快速嘗試多種大模型,并根據自身業務場景需求,就可以在短時間內精調出專屬的模型方案。
加速方面,升級后太極Angel大模型加速框架,通過異步調度優化、顯存優化、計算優化等方式,相比行業常用方案性能提升30%以上。
應用層,騰訊企點繼續升級了全新一代智能客服,提升了管理端配置能力、知識構建效率,優化C端用戶體驗;同時騰訊企點分析AI助手,覆蓋對話式分析,輔助數據配置、提取智能結論、一鍵生成報告四大場景,該功能正式在9月向大客戶開放內測申請。
這些多樣的技術組合支撐著騰訊云將大模型落實到千行百業。
3.踐行實用主義,把大模型落地實體經濟
對于眼下的騰訊云而言,究竟如何真正將實用主義落地真實的場景中?
從戰略優先級上來看,當前騰訊云已經有一套清晰的思考:第一步,錨定標桿客戶。第二步,輻射整個上下游產業鏈的腰部企業。“眼下,我們會挑選若干個關鍵場景,結合客戶需求做深做透,形成標桿,之后就能夠往腰部覆蓋,開展規模化。”騰訊云副總裁、騰訊云智能研發負責人吳永堅告訴「甲子光年」。
其次是重要行業和領域。這個答案從騰訊云此前的大戰略就可以得出——實體經濟。
實體經濟是大模型必爭之地。工信部提出,到2025年,70%的規模以上制造業企業基本實現數字化網絡化。騰訊云也在2021年進行了全面的調整來持續開拓實體經濟市場。騰訊對自己的角色定位一直是——實體經濟的數字化助手。工業、制造、能源、零售等都是騰訊云的核心陣地,目前三一重工、富馳高科、國家電網都是其客戶。
騰訊集團副總裁、政企業務總裁李強在分享中稱:“騰訊會堅定的推動大模型走入產業全鏈條。比起聊天、答題、內容生產等,大模型在產業的具體場景應用,對實體經濟將帶來更大價值。”在他看來,機會巨大:“中國擁有智能化落地的豐沃土壤和場景,我國的制造業規模已經連續13年居世界首位。中國信通院預測,到2030年,中國產業智能化的規模會超過10萬億元,智能化還將推動勞動生產率提升20%。”
目前,騰訊云已經攜手政務等行業的頭部企業,在二十余個行業探索了超50個行業大模型的應用解決方案。以騰訊云數智人工廠為例,騰訊云MaaS能力可以讓數智人分身復刻縮短至24小時,大幅降低成本。在文旅領域推出的文旅大模型,金融領域打造的OCR大模型都是已經在落地的案例。
比如,騰訊云OCR大模型可以提升非結構化內容識別、理解能力,企業可以通過TI平臺對OCR大模型進行精調。這是一種極大的能力躍遷。此前傳統的OCR深度學習模型需要經過檢測、識別、結構化等多個階段,很難突破監測識別難點,且不具備閱讀理解和推理能力,更難以進行標準化,企業的定制成本高昂。新的大模型技術讓這些難題不再是障礙,能夠讓圖像到文字直接生成,使得任務間能力互補,泛化性更強,場景更豐富。
OCR大模型提升了很多場景的工作效率,比如工業質檢場景下,工廠可以讓大模型識別電線規格、零部件規格說明書,物流快遞場景下,物流公司可以讓大模型識別集裝箱規格、電子顯示屏讀數,這種端到端理解圖片的能力,極大的提高了流程效率。
這只是騰訊云推動大模型在實體經濟的一小步。
更多關于實用主義的探索正在路上。騰訊正持續推動大模型走入產業全鏈條。隨著技術在千行百業的扎根,從田間到產線,從實驗室到便利店,大模型將無處不在。
-
智能化
+關注
關注
15文章
4831瀏覽量
55267 -
騰訊
+關注
關注
7文章
1646瀏覽量
49404 -
大模型
+關注
關注
2文章
2339瀏覽量
2501
原文標題:騰訊的大模型價值觀:實用主義|甲子光年
文章出處:【微信號:jazzyear,微信公眾號:甲子光年】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論