國內大模型戰場的比拼正在進入新的階段。
隨著產業界對模型落地的態度逐漸回歸理性,企業客戶的認知從原來的“覺得大模型什么都能做”的階段,已經收斂到“大模型能夠給自身業務帶來什么價值上了”。
2023 年下半年,不少企業將目光鎖定在行業模型上。如何降低大模型使用門檻,讓大模型真正在行業里用起來,是業內普遍關注的焦點。
由此,國內廠商在大模型上的認知也在逐步統一——百度創始人李彥宏認為“卷大模型沒有意義,卷應用機會更大”;騰訊高管湯道生表示“大模型只是開端,行業應用才是未來”;華為云CEO張平安明確大模型“為行業而生,聚焦B端行業客戶”,更直言盤古大模型“沒時間作詩、沒時間聊天”。
這也意味著,更多大模型廠商將開始卷應用,這會是今年競爭最為激烈的板塊之一。
大模型行業落地渴望 “開箱即用”
過去半年,大模型To B的落地應用摸索已經度過嘗鮮期。
對于企業而言,他們希望更快使用上大模型,在市場競爭中獲得優勢。但大模型的技術門檻很高,因此企業并不會從頭開始訓練自己的基礎大模型,更多是基于某個成熟的大模型做二次開發。
然而,想借用好現有的通用大模型,企業仍面臨著三大難題:
首先,各類企業的場景需求、復雜程度、智能化程度千差萬別,大模型能力邊界與企業的場景需求如何快速、準確匹配;
其次,從模型到應用中間還需要諸多技術橋梁,諸如SFT、RAG、LangChain、Agent等技術,如何與大模型有機組合達成最優解;
第三,企業過去積累了大量IT設施、軟件、企業數據、業務流程,如何讓大模型與現有設施結合的情況下,保障企業數據信息安全。
換句話說,企業無論是基于開源或閉源的通用大模型來做行業化落地,都遠沒有到達開箱即用的程度。
不過這也成為大模型廠商在競爭中突圍的方向,除了要在底層技術上繼續夯實外,補足行業Know-how和成功經驗也是重中之重。
在百度和阿里的發展經驗中,似乎可以給大模型行業一些啟示。
其中,百度用搭建行業模型、垂直場景模型和應用的方式賦能具體行業。
2023年3月,百度智能云推出千帆大模型平臺,從算力、模型、到應用層層結合,為企業提供一整套大模型開發工具。
一年后,基于一線經驗積累和實戰反饋,百度智能云抽取出“研、產、供、銷、服”環節中的典型場景,于近日推出了5款全新模型和7款應用產品,來解決企業用好大模型的“三大難題”。
以此次發布的國內首款大模型全面重構的智能客服——百度智能云客悅為例,相比傳統客服,客悅可結合大模型的理解、推理、記憶能力,實現更友好的對話、更高效的運營。
比如,當用戶提問“我的車總有吱吱吱的聲音”,傳統客服無法理解“吱吱吱”這種口語化的表達。
而客悅在大模型的加持下,會繼續追問用戶該問題持續的時間和頻次,并通過推理反饋用戶,可能是皮帶老化或者張緊輪松動導致,建議到店檢查。
若用戶反饋沒時間檢查,客悅還會基于自身知識庫,提醒不檢修可能導致車輛失去動力、長期會引起發動機故障等問題,引起用戶重視,守護行車安全。目前,用戶問題自助解決率已超過90%。
在運營效率方面,上一代的傳統智能客服進行業務辦理、知識咨詢、閑聊等能力,需要花費的人效約100人/天,而客悅僅需約15.5人/天,大模型客服運營效率提升6倍。
目前為止,百度智能云已經布局了電力、汽車、金融、政務等十余個行業大模型,并取得了不錯的效果,客戶中也出現了國家電網、浦發銀行、泰康、吉利等知名企業。
相比之下,阿里采用了另一套邏輯:賦能于內部已有應用和服務,再技術外溢至行業客戶。
除已經發布“通義千問”大模型外,夸克也發布了自研大模型,應用于通用搜索、醫療健康等場景;后加之內部推行“云釘一體”,作為辦公一體化平臺,釘釘上線AI魔法棒,推出17項與AI相關服務,也為通義千問大模型助力頗多。
同時,阿里也提供了不少類似于Anyone fit類型的圖像模型解決方案,其工具十分貼合電商需求場景。
因在電商、物流層面的深厚積累,讓阿里擁有了對不同領域的行業特點、業務流程和客戶需求有了充分的認識。
基于此,阿里的產品便可以在深度了解用戶需求的基礎上,為客戶提供定制化的解決方案,滿足其業務需求,提高其業務效率和競爭力。這讓大模型有了其應有之意,不至于淪落為“無源之水”。
頭部大廠領跑大模型行業落地
在大模型的 toB 競爭中,本質而言,是取決于客戶企業對商業價值的認知。和其他行業一樣,在大模型領域,“多快好省” 和 “物美價廉” 難以兩全,匆忙上陣的結果可能是一地雞毛。
因此,企業客戶在大模型的選擇上更為審慎。盡管大模型的應用還在初期,但企業在模型選擇、模型可靠性、應用成本、使用門檻等層面,已有各種考量和顧慮。
百度集團副總裁侯震宇曾在采訪中表示:“最終能夠讓大模型服務推廣開的只有兩個原因:第一個是模型效果,第二個是成本。”
以百度智能云為例,其大模型的調用和訓練成本一直在下降。文心一言開啟內測后,一個月就迭代了四次。
根據百度披露的數據,文心一言的推理成本如今只有發布之初的十分之一,在發布的3個月內推理效率提升10倍,模型推理性能提升50%,模型算力利用率提升1倍。
侯震宇透露,隨著技術迭代帶來的成本下降,不管是在模型使用,還是在模型微調甚至在模型再訓練方面,“價格應該不會成為大家使用或者擁抱大模型的瓶頸”。
與此同時,在SuperCLUE中文大模型7月最新榜單中,百度的大語言模型產品文心一言以62分的總成績一舉超越越GPT-3.5-turbo(59.79)和ChatGLM-130B(59.35)等,穩居行業頭部。
除了成本和效果,大模型從開發、應用到調優的每一個環節如何落地,如何基于數據安全合規進行私有化部署等,都是企業客戶重點關注的問題。
例如,很多企業需要的聊天機器人,并不是選擇具備強大通用能力的大模型就可以,還要求大模型廠商能夠提供易用性、完備度、安全性、穩定性都有保證的工具鏈。
在關注大模型技術棧完備性的同時,企業還需要選擇適合自身業務的大模型廠商——既有充分的產業應用經驗積累,也能夠將技術應用到實際業務場景中。
目前,百度智能云推出的千帆大模型平臺就擁有較為全面的數據服務能力,從生成、標注、回流再到模型訓練(Post-pretraining、Fine-tuning、Prompt-tuning)、模型評估(主觀評估、客觀評估)和壓縮、自動化 Prompt 工程、到插件應用編排,客戶都可以在千帆上一站式完成。
這意味著企業客戶可以將基于千帆平臺從0開始訓練自己的專屬模型,同時訓練好的模型也可以部署和托管在千帆平臺上,獲得極致的性能、企業級的高可用性和安全環境。
由于千帆平臺已經制備了開箱即用的使用流程,用可視化產品界面的方式引導用戶使用,極大降低了使用門檻。對于企業級市場比較擔心的安全可靠問題,也內置了安全機制,確保模型的輸入和輸出的安全。
不久前,IDC發布的《AI大模型技術能力評估報告,2023》對國內主流大模型,包括百度、阿里、騰訊、華為、科大訊飛、360、商湯等14家廠商參進行了評估。
IDC分別對大模型的平臺、創新、通用、算法、服務、生態合作、行業覆蓋和安全可解釋性等諸多方面進行了評價,其中百度 7 個滿分,阿里 6 個滿分。百度在算法模型、行業覆蓋領域拿下行業唯一滿分。
可以看到,頭部大廠的大模型產品已經有所成效。相較之下,部分初創和腰部公司開始呈現疲態。
從光年之外退出競爭、訊飛大幅虧損難以支撐大模型投入便可以得知,一些 “笨鳥先飛” 的企業已逐漸落后于發展大勢。
對于企業業務而言,現階段更加穩妥的方式還是在大廠之間做出抉擇。大廠大模型更能保證服務交付、運維和維保,這也是企業對自身向智能化方向轉型更加負責任地選擇。
結語
隨著企業研發、生產、銷售、人力等各項業務場景數字化深入,如何借助大模型的力量,發揮出應用的最大價值,正成為企業商業制勝的關鍵所在。
接下來的競爭,對于企業而言,不再是局限于大模型的追逐,而是如何基于大模型對應用產品進行自我優化和革新。
對于大模型廠商而言,比拼的不僅是算力、算法和數據,未來長期的發展比的更是落地應用、生態渠道、客戶服務、運維等系統性、全面性的支持。
這需要廠商具備強大的技術水平,以及不斷迭代升級的能力。要滿足可控和合規的要求,也需要廠商有較強的綜合能力,能夠長期穩定的投入人力物力。
【關于科技云報道】
專注于原創的企業級內容行家——科技云報道。成立于2015年,是前沿企業級IT領域Top10媒體。獲工信部權威認可,可信云、全球云計算大會官方指定傳播媒體之一。深入原創報道云計算、大數據、人工智能、區塊鏈等領域。
審核編輯 黃宇
-
AI
+關注
關注
87文章
30162瀏覽量
268427 -
大模型
+關注
關注
2文章
2333瀏覽量
2489
發布評論請先 登錄
相關推薦
評論