定義一種全新的“定制化”模式。
百川智能依然保持著一如既往的快節(jié)奏。
12月19日,百川智能宣布開(kāi)放基于搜索增強(qiáng)的Baichuan2-Turbo系列API,包含Baichuan2-Turbo-192K及Baichuan2-Turbo。在支持192K超長(zhǎng)上下文窗口的基礎(chǔ)上,還增加了搜索增強(qiáng)知識(shí)庫(kù)的能力。
即日起,API用戶(hù)可上傳文本資料來(lái)創(chuàng)建自身專(zhuān)屬知識(shí)庫(kù),從而根據(jù)自身業(yè)務(wù)需求打造更完整、高效的智能解決方案。
2個(gè)多月前的9月25日,百川智能便發(fā)布了Baichuan2-53B閉源大模型,全面升級(jí)了Baichuan1-53B的各項(xiàng)能力。作為首批通過(guò)備案的大模型企業(yè)之一,百川智能此次還開(kāi)放了Baichuan2-53B API接口,正式進(jìn)軍to B領(lǐng)域,開(kāi)啟商業(yè)化進(jìn)程。
在當(dāng)天的媒體溝通會(huì)上,百川智能創(chuàng)始人、CEO王小川,百川智能聯(lián)合創(chuàng)始人、聯(lián)席總裁洪濤,百川智能技術(shù)聯(lián)創(chuàng)陳煒鵬及百川智能商用業(yè)務(wù)部總經(jīng)理李劍共同出席,為「甲子光年」等媒體解答了百川智能在to B模式中最新的技術(shù)與商業(yè)思考。
1.行業(yè)模型之外,大模型to B的第二條路
在過(guò)去一年對(duì)大模型商業(yè)化的討論中,行業(yè)大模型一直被認(rèn)為是大模型在B端商業(yè)落地的主要路徑。
而百川智能此次走出了一條不同的路。
百川智能認(rèn)為,企業(yè)自有數(shù)據(jù)/知識(shí)庫(kù)是企業(yè)的核心競(jìng)爭(zhēng)力。大模型如果不能與企業(yè)自有數(shù)據(jù)/知識(shí)庫(kù)進(jìn)行結(jié)合,對(duì)企業(yè)而言是沒(méi)有價(jià)值的。
如何將大模型與企業(yè)自有數(shù)據(jù)/知識(shí)庫(kù)更好地相結(jié)合呢?
一個(gè)已經(jīng)為人熟知的方法是,打造行業(yè)大模型。然而,基于特定數(shù)據(jù)預(yù)訓(xùn)練或微調(diào)垂直行業(yè)大模型需要高密度的技術(shù)人才團(tuán)隊(duì)、大量的算力支持,并且每更新一次數(shù)據(jù)都要重新訓(xùn)練或微調(diào)模型。
這種方式不僅成本高昂、靈活性差,更關(guān)鍵的是不能保證訓(xùn)練的可靠性和應(yīng)用的穩(wěn)定性,多次訓(xùn)練后仍會(huì)出現(xiàn)問(wèn)題。
此外,大部分企業(yè)數(shù)據(jù),都是結(jié)構(gòu)化的數(shù)據(jù),也不適合SFT(Supervised fine-tuning,有監(jiān)督微調(diào)),模型無(wú)法準(zhǔn)確記憶結(jié)構(gòu)化信息,就會(huì)帶來(lái)幻覺(jué)。
針對(duì)這些痛點(diǎn),行業(yè)摸索了一套基本操作,即“向量數(shù)據(jù)庫(kù)+長(zhǎng)上下文窗口”。而百川智能在此基礎(chǔ)上進(jìn)一步完善了大模型技術(shù)棧,拓展至四個(gè)維度:
向量數(shù)據(jù)庫(kù),百川智能在向量檢索c-mteb位列第一
長(zhǎng)窗口Baichuan2-192K,一次可輸入35萬(wàn)字
實(shí)現(xiàn)稀疏檢索(索引庫(kù))與向量搜索并行,模型的可用率從80%提升至95%
搜索系統(tǒng)和大模型對(duì)齊
具體來(lái)看,百川智能將向量數(shù)據(jù)庫(kù)升級(jí)為搜索增強(qiáng)知識(shí)庫(kù),提升了大模型獲取外部知識(shí)的能力;把搜索增強(qiáng)知識(shí)庫(kù)和超長(zhǎng)上下文窗口結(jié)合,讓模型可以連接全部企業(yè)知識(shí)庫(kù)以及全網(wǎng)信息,能夠替代絕大部分的企業(yè)個(gè)性化微調(diào),解決99%企業(yè)知識(shí)庫(kù)的定制化需求。 這套技術(shù)棧背后,也反映了百川智能對(duì)于大模型更深層次的思考。 在百川智能的技術(shù)思考中,大模型+搜索增強(qiáng)是大模型時(shí)代的新計(jì)算機(jī)——
大模型類(lèi)似于計(jì)算機(jī)的CPU,通過(guò)預(yù)訓(xùn)練將知識(shí)內(nèi)化在模型內(nèi)部,然后根據(jù)用戶(hù)的Prompt生成結(jié)果;
上下文窗口可以看做計(jì)算機(jī)的內(nèi)存,存儲(chǔ)了當(dāng)下正在處理的文本;
互聯(lián)網(wǎng)實(shí)時(shí)信息與企業(yè)完整知識(shí)庫(kù)共同構(gòu)成了大模型時(shí)代的硬盤(pán)。
那么,百川智能如何將這套技術(shù)棧真正落地在商業(yè)場(chǎng)景呢?
2.用“產(chǎn)品化”取代“項(xiàng)目化”
事實(shí)上,無(wú)論王小川還是他所召集的搜狗“舊部”,過(guò)往的工作經(jīng)驗(yàn)更多集中在to C領(lǐng)域。此次帶領(lǐng)百川智能進(jìn)軍to B,無(wú)疑會(huì)面臨諸多挑戰(zhàn)。
洪濤告訴「甲子光年」:“企業(yè)真正要用好大模型的起點(diǎn),是把企業(yè)知識(shí)和大模型結(jié)合,而這也是最大的困難。”
王小川認(rèn)為,to B要面對(duì)的最大需求是定制化,光靠調(diào)用API可能不夠。
“我們今天用搜索增強(qiáng)最大的意愿不是解決幻覺(jué)問(wèn)題,而是解決大模型可定制化的問(wèn)題。如何讓企業(yè)的私有數(shù)據(jù)為模型所用,讓模型為企業(yè)服務(wù),是大模型to B商業(yè)化過(guò)程中要解決的關(guān)鍵問(wèn)題。”王小川表示。
在上一波以計(jì)算機(jī)視覺(jué)為核心的AI浪潮中,AI公司變成了集成商,需要下場(chǎng)做很重交付的定制化項(xiàng)目,往往利潤(rùn)很低,甚至越做越虧。如何避免在定制化項(xiàng)目中“越做越虧”的故事在大模型的商業(yè)化路上重演,是所有大模型創(chuàng)業(yè)公司今天要面對(duì)的一大難題。
在王小川的判斷中,定制化是客戶(hù)天生的需求,to B企業(yè)真正要避免的是“項(xiàng)目化”。
所以,基于上述技術(shù)棧,百川智能定義了一種全新的“定制化”方式——用“產(chǎn)品化”取代“項(xiàng)目化”。
“整體來(lái)看,一些能盈利的to B公司賣(mài)的大多是產(chǎn)品。我們目前打造的可配置、可調(diào)整的搜索增強(qiáng)知識(shí)庫(kù),就是希望用產(chǎn)品的方式,以更低的成本解決客戶(hù)的定制化需求。客戶(hù)提出的各種需求可以通過(guò)我們不同的產(chǎn)品組合來(lái)解決, 我們不需要單獨(dú)開(kāi)發(fā)一套全新的數(shù)據(jù)庫(kù)。”洪濤進(jìn)一步解釋道。
據(jù)「甲子光年」觀察,百川智能并不直接針對(duì)某個(gè)行業(yè)做“企業(yè)服務(wù)”,而是基于不同的場(chǎng)景需求,構(gòu)建大模型解決問(wèn)題的能力。這些能力最終可被應(yīng)用在多個(gè)行業(yè)。
在眾多場(chǎng)景中,百川智能主要瞄準(zhǔn)有兩大特征的場(chǎng)景——有大量文本數(shù)據(jù),并且需要與客戶(hù)打交道,如客服場(chǎng)景。
目前,和大多數(shù)企業(yè)類(lèi)似,百川智能為企業(yè)提供API調(diào)用、云上部署以及本地部署三種大模型部署方式。
在此次溝通會(huì)中,王小川還透露了C端產(chǎn)品的最新信息。
王小川表示,C端產(chǎn)品依然是百川智能十分看重的方向。關(guān)于C端超級(jí)應(yīng)用的定義,王小川認(rèn)為:“以往做應(yīng)用更多是在造工具,我們要求它以更精確的方式和我們互動(dòng),提高我們的效率。但今天,我們要造的是新物種,是一種人類(lèi)的伙伴。”
王小川進(jìn)一步透露,百川智能的C端產(chǎn)品第一重心是醫(yī)療方向,產(chǎn)品預(yù)計(jì)會(huì)在明年上線。
-
API
+關(guān)注
關(guān)注
2文章
1484瀏覽量
61810 -
大模型
+關(guān)注
關(guān)注
2文章
2322瀏覽量
2479
原文標(biāo)題:百川智能發(fā)布Baichuan2 Turbo系列API,或?qū)⑻娲袠I(yè)大模型|甲子光年
文章出處:【微信號(hào):jazzyear,微信公眾號(hào):甲子光年】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論