免费无码国产V片在线观看_亚欧免费无码aⅴ在线观看_国产女人叫床高潮视频在线观看

今天對百川的RAG方法進行解讀，百川智能具有深厚的搜索背景，來看看他們是怎么爬RAG的坑的吧～

總的來說，百川通過長上下文模型(192k)+搜索增強結(jié)合的方法來解決知識更新，降低模型幻覺的問題，使得其在5000萬tokens的數(shù)據(jù)集中取得95%的精度。其主要在以下幾個方面做優(yōu)化：

1) Query拓展：這是我自己取的名字，可能不太準確，其主要參考Meta的CoVe[1]以及百川自研的Think Step-Further方法對原始用戶輸入的復雜問題進行拆解、拓展，挖掘用戶更深層次的子問題，借助子問題檢索效果更高的特點來解決復雜問題檢索質(zhì)量偏差的問題。

2) 優(yōu)化檢索鏈路：采用稀疏檢索+向量檢索+Rerank結(jié)合的方法，來提高檢索的召回率和準確率。并且其自研的Baichuan-Text-Embedding向量模型也登頂了C-MTEB語義向量評測標準。

3) 自我反省機制：百川智能通過self-Critique大模型自省機制來篩選更優(yōu)質(zhì)、知識密度更高的內(nèi)容。

一、概述

1Motivation

1.1 當前檢索增強RAG方法痛點

成本高、召回偏低：擴展上下文窗口+引入向量數(shù)據(jù)庫能以非常低的成本提高模型對新知識的接入能力，但是擴展上下文窗口容量有限（128k最多容納23萬漢字，相當于658kb文檔），成本比較高，性能下降明顯。向量數(shù)據(jù)庫也存在召回率偏低、開發(fā)門檻高等缺點。

用戶輸入變復雜：與傳統(tǒng)關(guān)鍵詞或者短語搜索邏輯不太一致，用戶輸入問題不再是詞或者短句，而是轉(zhuǎn)變成自然對話聲知識多輪對話數(shù)據(jù)，問題形式更加多元，緊密關(guān)聯(lián)上下文，輸入風格更加口語化。

1.2 RAG是當前大模型落地降低幻覺、更新數(shù)據(jù)的有效方法之一

行業(yè)大模型解決方案有后訓練（Post-Train）和有監(jiān)督微調(diào)（SFT），但是仍然無法解決大模型落地的幻覺和實效性問題。

后訓練（Post-Train）和有監(jiān)督微調(diào)（SFT）每次需要更新數(shù)據(jù)，重新訓練，還可能會帶來其他問題，成本比較大。

2Methods

省流版總結(jié)：

百川將長窗口與搜索/RAG（檢索增強生成）相結(jié)合，形成長窗口模型+搜索的完整技術(shù)棧。

百川RAG方案總結(jié)：Query 擴展（參考Meta CoVe + 自研Think Step-Further） + 自研Baichuan-Text-Embedding向量模型 + 稀疏檢索(BM25、ES) + rerank模型 + 自研Self-Critique技術(shù)(過濾檢索結(jié)果)。

2.1 Query擴展

背景：與傳統(tǒng)關(guān)鍵詞或者短語搜索邏輯不太一致，用戶輸入問題不再是詞或者短句，而是轉(zhuǎn)變成自然對話聲知識多輪對話數(shù)據(jù)，問題形式更加多元，緊密關(guān)聯(lián)上下文，輸入風格更加口語化。

目的：拆解復雜的prompt，檢索相關(guān)子問題，并深度挖掘用于口語化表達中深層次含義，借助子問題檢索效果更高的特點來解決復雜問題檢索質(zhì)量偏差的問題。

方法：參考Meta CoVe[1]以及Think Step-Further的方法，對用戶原始的Query進行擴展，拓展出多個相關(guān)問題，然后通過相關(guān)問題去檢索相關(guān)內(nèi)容，提高召回率。

百川Query擴展方案：

Meta CoVe方案：

2.2 自研Embedding模型

數(shù)據(jù)：在超過1.5T tokens（看著訓練百川模型的數(shù)據(jù)都來訓embedding模型了？）。

方法：采用無監(jiān)督方法（估計類似SimCSE[2]系列），通過自研損失函數(shù)解決對比學習方式依賴batchsize問題。

效果：登頂C-MTEB，在分類、聚類、排序、檢索和文本相似度5個任務(wù)評分取得領(lǐng)先。

2.3 多路召回+rerank

方法：稀疏檢索+向量檢索 + rerank模型。其中稀疏檢索應(yīng)該是指BM25、ES等傳統(tǒng)檢索的方法，rerank模型百川沒有提到，不確定是用大模型來做rerank還是直接訓練相關(guān)rerank模型來對檢索結(jié)果排序。

效果：召回率95%，對比其他開源向量模型召回率低于80%。

2.4 self-Critique

方法：讓大模型基于 Prompt、從相關(guān)性和可用性等角度對檢索回來的內(nèi)容自省，進行二次查看，從中篩選出與 Prompt 最匹配、最優(yōu)質(zhì)的候選內(nèi)容。

目的：提升檢索結(jié)果的知識密度和廣度，降低檢索結(jié)果中的知識噪聲。

3 Conclusion

百川192K上下文模型表現(xiàn)不錯，實現(xiàn)了100%的回答精度。

長上下文窗口模型+搜索增強技術(shù)使5000萬Tokens數(shù)據(jù)集達到95%的回答精度。

二、總結(jié)

多輪問答等場景的召回和傳統(tǒng)搜索引擎的召回分布還不太一樣。百川借助子問題檢索效果更高的特點，對原始復雜問題進行拆解、拓展來解決復雜問題檢索質(zhì)量偏差的問題。

對于沒見過的語料直接用向量檢索的結(jié)果可能不太理想。百川在大量語料上利用無監(jiān)督方法訓練embedding模型來優(yōu)化效果。而行業(yè)大模型更傾向于私有的數(shù)據(jù)，要提升私有數(shù)據(jù)的訓練效果還得繼續(xù)在私有化數(shù)據(jù)上訓練效果會更佳。

Query拓展 + 多路召回 + Rerank + self-Critique可能是現(xiàn)階段比較好的一種RAG方式，但是其也會帶來更多成本。總體思路有點像ReAct[3]系列的進階版本，其在搜索側(cè)和答案修正側(cè)都做了更多的一些工作來優(yōu)化實際效果。其缺點是需要多次調(diào)用大模型，會帶來額外的成本，真實線上是否采用這種策略還有待驗證。

審核編輯：劉清

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

SFT

SFT

+關(guān)注

關(guān)注
0

文章
9

瀏覽量
6807

原文標題：百川智能RAG方案總結(jié)：搜索出生的百川智能大模型RAG爬坑之路

文章出處：【微信號：zenRRan，微信公眾號：深度學習自然語言處理】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

白海科技與百川智能順勢而為、攜手共進，助力領(lǐng)域大模型應(yīng)用快速落地

（2023年08月08日，中國北京訊）近日，AI基礎(chǔ)軟件服務(wù)商白海科技與國內(nèi)領(lǐng)先的AGI服務(wù)企業(yè)百川智能宣布達成戰(zhàn)略合作協(xié)議。這次合作旨在加速大語言模型在各行各業(yè)的應(yīng)用，并為客戶提供智能

發(fā)表于 08-08 14:23 ?1038次閱讀

百川ESD產(chǎn)品簡介 2017版

百川ESD產(chǎn)品簡介

發(fā)表于 10-09 16:26 ?0次下載

海基新能源再獲百川股份資金加持

海基新能源為百川股份參股公司，此次增資前，百川股份合計持股26.55%。百川股份表示，本次增資有利于擴大海基新能源鋰電項目產(chǎn)能規(guī)模，滿足其未來發(fā)展對資金的需求。

發(fā)表于 12-28 10:11 ?3674次閱讀

百川的大模型KnowHow介紹

大模型是一個實驗工程，涉及數(shù)據(jù)清洗、底層框架、算法策略等多個工序，每個環(huán)節(jié)都有很多坑，因此知道如何避坑和技術(shù)選型非常重要，可以節(jié)省很多算力和時間。

發(fā)表于 09-18 10:28 ?1247次閱讀

百川智能獲阿里騰訊小米等3億美元投資

百川智能推出了4款開源baichuan-7b/13b、baichuan 2-7b/13b的免費商用產(chǎn)品和baichuan-53b、baichuan 2-53b的閉源大模型，平均每28天推出一次新的大

發(fā)表于 10-17 10:15 ?730次閱讀

寒武紀的思元（MLU）云端智能加速卡與百川智能完成大模型適配，攜手創(chuàng)新生成式AI

近日，寒武紀思元（MLU）系列云端智能加速卡與百川智能旗下的大模型Baichuan2-53B、Baichuan2-13B、Baichuan2-7B等已完成全面適配，寒武紀思元（MLU）

發(fā)表于 11-06 20:32 ?1331次閱讀

百川智能發(fā)布Baichuan2 Turbo系列API，或?qū)⑻娲袠I(yè)大模型

在當天的媒體溝通會上，百川智能創(chuàng)始人、CEO王小川，百川智能聯(lián)合創(chuàng)始人、聯(lián)席總裁洪濤，百川

發(fā)表于 12-20 16:54 ?918次閱讀

百川智能發(fā)布超千億大模型Baichuan 3

百川智能近日發(fā)布了超千億參數(shù)的大語言模型Baichuan 3，引發(fā)了業(yè)界的廣泛關(guān)注。這款模型在多個權(quán)威通用能力評測中表現(xiàn)卓越，展現(xiàn)了其強大的語義理解和生成能力。

發(fā)表于 01-31 14:58 ?796次閱讀

數(shù)勢聯(lián)動百川，發(fā)布首批大模型聯(lián)合解決方案，推動中國大模型價值落地

近日，行業(yè)領(lǐng)先的數(shù)據(jù)智能產(chǎn)品提供商北京數(shù)勢云創(chuàng)科技有限公司（以下簡稱“數(shù)勢科技”）和國內(nèi)通用大模型廠商北京百川智能科技有限公司（以下簡稱“百川

發(fā)表于 02-28 11:40 ?459次閱讀

百川智能與北京大學將共建通用人工智能聯(lián)合實驗室

近日，百川智能與北京大學攜手合作，共同簽署了“北大——百川通用人工智能聯(lián)合實驗室”的共建協(xié)議，標志著雙方在人工智能領(lǐng)域邁出了堅實的合作步伐。

發(fā)表于 03-21 11:45 ?856次閱讀

百川智能發(fā)布Baichuan 4大模型及首款AI助手“百小應(yīng)”

百川智能近日發(fā)布了其新一代基座大模型Baichuan 4，并同步推出了首款AI助手“百小應(yīng)”。這款AI助手是在Baichuan 4強大能力的基礎(chǔ)上，結(jié)合先進的

發(fā)表于 05-23 14:15 ?577次閱讀

亞馬遜云科技接入百川智能和零一萬物基礎(chǔ)模型

近日，亞馬遜云科技在中國峰會上宣布，兩大中文基礎(chǔ)模型——百川智能的Baichuan2-7B和零一萬物的Yi-1.5 6B/9B/34B，即將或已正式登陸中國區(qū)域的SageMaker JumpStart。這一舉措為中國企業(yè)提供了豐

發(fā)表于 06-04 11:53 ?559次閱讀

百川智能完成50億元A輪融資

近日，國內(nèi)領(lǐng)先的醫(yī)療AI大模型企業(yè)——百川智能，正式宣布完成了高達50億元人民幣的A輪融資，這一里程碑式的融資不僅彰顯了市場對其技術(shù)實力與未來發(fā)展?jié)摿Φ母叨日J可，也為公司的后續(xù)發(fā)展奠定了堅實的資金基礎(chǔ)。

發(fā)表于 07-26 16:42 ?435次閱讀

大模型廠商“輸血”不斷，百川智能完成50億元A輪融資！

有重磅消息曝出：知名大模型公司百川智能已經(jīng)成功收獲了價值50億元的A輪融資。由此，我們不禁感嘆，大模型廠商們的“輸血”和“續(xù)命”之戰(zhàn)，還在激烈的上演著。

發(fā)表于 07-31 14:47 ?574次閱讀

百川智能發(fā)布一站式大模型商業(yè)化解決方案

近日，百川智能正式推出了一站式大模型商業(yè)化解決方案，旨在為企業(yè)提供更加全面、高效的大模型應(yīng)用服務(wù)。該解決方案以1+3產(chǎn)品矩陣為核心，包括全鏈路優(yōu)質(zhì)通用訓練數(shù)據(jù)、Baichuan4-Tu

發(fā)表于 11-01 18:01 ?723次閱讀

精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

搜索歷史

搜索出生的百川智能大模型RAG爬坑之路總結(jié)

評論

白海科技與百川智能順勢而為、攜手共進，助力領(lǐng)域大模型應(yīng)用快速落地

百川ESD產(chǎn)品簡介 2017版

海基新能源再獲百川股份資金加持

百川的大模型KnowHow介紹

百川智能獲阿里騰訊小米等3億美元投資

寒武紀的思元（MLU）云端智能加速卡與百川智能完成大模型適配，攜手創(chuàng)新生成式AI

百川智能發(fā)布Baichuan2 Turbo系列API，或?qū)⑻娲袠I(yè)大模型

百川智能發(fā)布超千億大模型Baichuan 3

數(shù)勢聯(lián)動百川，發(fā)布首批大模型聯(lián)合解決方案，推動中國大模型價值落地

百川智能與北京大學將共建通用人工智能聯(lián)合實驗室

百川智能發(fā)布Baichuan 4大模型及首款AI助手“百小應(yīng)”

亞馬遜云科技接入百川智能和零一萬物基礎(chǔ)模型

百川智能完成50億元A輪融資

大模型廠商“輸血”不斷，百川智能完成50億元A輪融資！

百川智能發(fā)布一站式大模型商業(yè)化解決方案