2023年的五月,稱(chēng)得上一句AI之夏。
大模型層出不窮、扎堆發(fā)布。
這一輪由大模型推動(dòng)的AI熱潮中, NLP(自然語(yǔ)言處理)技術(shù)與金融落地場(chǎng)景的結(jié)合備受期待。金融行業(yè)是數(shù)字化、智能化的先行者,也是大模型技術(shù)落地的最佳領(lǐng)域。如果將大模型的能力放在金融行業(yè)中去處理原有的任務(wù),會(huì)對(duì)很多工作產(chǎn)生顛覆性的影響。
對(duì)科技企業(yè)來(lái)說(shuō),不僅要積極參與“訓(xùn)大模型”的技術(shù)競(jìng)賽,更重要的是,從場(chǎng)景出發(fā),用最快速度完成大模型的業(yè)務(wù)落地、找到可行的產(chǎn)業(yè)邏輯。
這條“NLP+金融”的技術(shù)落地之路,度小滿已經(jīng)走了五年。作為源自百度的公司,度小滿在NLP上的積累得天獨(dú)厚。我們從度小滿NLP開(kāi)始,去看看NLP與金融的可能性,以及AI走向產(chǎn)業(yè)的應(yīng)用落地是如何實(shí)現(xiàn)的。
大模型時(shí)代, 打開(kāi)NLP+金融的想象力
大模型的到來(lái),讓NLP技術(shù)在金融領(lǐng)域的應(yīng)用,打開(kāi)了想象空間。
幾乎所有金融單位都要處理大量文本、文檔,NLP技術(shù)有潛力貫穿金融業(yè)務(wù)的所有環(huán)節(jié):
1.讀。超大規(guī)模的預(yù)訓(xùn)練生成式大模型,能夠?qū)鹑跇I(yè)務(wù)場(chǎng)景中的數(shù)據(jù)信息和隱藏知識(shí)進(jìn)行更高效的挖掘和理解,“多快好省”從文檔文本數(shù)據(jù)中抽取出相應(yīng)的信息,包括文檔智能信息抽取、OCR、輿情分析、暴雷事件分析、報(bào)警、風(fēng)控等,提高決策能力。
比如信貸輔助決策,基于強(qiáng)大的語(yǔ)義理解能力,讀懂非結(jié)構(gòu)化數(shù)據(jù),包括財(cái)務(wù)報(bào)告自動(dòng)化解析、數(shù)據(jù)智能挖掘、信貸流水材料智能處理、宏觀行業(yè)分析、風(fēng)險(xiǎn)事件傳導(dǎo)分析等。
在金融領(lǐng)域,征信報(bào)告是識(shí)別個(gè)人信用的最重要風(fēng)控手段,小微企業(yè)融資難,一個(gè)主要原因是個(gè)人征信報(bào)告中存在大量非結(jié)構(gòu)化數(shù)據(jù),很難用傳統(tǒng)的數(shù)據(jù)處理方式進(jìn)行分析。度小滿“智能化征信解讀中臺(tái)”,將NLP、圖算法應(yīng)用在征信報(bào)告的解讀上,能夠?qū)?bào)告解讀出40萬(wàn)維的風(fēng)險(xiǎn)變量,將銀行風(fēng)控模型的風(fēng)險(xiǎn)區(qū)分度提升了26%。
- 寫(xiě)。利用大模型的生成能力,自動(dòng)化生成金融信息的抽取匯總、年報(bào)、行情預(yù)判、客戶畫(huà)像、營(yíng)銷(xiāo)方案等,成為金融從業(yè)人員的“全能助理”, 提升金融機(jī)構(gòu)的效率。
3.說(shuō)。基于自然語(yǔ)言的通用對(duì)話能力,更智能的任務(wù)式對(duì)話理解,打造全新的的智能客服、智能交互服務(wù),例如 “超級(jí)金融顧問(wèn)”,提供專(zhuān)業(yè)建議和方案輔助交流,快速高效低成本地響應(yīng)用戶需求,讓金融更有溫度。
從“智能”到“致用”:度小滿的NLP之路
自然語(yǔ)言處理是人工智能皇冠上的明珠,但在大語(yǔ)言模型展露出強(qiáng)大的通用能力之前,如何用這顆“明珠”洞察金融數(shù)據(jù),沒(méi)有現(xiàn)成的路可走,全世界專(zhuān)注做NLP公司都比較少。2018年的時(shí)候,金融科技公司成立專(zhuān)門(mén)的NLP團(tuán)隊(duì)的更是鮮見(jiàn),NLP在金融領(lǐng)域的應(yīng)用落地也相對(duì)有限。
度小滿則走出了一條獨(dú)特的NLP之路。2018年創(chuàng)立之初,度小滿就看到了“NLP+金融”的潛力,開(kāi)始進(jìn)行相應(yīng)的產(chǎn)業(yè)布局。
首先是人才。人才是創(chuàng)新的源頭。作為源自百度的公司,度小滿在NLP技術(shù)上的人才儲(chǔ)備可為得天獨(dú)厚。度小滿CTO許冬亮,2005年從清華大學(xué)計(jì)算機(jī)系人工智能實(shí)驗(yàn)室畢業(yè)后加入百度,三年多時(shí)間成長(zhǎng)為百度搜索算法領(lǐng)域的領(lǐng)軍人物,在自然語(yǔ)言處理、搜索算法及架構(gòu)、知識(shí)圖譜、LBS、智能營(yíng)銷(xiāo)及反欺詐等領(lǐng)域?qū)移齐y關(guān)。度小滿技術(shù)委員會(huì)執(zhí)行主席楊青,曾任百度主任架構(gòu)師,有著豐富的技術(shù)應(yīng)用實(shí)踐經(jīng)驗(yàn)。
有了人才作為技術(shù)創(chuàng)新的驅(qū)動(dòng)力,度小滿在NLP前沿領(lǐng)域持續(xù)探索,并不斷斬獲成果。
2021年,在微軟舉辦的MS MARCO 比賽中的文檔排序Document Ranking(文檔排序)任務(wù)中,度小滿的AI-NLP團(tuán)隊(duì)排名第一并刷新紀(jì)錄。2022年,團(tuán)隊(duì)研發(fā)的軒轅 (XuanYuan) 預(yù)訓(xùn)練模型也在中文語(yǔ)言理解領(lǐng)域最具權(quán)威性的測(cè)評(píng)基準(zhǔn)之一CLUE分類(lèi)任務(wù)中排名第一。度小滿AI-Lab在預(yù)訓(xùn)練模型、用戶表示、序列建模等NLP任務(wù)相關(guān)算法也取得了突破性進(jìn)展,相關(guān)論文被收入NLP頂會(huì)。
更重要的是,度小滿的NLP之路并沒(méi)有止步于學(xué)術(shù)賽場(chǎng)和實(shí)驗(yàn)室,而是積極走向產(chǎn)業(yè),推動(dòng)NLP技術(shù)與金融場(chǎng)景緊密結(jié)合,典型的就是信貸風(fēng)控場(chǎng)景的征信報(bào)告解讀。
2023年,由度小滿建設(shè)的“智能化征信解讀中臺(tái)”工程,將大型語(yǔ)言模型 LLM、圖算法應(yīng)用在征信報(bào)告的解讀上,榮獲了 “吳文俊人工智能科學(xué)技術(shù)獎(jiǎng)”,度小滿也憑借該工程成為唯一入選的金融科技公司。
今年以來(lái),大語(yǔ)言模型的爆發(fā),讓NLP這一技術(shù)路線成為科技公司和大眾關(guān)注的焦點(diǎn)。
2023年2月,度小滿成為百度文心一言首批生態(tài)合作伙伴,推動(dòng)對(duì)話式語(yǔ)言模型技術(shù)在國(guó)內(nèi)金融場(chǎng)景的落地應(yīng)用。
大語(yǔ)言模型掀起的AI熱潮還在持續(xù),大眾的關(guān)注焦點(diǎn),也從“訓(xùn)大模型”,擴(kuò)展到了“用大模型”的長(zhǎng)線故事。
度小滿作為一支超前布局、技術(shù)前沿性強(qiáng)、與金融產(chǎn)業(yè)接軌十分成熟的NLP力量,有望跑通大模型從技術(shù)到產(chǎn)業(yè)應(yīng)用的落地之路。
審核編輯 黃宇
-
AI
+關(guān)注
關(guān)注
87文章
30106瀏覽量
268399 -
nlp
+關(guān)注
關(guān)注
1文章
487瀏覽量
22011
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論