電子發燒友網報道(文/李彎彎)3月16日下午,百度在北京總部舉行新聞發布會,正式發布新一代大語言模型、生成式 AI 產品文心一言。百度創始人、董事長兼首席執行官李彥宏,百度首席技術官王海峰出席,并展示了文心一言在文學創作、商業文案創作、數理推算、中文理解、多模態生成五個使用場景中的綜合能力。
文心一言在五大使用場景中的能力展示
在文學創作方面,李彥宏以《三體》為例,針對“《三體》的作者是哪里人?電視劇《三體》演員都有誰?于和偉和張魯一有哪些共同點?于和偉和張魯一誰更高?”等事實性問題,文心一言都給出了準確的回答。
針對“可以總結一下《三體》的核心內容嗎?如果要續寫的話,可以從哪些角度出發?如何從哲學的角度續寫?”等問題,文心一言也從多個角度給出了建議,體現出強大的總結分析能力和推理能力。
在商業文案創作方面,文心一言順利完成了給公司起名字、寫Slogan、寫新聞稿的任務。可以看到文心一言可以準確理解人類意圖,能夠清晰地表達。這是基于龐大數據規模的訓練,文心一言大模型的訓練數據包括萬億級網頁數據、數十億的搜索數據和圖片數據、百億級的語音日均調用數據,以及5500億事實的知識圖譜等。
在數理邏輯推算方面,文心一言體現出了很強的推理能力。比如,面對“雞兔同籠”的問題,文心一眼就能夠很快識別出問題不對。當修改問題之后,文心一言能夠很快理解題意,給出解題思路,設立方程式,一步步得出正確答案。
在中文理解方面,文心一言表現出了對中國文化的強大理解力。比如,正確解釋“洛陽紙貴”的含義,以及“洛陽紙貴”在現代經濟學原理里對應的理論。文心一言還用“洛陽紙貴”創作了一首藏頭詩,“洛陽城里春光好,陽艷無雙不負賞。紙貴漫天詩詞賦,貴比黃金樂未央。”
在多模態生成方面,文心一言展示出了文本、圖片、音頻和視頻的生成能力。在音頻生成方面,文心一言可以生成多個地方的方言,比如廣東話、閩南語,在發布會現場演示的是四川話。視頻生成能力方面,因為成本較高,現階段還未對所有用戶開放,未來會逐步接入。
李彥宏表示,多模態是生成式AI一個明確的發展趨勢。未來,隨著百度多模態統一大模型的能力增強,文心一言的多模態生成能力會不斷提升。
從上述演示來看,文心一言某種程度已經具備了對人類意圖的理解能力,能夠較為準確的、有邏輯的、流暢的表達。不過李彥宏表示,這類大語言模型還在不斷完善的過程中,它有時會帶來驚喜,有時也會出錯,不過它的發展非常迅速。
大型語言模型帶來的產業機會
無論是哪家公司都不可能靠幾個月突擊,就做出這樣一個大型語言模型,深度學習、自然語言處理等都需要多年的堅持和積累。可以說,文心一言是百度過去多年努力的延續。
人工智能時代,IT技術棧發生了根本性改變,從原來的三層變成了現在的四層,包括芯片層、框架層、模型層、應用層。百度是全球范圍內為數不多在四層都有領先產品的公司。
百度AI全棧布局的優勢在于,可以在技術棧的四層架構中實現端到端優化,大幅提升效率。相比于之前判別式AI,生成式AI非常消耗算力,費用相當昂貴,四層之間的協同作用很關鍵,尤其是框架層和模型層的協同,能夠大大提升效率。
百度自2月宣布文心一言以來,已有超過650家企業宣布加入文心一言生態。生成式AI代表了一個新的計算范式,它會帶來市場需求的爆發式增長,將釋放出前所未有的、指數級的商業價值。文心一言不僅影響搜索、互聯網公司,它可以讓每一家公司都離自己的客戶更近。
大型語言模型會帶來哪些產業機會?李彥宏談到了三點:一是新型云計算,文心一言將根本性地改變云計算行業的游戲規則,之前企業選擇云廠商更多看算力、存儲等基礎云服務。未來,更多會看框架、模型,以及芯片、框架、模型和應用四層之間的協同。
二是行業模型精調,這是這是通用大模型和行業企業之間的中間層,他們可以基于對行業的洞察,調用通用大模型能力,為行業客戶提供解決方案。這方面,百度文心大模型已經在工業、金融、交通、媒體等領域,發布了10多個行業大模型。
三是應用開發,即基于大模型底座進行應用開發的公司,對于大部分創業企業來說,真正的機會并不是從頭開始做ChatGPT和文心一言這樣的基礎大模型,而是基于通用大語言模型搶先開發重要的應用服務。目前基于文本、圖片、音視頻生成、數字人、3D生成等場景,已經涌現出很多創業明星公司。
從技術層面來看,文心一言是新一代知識增強大語言模型,具備對話交互、內容創作、知識推理、多模態生成等能力。
據王海峰介紹,它的關鍵技術包括有監督精調、人類反饋的強化學習、提示、知識增強、檢索增強和對話增強。前三項是這類大語言模型都會采用的技術,ERNIE和PLATO中已經有應用和積累,在文心一言中又有了進一步強化和打磨;后三項則是百度已有技術優勢的再創新,也是文心一言未來越來越強大的基礎。
在知識增強方面,文心一言主要是通過知識內化和知識外用兩種方式。知識內化,是從大規模知識和無標注數據中,基于語義單元學習,利用知識構造訓練數據,將知識學習到模型參數中;知識外用,是引入外部多源異構知識,做知識推理、提示構建等。
在檢索增強方面,文心一言是來自以語義理解與語義匹配為核心技術的新一代搜索架構。通過引入搜索結果,可以為大模型提供時效性強、準確率高的參考信息,更好地滿足用戶需求。
在對話增強方面,基于對話技術和應用積累,文心一言具備記憶機制、上下文理解和對話規劃能力,實現更好的對話連貫性、合理性和邏輯性。
飛槳深度學習平臺支撐文心一言效果更好、效率更高、性能更強。王海峰強調,對于開發訓練,飛槳動靜統一的開發范式,以及自適應分布式架構,可以實現大模型的靈活開發和高效訓練。在推理部署方面,飛槳提供高并發彈性服務化部署,深度計算融合優化,軟硬協同稀疏量化加速、模型自適應蒸餾剪裁等,支持大模型高效推理。
小結
文心一言在文學創作、商業文案創作、數理推算、中文理解、多模態生成五大使用場景中展示出了比較強的理解能力和推理能力。
不過整體而言,文心一言目前來說還并不完善,未來隨著用戶的接入使用,及百度在技術上的不斷調優,文心一言將會不斷迭代,并展現出更強大的能力。在李彥宏看來,人工智能會徹底改變今天的每一個行業,文心一言是創新驅動發展的最佳證明。
文心一言在五大使用場景中的能力展示
在文學創作方面,李彥宏以《三體》為例,針對“《三體》的作者是哪里人?電視劇《三體》演員都有誰?于和偉和張魯一有哪些共同點?于和偉和張魯一誰更高?”等事實性問題,文心一言都給出了準確的回答。
針對“可以總結一下《三體》的核心內容嗎?如果要續寫的話,可以從哪些角度出發?如何從哲學的角度續寫?”等問題,文心一言也從多個角度給出了建議,體現出強大的總結分析能力和推理能力。
在商業文案創作方面,文心一言順利完成了給公司起名字、寫Slogan、寫新聞稿的任務。可以看到文心一言可以準確理解人類意圖,能夠清晰地表達。這是基于龐大數據規模的訓練,文心一言大模型的訓練數據包括萬億級網頁數據、數十億的搜索數據和圖片數據、百億級的語音日均調用數據,以及5500億事實的知識圖譜等。
在數理邏輯推算方面,文心一言體現出了很強的推理能力。比如,面對“雞兔同籠”的問題,文心一眼就能夠很快識別出問題不對。當修改問題之后,文心一言能夠很快理解題意,給出解題思路,設立方程式,一步步得出正確答案。
在中文理解方面,文心一言表現出了對中國文化的強大理解力。比如,正確解釋“洛陽紙貴”的含義,以及“洛陽紙貴”在現代經濟學原理里對應的理論。文心一言還用“洛陽紙貴”創作了一首藏頭詩,“洛陽城里春光好,陽艷無雙不負賞。紙貴漫天詩詞賦,貴比黃金樂未央。”
在多模態生成方面,文心一言展示出了文本、圖片、音頻和視頻的生成能力。在音頻生成方面,文心一言可以生成多個地方的方言,比如廣東話、閩南語,在發布會現場演示的是四川話。視頻生成能力方面,因為成本較高,現階段還未對所有用戶開放,未來會逐步接入。
李彥宏表示,多模態是生成式AI一個明確的發展趨勢。未來,隨著百度多模態統一大模型的能力增強,文心一言的多模態生成能力會不斷提升。
從上述演示來看,文心一言某種程度已經具備了對人類意圖的理解能力,能夠較為準確的、有邏輯的、流暢的表達。不過李彥宏表示,這類大語言模型還在不斷完善的過程中,它有時會帶來驚喜,有時也會出錯,不過它的發展非常迅速。
大型語言模型帶來的產業機會
無論是哪家公司都不可能靠幾個月突擊,就做出這樣一個大型語言模型,深度學習、自然語言處理等都需要多年的堅持和積累。可以說,文心一言是百度過去多年努力的延續。
人工智能時代,IT技術棧發生了根本性改變,從原來的三層變成了現在的四層,包括芯片層、框架層、模型層、應用層。百度是全球范圍內為數不多在四層都有領先產品的公司。
百度AI全棧布局的優勢在于,可以在技術棧的四層架構中實現端到端優化,大幅提升效率。相比于之前判別式AI,生成式AI非常消耗算力,費用相當昂貴,四層之間的協同作用很關鍵,尤其是框架層和模型層的協同,能夠大大提升效率。
百度自2月宣布文心一言以來,已有超過650家企業宣布加入文心一言生態。生成式AI代表了一個新的計算范式,它會帶來市場需求的爆發式增長,將釋放出前所未有的、指數級的商業價值。文心一言不僅影響搜索、互聯網公司,它可以讓每一家公司都離自己的客戶更近。
大型語言模型會帶來哪些產業機會?李彥宏談到了三點:一是新型云計算,文心一言將根本性地改變云計算行業的游戲規則,之前企業選擇云廠商更多看算力、存儲等基礎云服務。未來,更多會看框架、模型,以及芯片、框架、模型和應用四層之間的協同。
二是行業模型精調,這是這是通用大模型和行業企業之間的中間層,他們可以基于對行業的洞察,調用通用大模型能力,為行業客戶提供解決方案。這方面,百度文心大模型已經在工業、金融、交通、媒體等領域,發布了10多個行業大模型。
三是應用開發,即基于大模型底座進行應用開發的公司,對于大部分創業企業來說,真正的機會并不是從頭開始做ChatGPT和文心一言這樣的基礎大模型,而是基于通用大語言模型搶先開發重要的應用服務。目前基于文本、圖片、音視頻生成、數字人、3D生成等場景,已經涌現出很多創業明星公司。
從技術層面來看,文心一言是新一代知識增強大語言模型,具備對話交互、內容創作、知識推理、多模態生成等能力。
據王海峰介紹,它的關鍵技術包括有監督精調、人類反饋的強化學習、提示、知識增強、檢索增強和對話增強。前三項是這類大語言模型都會采用的技術,ERNIE和PLATO中已經有應用和積累,在文心一言中又有了進一步強化和打磨;后三項則是百度已有技術優勢的再創新,也是文心一言未來越來越強大的基礎。
在知識增強方面,文心一言主要是通過知識內化和知識外用兩種方式。知識內化,是從大規模知識和無標注數據中,基于語義單元學習,利用知識構造訓練數據,將知識學習到模型參數中;知識外用,是引入外部多源異構知識,做知識推理、提示構建等。
在檢索增強方面,文心一言是來自以語義理解與語義匹配為核心技術的新一代搜索架構。通過引入搜索結果,可以為大模型提供時效性強、準確率高的參考信息,更好地滿足用戶需求。
在對話增強方面,基于對話技術和應用積累,文心一言具備記憶機制、上下文理解和對話規劃能力,實現更好的對話連貫性、合理性和邏輯性。
飛槳深度學習平臺支撐文心一言效果更好、效率更高、性能更強。王海峰強調,對于開發訓練,飛槳動靜統一的開發范式,以及自適應分布式架構,可以實現大模型的靈活開發和高效訓練。在推理部署方面,飛槳提供高并發彈性服務化部署,深度計算融合優化,軟硬協同稀疏量化加速、模型自適應蒸餾剪裁等,支持大模型高效推理。
小結
文心一言在文學創作、商業文案創作、數理推算、中文理解、多模態生成五大使用場景中展示出了比較強的理解能力和推理能力。
不過整體而言,文心一言目前來說還并不完善,未來隨著用戶的接入使用,及百度在技術上的不斷調優,文心一言將會不斷迭代,并展現出更強大的能力。在李彥宏看來,人工智能會徹底改變今天的每一個行業,文心一言是創新驅動發展的最佳證明。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
文心一言
+關注
關注
0文章
123瀏覽量
1256 -
大模型
+關注
關注
2文章
2322瀏覽量
2479
發布評論請先 登錄
相關推薦
百度文心大模型4.0 Turbo,正式發布 用戶規模已達3億
的最新數據,并正式發布文心大模型4.0 Turbo、飛槳框架3.0等最新技術,披露飛槳文心生態最
李彥宏高度評價百度文心一言模型及AI技術,強調商業化將持續推進
據了解,目前已有近10萬家企業使用了文心一言的能力,其中10%的大搜流量由該模型產生,每日有250萬用戶受益于文庫的AI功能。未來,百度計劃
百度起訴“文心一言”公司涉嫌商標侵權,不正當競爭糾紛即將開庭
公告中指責對方涉嫌商標侵權,引發了一場涉及人工智能領域的法律大戰。 據了解,百度公司推出的“文心一言”是
發表于 02-06 11:44
?1559次閱讀
評論