12月28日,2024中國信通院ICT+深度觀察報告會上海分會場暨“虹橋之源”大模型驅動數字經濟新生態峰會在上海長寧召開。
會議首次深度聚焦大模型,邀請了眾多學者、專家論道AI前沿技術創新和落地應用實踐。會議中,學者們就當前AI發展現狀達成共識:以十至二十年為周期,目前大模型還處在起步階段,2024年圍繞行業應用會“落子不斷”。
圍繞當前AI大模型行業落地中的挑戰,這些專家、學者也基于自己的觀察,從算力、數據、算法出發,圍繞醫療、通信、城市管理、金融服務等領域,給出了一些“最優解”。相信AI應用中遇到的大多數問題,都能在這次會議中找到答案,本文為演講實錄,enjoy~
阿里云:AI與算力驅動產業創新
從IT時代、互聯網時代到智能時代的演進過程中,產業發展和公司市值經歷了巨大變化。 ? 在傳統軟件時代,許多巨頭公司打造了千億市值;互聯網+時代,蘋果等公司達到了萬億市值。 ? 進入萬物互聯和大模型時代,我們預見將出現十萬億市值的公司。 ? 這不僅代表技術巨頭的壟斷,更意味著技術的普惠。 ?
人工智能和大模型的發展帶來的不僅是技術革新,更是產業與技術融合的新機遇。 ? 我們目睹了眾多創業公司的誕生,這些新生企業的涌現預示著產業發展將比以往任何時代都更加繁榮。
在新的智能時代,云計算的體系可能會發生變化。傳統的IaaS、PaaS、SaaS可能會被模型服務所取代。 ? 如果能將模型作為服務提供給更多開發者和合作伙伴,將會創造出更多創新場景。 ?
AI時代的新挑戰
阿里云致力于打造AI時代最開放的云。 ? 為了實現這一愿景,重點放在三個主要領域:首先是構建AI時代關鍵的計算基礎設施,其次是以模型為中心來加速創新,最后則是構建一個繁榮且開放的生態系統。
在智能時代,數據中心的概念經歷了重新定義,從處理大量數據的集群轉變為能夠連接異構計算芯片進行高效預訓練和推理的高效計算樞紐。 ? 對基礎設施提供商來說,這意味著面臨新挑戰。 ?
大模型訓練尤其面臨四大挑戰: ? 首先,梯度下降等步驟需要大量數據在機器之間傳輸,對網絡速度和穩定性要求極高; ? 其次,復雜的訓練算法需要依賴高效的數據處理和算法優化; ? 第三,如何在指定的計算和網絡資源下實現效率和成本的最優平衡; ? 最后,面對硬件故障,如何有效地遷移任務和恢復系統。
針對這些挑戰,靈駿的平臺依靠高速網絡、網絡容錯技術和強大的平臺調度能力。 ? 這不僅提升了預訓練和SFT的效率,還實現了集群內機器的動態擴展,確保在智能時代,數據中心依舊能像一臺高效的超級計算機般運作。
訓練是大模型應用體系中的一個重要環節,但在實際應用中,推理的效率和成本同樣關鍵。 ? 當下,雖然許多創業公司和研究團隊專注于大模型的預訓練,但真正的挑戰在于如何將大模型有效地應用于實際場景中,確保模型在推理階段的高效、低成本運行,并能夠適應動態的負載需求,特別是在全球不同地點進行推理時。 ?
阿里云的靈積平臺通過顯著提升吞吐能力和計算效率,高達4倍的吞吐提升和8倍的計算資源節約,并支持快速動態擴容,全面支撐大模型從訓練到推理的生命周期。 ? 同時,它服務于政企行業,通過專有云和混合云體系優化基礎設施,提高訓練效率和穩定性。 ? 此外,平臺還支持行業特定模型的開發,并通過API提供,使終端APP創業者和用戶能夠便捷地調用,加速大模型技術的廣泛應用和發展。
阿里云的AI大模型行業落地
我們開發了多個專門的應用來結合大模型技術和特定場景需求: ? 聽悟用于結合語言模型和文本生成會議摘要; ? 星塵用于構建角色; ? 靈碼是一個編程輔助平臺,它可以自動生成代碼注釋,幫助那些不喜歡寫注釋的程序員; ? 曉蜜適用于客服場景; ? 點金用于金融領域; ? 智文幫助用戶分析和總結論文,尤其在醫藥和其他行業領域中的應用; ? 法律領域有法睿; ? 仁心則面向終端用戶提供醫療知識查詢。 ? 這些應用通過大模型技術實現了功能的創新和服務的優化。 ?
阿里云推出了兩項關鍵技術模型:通義千問和通義萬相,分別用于語言理解和圖像生成,滿足創意及圖像場景需求。 ? 自2021年以來,阿里巴巴集團深耕大模型研發,推出了M6、M6-oba系列和千億參數的通義千問2.0版本,即使在Chat GPT引起廣泛關注的背景下,阿里云的模型在國際上仍表現出色。 ? 特別值得一提的是,阿里云開源了72B、7B、14B及1.8B參數模型,推動了模型社區的快速發展,并且在提供更長上下文、角色設定和語言風格等方面展現了出色的性能,極大地促進了應用開發的微調過程。 ? 同時,阿里云還建立了中國最大的模型社區:魔搭社區(ModelScope)。 ? 其聚集了2300多個高質量開源模型,實現了億級下載量,為開發者提供了豐富資源和廣闊的創新平臺。
魔搭社區不僅開放了各種模型,還提供了約600個數據集,支持開發者進行全面的模型訓練和創新,超越了僅依賴現有數據的局限。 ? 社區通過提供大量免費的GPU資源(累計3000萬GPU小時)大幅降低了技術門檻,促進了模型開發和應用。 ? 盡管將模型應用于行業數字化場景仍在探索階段,魔搭社區正不斷推進模型的實際落地和廣泛應用。
阿里云也在探索Agent體系作為一種解決軟件開發和現實世界不確定性問題的有效方法,旨在重構數字化軟件開發的過程,而不僅僅是構建一個個人助理。 ? 這種探索代表了對模型和智能體系更深層次的理解和運用,旨在為不同行業提供更精準、高效的數字化解決方案。 ? ?
阿里云對未來AI大模型的思考
在整合模型應用于產業和行業時,單一的基礎模型或行業模型并不足夠; ? 它們需要與決策問答、情感分析等多項智能能力相結合,并融合各種AI技術來構建針對特定領域的解決方案。 ? 這包括模型訓練、應用、管理、評估及安全性提升,并可能涵蓋第三方技術的集成,以增強模型的決策和知識處理能力。 ? 因此,需要構建一個全面的系統,包含平臺和工具鏈,以便快速有效地將模型整合并應用于實際行業,覆蓋從數據處理到智能化應用的全流程。
在實際場景中,單個大模型或者混合專家模型(MOE)往往不足以應對復雜多變的需求。未來的發展方向在于整合多個模型、行業規則和系統接口,通過AI Agent來完成復雜的工作流。 ? AI Agent不僅僅是簡單的助手或搜索工具,而是能夠解決實際行業問題的綜合系統,集成了多年來積累的行業知識和小型模型,具備長短期記憶和規劃能力。 ? 這種轉變可能導致數字化系統的重構,改變我們對軟件開發和運維的理解。 ? 我們期待通過Agent的建設,與行業同仁和伙伴一同探索和實現軟件行業的重構,為未來的模型開發和應用帶來更大的價值和成果。 ?
OPPO:大模型在終端中的應用場景與演進
回顧手機的發展,從最初的功能機到當前廣泛使用的智能手機,可以看到技術的演進是逐步的。 ? 目前,我們正站在智能手機向智慧手機過渡的門檻上,這是移動通信技術每十年大約邁進一代的自然結果,顯然我們目前處于5G時代,并且已經開始探討5G之后的技術,包括5GA和6G。
在這個發展過程中,移動通信不僅改變了我們個人的工作和生活方式,還成為推動經濟發展的重要力量。 ? 向前看,隨著5G及其后續技術的不斷發展和成熟,智慧互聯時代的到來將使得在線會議、虛擬現實、在線娛樂等服務更加普遍,進一步改善我們的溝通方式。
從1G的模擬信號到5G時代的豐富智慧終端,每一次技術的飛躍都極大地推動了社會的進步。 ? 我們有理由相信,隨著5G、6G等更先進技術的發展,未來的終端設備將不僅僅是智能的,而是更加智慧化,為我們帶來更全面的互聯體驗和生活方式。
通信場景下的AI大模型
回溯至1954年,人工智能的概念首次被提出,后續發展至機器學習讓機器具備自我編程和學習的能力,進一步演變為基于深度神經網絡的深度學習。 ? 現在,生成式AI,如ChatGPT,作為這一領域的典型應用,已廣泛應用于多個場景。 ? 大模型作為深度學習的一個分支,已迅速成為AI研究的主流。 ? 它的應用場景大致可分為六類,包括問答、情緒分析、信息提取、圖像命名、物體識別和跟隨指示等。 ? 隨著技術的發展,大模型在各領域的應用將進一步深入。
值得一提,大模型在終端設備上的應用是一個正在探索的領域。這涉及到AI+C的概念,其中"C"代表連接、創造、理解和陪伴。 ? 例如,大模型可以用于改善老年人的手機使用體驗,通過自然語言理解幫助他們更好地使用智慧設備。 ? 此外,大模型還可應用于旅行中的智慧連接體驗、基于情景的服務提供,以及智慧辦公場景如自動生成會議紀要等,極大地提升工作效率和生活質量。 ? 四個C的概念如下:首先Connection(連接),大模型可以用于智慧終端的連接,提升旅行或日常生活中的體驗。 ? 例如,與東南亞的初創廠商合作,使用大模型技術豐富旅行過程中的體驗。 ? 其次,Creation(創造),大模型可以激發創意表達,比如增強手機攝影能力,或者在拍攝長城時自動去除照片中不需要的路人,提升創意和個性化體驗。 ? 第三,Comprehension(理解),大模型能夠基于情景理解提供服務,如對于前往新加坡旅游的情景,提供針對性的服務和建議,從而使手機成為更智慧的旅伴。 ? 最后,Companion(陪伴),大模型可以作為智慧辦公的伙伴,自動化處理諸如郵件回復、會議紀要等任務,大幅提升工作效率和便捷性。 ? ?
智慧終端的AI應用
根據A16Z對2024年消費者技術的四大預測,可以預見的第一大變化是語言優先的交互方式。 ? 如果能夠實現語言優先,我們與智慧終端的交互體驗將得到顯著提升,移動設備的使用將變得更加高效和直觀。
第二個預測是更多適合垂直領域的小模型的出現。 ? 在某些應用場景下,例如生成會議紀要,我們可能不需要龐大的全功能模型,而是小而專一的模型就能滿足需求,這體現了消費者技術的演進和AI的垂直應用。
手機的初衷,是實現遠程通信。現在,我們看到的是智慧交流和跨語言交流的潛力,這預示著智慧手機不僅是通訊工具,也是連接世界的橋梁。 ? 目前手機在家庭教育、運動健康等方面也有應用,如智能輔導作業、提供健康建議等,這些都可利用本地大模型,確保數據隱私和安全的同時提供有用的服務。
智慧手機的目標是實現高效工作、便捷生活和個性表達。 ? 我們預見未來不僅是智慧手機,還將進入到泛載CPS的時代。 ? CPS即物理世界和虛擬世界的交互,預示著在這樣的世界中,交互將變得更智能,連接將變得更廣泛。 ? 在2030年的智慧生活中,"可信"和"泛載"將成為兩個關鍵詞。 ? 我們相信,隨著大模型的蓬勃發展,其在終端設備上的應用將為我們的工作和生活帶來更多益處,提供更有趣、更豐富的體驗。 ?
優刻得:構筑垂直大模型算力底座
優刻得公司副總裁 文天樂 ? GPT大模型的技術起源于谷歌的翻譯技術,隨后OpenAI等企業通過多年技術提升,才在2023年3月發布了具有顯著市場影響力的產品。 ? 目前,國內已有超過100家企業跟進這一技術路線,取得了諸多成果。
GPT3.5發布后展示的智能體驗為企業應用開辟了廣闊的想象空間。 ? 大模型的訓練是一項智力密集和算力密集的活動,這通常意味著巨大的資金投入。 ? 基本模型的訓練依賴于萬億級互聯網數據的積累和數千張GPU卡的規模,通常需要數月時間,再加上高質量數據的整合和有監督的強化學習,才能實現相較于傳統人工智能的智能體驗。
垂域大模型構建的三種實踐路徑
對于企業而言,構建自己的垂直大模型有幾種途徑。 ? 如果不考慮資金和人力成本,可以從頭開始訓練大模型,使用自己的數據加上通用數據進行充分訓練,這樣可以獲得最佳效果和性能,但需要較大的資金投入。
企業構建垂直大模型,第二種方式是利用開源模型或廠商提供的模型,并使用企業自己垂直領域的私有數據進行微調訓練。 ? 這種方法可以達到相對較好的效果,且訓練成本會大幅降低,但推理成本依然較高。
第三種方式是企業在嘗試使用大模型時,選擇不進行訓練或僅進行微調,而是將業務數據象量化后加入模型上下文中以進行業務嘗試。 ? 這種方法考慮到了現實世界的應用限制,即訓練或微調的模型難以實時更新,因此通常結合第一種和第三種方法,或第二種和第三種方法來使用。 ? 考慮到業務數據的持續變化,重新訓練模型是成本高昂的,尤其是在數據安全和隱私合規方面,所有企業、政府單位的數據都是在網絡安全法前提下處理,這也是垂直領域大模型應用的一個關鍵問題。 ? ?
構建垂類大模型需考慮的因素
在實際應用時,不僅要考慮訓練和推理成本,還要注重數據安全、合規和管理。 ? 因此,許多企業和機構在嘗試大模型時也在探索國產化和線上化的私有部署方案,以確保數據安全和合規性。 ? 對于政府和其他受監管行業而言,自主可控的問題也是不可忽視的。 ? 另外,算力密集型的大模型應用還涉及高能耗問題,在訓練過程中尤其明顯,且模型通常以月為單位迭代更新,這導致巨大的能源消耗。
我們在烏蘭察布部署的云基地旨在為大數據和人工智能提供低成本的算力中心,以解決幾個關鍵領域的問題,包括數據的長期存儲。 ? 特別是隨著2023年AI大模型的爆發,對電力和算力的需求急劇增加,烏蘭察布的新型IDC能夠提供8-12千瓦的針對大模型訓練的機柜定制服務。 ? 大模型訓練完畢后,為了更好地接近用戶和應用,推理過程可以轉移到沿海東部地區進行。 ? 除了基礎的高性價比算力中心,大模型的訓練、部署和應用還需要軟件和運維的基礎設施。 ? 這涉及到頻繁更新迭代部署的需求,包括基于私有云的適配各種GPU卡和硬件,以及國產化、信息安全信創化硬件和開源模型技術應用到開源框架的適配。 ? ? ? 在為企業應用提供大模型解決方案方面,我們已經適配了多種硬件,并提供了一體化的方案。 ? 此外UCloud為人工智能和大數據提供了三大價值:一是東數西存,二是東數西算,三是東推西訓。 ? 這些策略符合國家的東數西算戰略和雙碳戰略,利用西部地區相對較低的綜合能源成本和較低的平均氣溫,用戶可以在西部地區享受到高性價比的存儲和算力服務。 ?
華為:構筑智能根基,共建AI新生態
華為上海戰略與Marketing部部長?房思哲 ? 2022年11月份,ChatGPT引發了AI大模型的新熱潮。 ? 這一趨勢不僅是技術上的拐點,將AI從傳統的感知、識別進化至生成階段,也是應用上的轉折,預示著AI將深入千行百業。
華為在這一趨勢中一直在構建全棧能力,從2020年開始,我們就已經認識到大模型的潛力,并致力于AI的基礎軟硬件,以此深化我們的根基技術,并推動AI大模型的創新。 ? 我們從最底層的AI加速硬件做起,提供了端到端的產品線,包括異構計算框架、高性能算子庫等基礎加速庫。 ? 基于這些硬件,我們建立了適合大模型的昇思人工智能框架,進而構建了昇騰應用使能MindX,包含了深度學習、智能邊緣等各種優選模型庫和行業SDK,使得各行業的應用能在此基礎上孵化。
華為構建AI大模型生態
談及大模型的根基,我們認為大模型真正走進千行百業不僅僅是技術問題,還需要社會化視角和生態化理念。 ? 根基只是起點,我們需要的是一棵枝繁葉茂的樹,即生態。 ? 自2020年以來,在過去的3-4年里,華為在計算產業領域堅持了“硬件開放、軟件來源、使能伙伴、發展人才”的16字方針的生態理念。 ? 接下來,我將分別介紹我們在這四方面的進展。 ?
硬件開放:華為推出了自己的人工智能芯片,并且開放硬件平臺給合作伙伴,允許他們基于華為的技術開發和打造各種產品,以滿足各行各業的需求。
軟件來源:在軟件方面,華為的昇思人工智能框架作為構建AI大模型生態的核心,支持各種異構芯片,并孵化各種行業應用。
使能伙伴:華為依托生態創新中心,推進本地合作伙伴的使能工作,包括生態發展、聯合創新、技術支持和人才培養。
發展人才:華為與國家教育部聯合開發課程教材,推廣至全國高校。通過舉辦人工智能創新大賽、師資培訓等活動,華為旨在培養更多熟悉中國自主人工智能技術的學生和教師,為產學研轉化做好準備。
華為AI大模型的上海探索
在上海,華為圍繞大模型應用進行了一系列合作和探索。 ? 舉幾個例子來說明我們在這一領域的進展。
在今年7月份的上海人工智能大會上,我們與上海飛機設計研究院共同發布了“東方·翼風”,這是一款基于華為昇騰和昇思人工智能根技術共同孵化的三維機翼仿真流體和力學仿真大模型。 ? 這個大模型在上海飛機設計研究院實測后顯示,在保持與傳統工業仿真相媲美的精度的同時,效率得到了大幅度提升,仿真時間消耗降低到原來的千分之一,為大飛機設計和制造帶來了明顯的助力。
此外,我們還與中科院上海藥物所、以及上海人工智能研究院、商湯、綜合裝備院、達觀數據等多家企業在上海展開了深度合作,圍繞各行各業想要孵化和打造的大模型場景進行了多方位的探索和合作。 ? 我們的目標是堅信人工智能最終將走入千行百業,通過這些合作項目,我們在實現這一目標的路上邁出了堅實的步伐。 ?
百度:AI原生應用觸手可及
百度智能云產業發展部總經理 段永華 ? ? 這一年,我們見證了大模型的從理論到實用的轉變。尤其內容創作、互動交流、教育和游戲等領域的應用逐漸增多。 ? 然而,從10年或20年的長周期來看,大模型目前仍處于起步階段。它的能力存在一定的局限性,在應用落地層面,仍需要進行相對復雜的工作。
百度智能云千帆大模型平臺的行業實踐
百度公司推出了千帆大模型平臺,繼續在AI領域的應用開發上深耕細作。 ? 百度從2019年起投入大模型研發,并已形成從底層硬件到應用層面的一站式服務能力。 ? 百度的整體系統包括數據處理、工具鏈、模型廣場到AI衍生應用,能夠提供全方位的技術支持。
在深入討論大模型未來應用前景時,重要的是采取以終為始的思考方式。 ? 目前廣泛認可的大模型應用不單是一個單體模型,而是一個由基礎大模型、行業特定模型、場景化模型組成的體系。 ? 這個體系不僅包含云端、汽車端到手機端的大小不一的模型,所有這些模型都需要有機協同工作以支持整個企業應用生態。
尤其是在城市管理和金融服務等大型企業應用體系中,需要一個綜合的模型體系來發揮作用。 ? 為此,更需要一套系統化的體系和機制來管理、調度和協調這些模型。 ? 從統計數據來看,眾多客戶已在百度千帆平臺上開展服務,表明各行各業正在開發并實施具體的商業化應用。 ? 這標志著行業處于初步階段,并預計將在2024年以更快速度向各行各業擴散。
然而,在基于大模型的應用開發中,也面臨著多重挑戰。 ? 模型的精細調整通常既困難又需要專業知識,而大模型技術人才相對稀缺,這對許多企業尤其是小型企業來說是一個挑戰。 ? 同時,有數百上千個大模型可供選擇時,需要一套評估機制和方法來決定哪個模型最適合特定場景。
最近,百度升級其千帆平臺,集成全球優秀模型并優化模型調整、評估及推理,以數據和安全增強提高企業效率并降低成本。 ? 這些改進不僅加快模型到業務應用的轉化,還使企業通過高效的在線訓練方法更好地利用數據,降低時間和成本。 ?
在大模型選擇和應用方面,百度提供了綜合的評價體系,結合AI自動打分和專家評分,以幫助企業和合作伙伴挑選最適合的模型。 ? 面對推理資源限制,百度支持無損推理加速和國內信創硬件適配,確保模型部署和訓練的順暢進行。 ? 應用開發領域內,百度利用大模型的AI原生應用生成工具及完整開發套件,使技術人員可以進行深度定制和開發。 ? 同時,將傳統確定性模型能力與大模型能力整合,預見這些能力將融合進未來的基礎大模型。 ? 作為大模型提供商,百度還融合其云計算服務,提供全面的云產品和服務,以支持更廣泛的應用和發展。 ?
九章云極DataCanvas:AI原生企業的黎明
九章云極DataCanvas副總裁 于建崗 ? ? 當前正處于一個以大算力為特征的時代,全球范圍內積極推進算力建設,英偉達以其在GPU市場的主導地位和業務多元,凸顯了這一趨勢。 ? 同時,2023年美國股市的顯著上漲和SaaS企業收入的下滑反映出新時代的復雜性與挑戰。 ? 這些現象促使深入思考AI2.0或新智能時代下,企業系統可能面臨的顛覆性變化、重塑以及軟件生態的智能化重構。
AI大模型變革IT建設
過去20年,企業在收入的驅動下大量投入IT建設,為滿足公司的數字業務需求,中至大型企業廣泛建立龐大的IT部門。 ? 然而,這一過程也引入了諸多復雜性和協同問題。 ? 例如,過于龐大的IT部門導致組織內協同困難,業務部門與IT部門之間的溝通不暢,以及采購多樣化SaaS服務帶來的一致性問題。 ? 這些問題最終阻礙了業務創新的速度和效率。
特別是在大模型時代的到來,這種情況更加凸顯。 ? 大模型,廣義上不僅僅是大語言模型的對話體驗,也開始延申到例如蛋白質結構預測、機器人等應用領域。 ? 這些先進的技術為人類社會帶來深遠的影響。 ? 因此,企業在數字化建設上需要重新定義策略,以適應這一新的大模型時代。 ? 而IT部門的角色和操作模式,特別是在收入驅動和效益創造方面,也必須進行相應的調整和優化,以保持企業的競爭力和創新能力。
在大模型的時代中,企業正面臨如何利用大模型推動業務發展和創造利潤的挑戰。 ? 關鍵在于將業務部門置于核心,驅動IT建設和智能化升級,因為業務部門深諳資金來源、業務路徑和客戶需求。
新時代的解決方案:模型即服務
觀察軟件行業的發展歷程,從基礎設施即服務(IaaS)到平臺即服務(PaaS),再到軟件即服務(SaaS),雖然帶來了便利,但也引入了割裂、分割和碎片化的問題。 ? 業務需求通過繁瑣的部門流程,導致項目延誤,甚至半年后也難以啟動。 ? SaaS服務盡管有其優勢,但也不可避免地帶來了傳統軟件固有的問題。
為了解決傳統軟件建設中人才價值未能充分發揮的問題,新時代的解決方案趨向于采用大模型和模型即服務(MaaS)來覆蓋企業全員,釋放各自的專長和創意。 ? 這些技術允許員工利用自然語言處理和其他靈活、多樣的工具,輕松實現業務訴求,而不需要深入了解復雜的底層技術。 ? 這種方式極大地簡化了創意到實現的過程,讓員工可以更直接地將想法轉化為具體成果。
以繪畫為例,過去可能需要通過畫家來理解并轉化一個人的想法,而現在,員工可以直接與工具交流,即刻得到所需的繪畫成果,極大地提高了效率和創造力的發揮。 ? 在這樣的環境下,企業可以更加聚焦于構建平臺,讓每個員工都能在這樣的平臺上最大限度地發揮其價值。
未來的企業,將遠離傳統的、重度依賴專業開發人員的軟件開發模式。 ? 曾經的開發人員,或"碼農",喜愛使用傳統的IDE工具和手寫代碼,但未來的趨勢是采用更加圖形化的界面,通過拖拽等直觀操作來解決問題,使得軟件開發和業務實現更加民主化和普及化。 ? 這不僅限于少數具有專業編程技能的人員,而是讓更多員工能夠參與到創新和解決方案的制定中來。
低代碼平臺革命性地簡化了業務邏輯或軟件邏輯的實現方式。 ? 每個具有獨立思維的個體都能通過直觀的用戶界面(UI)與機器或大模型交互,用自然語言指示完成所需任務。 ? 這種基于簡單UI和自然用戶界面(NUI)的互動方式,大大降低了技術門檻,使得非技術人員也能輕松實現復雜的工作。
這種方式不僅限于日常業務邏輯的實現,還可用于數據分析、代碼編寫和內容創作等多個領域。 ? 例如,在做業務分析時,用戶可以簡單詢問與之前報告的變化或對比不同地區的投資策略;在軟件開發方面,用戶可以直接請求生成一個特定規格的程序,如128×128方塊的掃雷游戲;在內容創作方面,用戶甚至可以指導大模型創作一篇文章。 ? ?
九章云極DataCanvas的大模型實踐
九章云極DataCanvas近期推出了新一代大模型應用產品-TableAgent,使得企業用戶能夠更直接、更高效地利用大數據和人工智能。 ? 例如,通過自動識別數據表中的信息,系統能夠根據用戶的詢問,分析并呈現所需信息,如連鎖酒店各地入住率的比較、原因分析等。 ? 這種智能化平臺不僅提供結論,更能逐步引導用戶理解結果背后的邏輯和因素,實現深度洞察和決策支持。
這樣的發展,標志著企業進入了一個基于智能化平臺的新時代。
在此背景下,九章云極DataCanvas開源了基于Alaya基座的大模型,融合了豐富的行業知識和訓練改進,通過自然語言界面實現數據比較、預測和修正,極大簡化了用戶與數據的交互過程。 ? 在知識庫和問答系統普及的背景下,九章云極DataCanvas也致力于開發知識管理系統。我們預測未來公司流程可能被數字員工執行,從而提升企業管理效率。 ? 該系統體現了從傳統到智能變化的六個階段,包括視頻分析等多功能應用,用戶可以使用這些系統編寫不同語言的代碼,解決各種問題。 ? OpenAI正致力于打造一個類似蘋果生態的閉源IOS,通過ChatGPT等工具推動API的廣泛使用,激發各種應用程序(APP)的創造,以滿足用戶需求。 ? 在這個以大模型支撐的基礎上,三大領域被認為具有巨大潛力: ? 第一、APP tooling(APP工具)。如何做出一系列不同用途、不同場景的APP tooling,滿足用戶的需求? ? 第二,基于大模型的computing framework和LLMOps (大模型訓練、微調、推理和監控框架)如何實現? ? 第三,GPU Clouding。OpenAI做IOS生態,未來也一定會出現一個安卓生態系統,基于GPU Clouding可以在上層生成豐富的application(應用程序),進而滿足不同用戶的需求。 ? 九章云極DataCanvas響應這一趨勢,不僅研發出具有“通識+產業”系列模型矩陣的DataCanvas Alaya九章元識大模型,并基于九章元識打造出靈活高效的Alaya Enterprise(九章云極DataCanvas企業自有AI架構),通過Alaya GCP對AI資源的有效調度和管理,有力支撐企業在頂層自主化開發各類AI應用,加速企業的數智化建設翻開嶄新篇章。
九章云極DataCanvas的愿景不僅局限于現有的技術和市場需求,而是希望通過AI和智能化鏈接(Alaya link),幫助企業用戶數字化建設推向新的階段。 ? 他們看到了企業流程的復雜性,并希望通過AI生成技術簡化和自然處理各種業務需求,展望一個充滿信心和陽光的未來。 ?
科大訊飛:星火大模型技術進展及生態賦能
科大訊飛(上海)科技有限公司總經理?丁瞳瞳 ? 自ChatGPT3.5去年發布以來,通用人工智能技術已經深刻影響了我們的生活和工作。 ? 據高盛預測,未來十年通用人工智能將帶來超過7萬億美元的產值。 ? 最近的戰略技術趨勢報告和中央經濟工作會議也都強調了通用人工智能的重要性和其對生產、生活方式的影響。
AI大模型的四個能力
語言大模型和通用人工智能的發展一直是行業關注的焦點,然而,真正理解通用人工智能、大語言模型及相關技術并非易事。 ? 在GPT3.5提出的48個核心任務基礎上,結合科大訊飛開放平臺超過400萬開發者提供的數據分析,人工智能模型的能力主要集中在四個方面:文本生成的語言模型、自然語言理解、知識問答以及智能涌現。 ? 語言模型的文本生成,這不僅僅是關于生成文本或語言,更是關于模擬人與人之間自然邊界的交互方式,實現人機對話。 ? 自然語言理解能力強化了機器對語言的深層理解,而GPT4的發布,結合現存知識庫,取得了顯著的進步。 ? 而智能涌現是一個特別引人注目的現象,其中重要的能力包括邏輯推理、數學能力及多模態交互能力。 ? 這意味著大模型不僅僅是在訓練范圍內進行應答,而是通過智能涌現的方式,像生物一樣呈現出智慧化的應用。
尤其是今年下半年,隨著各個廠商對百模、千模的代碼能力發布和應用的提升,大模型的智能涌現能力得到了巨大增強。
人工智能大模型正在顛覆傳統的工具和應用開發方式。 ? 傳統上,基于數據經濟和社會環境下的應用開發需要創意、內容、文案以及技術編程能力,或者雇傭專業的編程團隊。 ? 然而,現在,從創意產生到實際實踐,效率可能提高了10倍甚至100倍。 ? ?
自主可控發展的三個維度
在介紹了對大模型及通用智能時代的理解后,現轉向探討認知大模型在中國自主安全可控發展的關鍵要素。所謂的自主安全可控,主要涵蓋三個維度。
在算法和技術的安全可控方面,盡管人工智能領域的關鍵論文多起源于美國,但當前在大模型相關算法的研究上,并沒有顯著差異。 ? 尤其是在堅持人工智能核心技術的研究上,從文本到語音識別,科大訊飛已經取得顯著的進展。 ? 過去十年,從最初應用深度神經網絡到語音識別,再到最近對預訓練模型的優化,科大訊飛在提升算法效率和理解精度方面取得了顯著進步,特別是在處理中文內容方面。
在數據方面,大模型的效果很大程度上依賴于數據的質量和量。 ? 對中文語料的訓練尤其關鍵且充滿挑戰,由于行業壁壘和安全保密的需求,高質量中文數據相對稀缺。 ? 然而,隨著中國網絡空間安全協會發布首批中文基礎語料數據庫,標準化、高質量的中文語料庫將不斷擴大,預計將極大促進大模型技術研發應用的生態。 ?
在算力方面,由于國際政策限制,獲取頂尖芯片變得更加困難,尤其是美國政府對半導體出口限制,進一步加劇了這一挑戰。 ? 盡管存在困難,行業正在積極尋找解決路徑,確保人工智能技術的持續發展和創新。
科大訊飛自2019年被列入美國實體清單后,對外部高端計算資源的獲取受到限制。 ? 面對這一挑戰,公司采取了積極應對措施,首先是通過集中公有算力資源,發布了規模龐大的百億參數大模型。 ? 在此過程中,華為等國內優秀企業的合作發揮了關鍵作用,共同攻關,推動了大模型技術的發展。
AI大模型的場景應用
當前,以認知大模型為代表的通用人工智能正深刻改變各行各業,從教育、辦公、汽車、運營商、金融、工業、疫苗等各個方面,其影響力已無庸置疑。
科大訊飛認為,認知大模型的作用不僅僅局限于寫詩繪畫等創造性任務,更多的是服務于生產力的提升。 ? 在應用場景方面,大模型正幫助企業實現研究、生產、供應、銷售、管理和服務等全流程的優化。
在中國,盡管頭部企業及科技公司能夠在通用人工智能方向進行自研或合作發展,但眾多中小、小微企業亦迫切需要人工智能能力,卻往往缺乏相應的技術鑒別力。
科大訊飛響應這一需求,科大訊飛與工信部下屬專注于服務中小企業的互聯網平臺合作,幫助企業在研發、生產、供應、銷售、服務等全流程中提高效率。 ? 同時,將來可能70%的應用程序將由低代碼或無代碼平臺構建,科大訊飛響應市場需求,于8月份推出了基于代碼的解決方案。 ? 通過內部研發平臺的應用,短短3個多月的時間內提升了代碼的采納率和編譯效率,顯著提高開發效率和質量。
科大訊飛的創新技術在提高編程效率和可達性方面有兩個顯著的貢獻:
首先,該技術使得完全沒有代碼編譯基礎的人也能通過自然語言交互方式進行代碼的編譯、生成、運行以及修改。 ? 這極大降低了編程門檻,使得編程更加普及化,為非專業人士提供了進入編程世界的便捷通道。
其次,對于已經在進行代碼開發的人員,科大訊飛的技術能夠顯著提高編程效率。 ? 通常程序員編寫代碼時往往忽略編寫注釋,這是一個普遍現象。 ? 然而,通過標準化的代碼分平臺編譯,不僅可以提高代碼的結構穩定性和快速生成性,而且在編碼質量上可以達到中級程序員的水平。
科大訊飛結合大模型技術開發的C端產品在雙11期間顯示出顯著的應用效果。 ? 公司賦能的七個產品品類,包括辦公本、錄音筆、學習機和智能耳機等,均搭載了訊飛星火大模型的能力。 ? 在京東、天貓等平臺的七個品類中獲得銷售冠軍,即使在整體雙11購物環境下滑的情況下,仍實現了126%的銷售增長。
最后總結三個觀點:首先,在認知智能大模型方面,中國不會受制于人,同時也理性認識到與國際頂尖產品如ChatGPT4.0的差距,我們有信心在未來會迎頭趕上。 ? 其次,人工智能的發展需要產、學、研、用等多方面的合作,希望形成中國在通用人工智能領域的綜合比較優勢。 ? 最后,建議國家在數據算力方面積極布局,鼓勵國家實驗室、科研機構、高水平大學和科技領軍企業在戰略發展過程中發揮更大作用。
審核編輯:黃飛
評論
查看更多