圖:LF AI & Data董事會主席 孟偉
孟偉先生在演講中提到,LF AI & Data基金會自2018年3月由Linux基金會創立以來,成員數量從最初的10余個增長至目前的77個,項目數量也達到了72個,這充分展示了開源社區的蓬勃發展,也很高興能與大家共同見證開源社區的壯大與成長。
在全球范圍內,尤其是中國,AI技術和大模型應用正以驚人的速度發展,開源開放已成為開發者社區的主流趨勢。孟偉先生在接受電子發燒友的獨家專訪時,分享了LF AI & Data基金會在中國取得的階段性成果,以及開源大模型商業落地面臨的挑戰。
開源的大模型趨勢勢不可擋,基金會項目推動技術和應用的深度融合
LF AI & Data 董事會主席孟偉對記者表示,2024年是開源社區大發展的一年,LF AI & Data社區的開發者數量已超過10萬,貢獻者組織超過200個,開源項目多達70個,代碼貢獻每月都在持續增長。基金會的高級會員包括AWS、微軟、愛立信、華為、OPPO、中興通訊、Intel、英偉達等13家大公司。
他強調,從2023年至今,我們進入了算力時代,英偉達市值在2023年超越3萬億美元,超越了蘋果和谷歌。隨著生成式AI的興起,AI的落地成為了行業的挑戰和機遇。中國信通院2024年發布的《全球數字經濟白皮書》顯示,全球基礎大模型數量達到1328個,其中美國占44%,中國占36%。
孟偉先生分析說:“我們認為,基座大模型已經足夠,但在行業應用中,大模型面臨四大挑戰:一是行業知識不足,二是算力不足,三是合規治理水平不足,四是區域間發展不均衡。”
而當我們試圖尋找解決這些挑戰的路徑時,開源人工智能的發展模式為我們提供了新的視角。在這方面,LF AI & Data作為全球最大的開源人工智能基金會,其運作模式值得我們思考。現在全球人工智能開源有三種模式:一、公司來推動的,比如Google、Meta自己去開源一些項目,它們有足夠的影響力和社區,把開源項目和生態做起來;二、大模型托管平臺的大模型項目,各行業大模型或者通用大模型放到平臺進行托管,并且有相關的排名;三、基金會模式,就是LF AI & Data采用的模式,集中力量辦大事。把業界所有的力量都放到基金會里面,有硬件公司如英偉達、英特爾;也有基礎設施的公司如華為、中興通訊;也有軟件及服務型提供商,如微軟公司、AWS等。
今年8月,IDC中國分析師曾對記者表示,大模型今年一大趨勢是開源和閉源共存,共同促進大模型應用生態走向繁榮。更多企業選擇開源大模型來構建自身的應用。現有開源模型的參數大多數在十億到千億之間,基于MoE架構的稀梳大模型參數可以達到萬億,微調和多種計算技術并行變得十分重要。
LF AI & Data 董事會主席孟偉也持同樣的觀點,他認為,如果沒有開源大模型,行業AI落地的速度將慢至少4倍,主要有三大原因。一、閉源大模型成本非常高,對于實現私有化部署,去年商業大模型的價格是千萬級別的,今年雖降至百萬級,但對中小型公司而言仍成本極高,而且后期數據更新,涉及到是否要買后續的服務,每年可能都需要增加維護的成本;二、開源大模型對用戶非常友好,例如一個初創型的公司只要懂一些大模型的知識、行業的數據,就可以把行業大模型開發出來。三、開源大模型雖然解決軟件的問題,但是還有硬件AI芯片價格昂貴的問題,預計1-2年內AI芯片價格將下降,從而加速AI技術在行業的落地。
電子發燒友對開發工程師的調研也顯示,目前備受歡迎的大模型,諸如ChatGPT和Bard,都建立在專有的閉源基礎上,這無疑限制了它們的使用,并導致了技術信息的透明度不足。然而,開源AI大模型(LLMs)正在嶄露頭角,它們不僅增強了數據的安全性和隱私保護,還為用戶節省了成本,實現了代碼的透明性和模型化定制。更重要的是,開源LLMs積極支持社區的發展,推動整個領域的創新和發展。
孟偉介紹道,2024年4月,LF AI & Data基金會發起一個重要項目企業級開源平臺OPEA,9月份OPEA社區已有41家公司參與,產業生態持續壯大,目前還有10多家中國公司申請加入OPEA項目。OPEA的目標是快速給企業部署AI,實現一鍵部署。企業只需裝配到用戶的容器服務器,設定基座大模型、向量庫等參數,便可一鍵部署。因此,Linux基金會執行董事Jim Zemlin將OPEA稱作AI界的Kubenates,給予很高的評價。
把握開源社區的核心價值觀,推動開源大模型商業落地抓手
“一個開源項目除了開發者以外,還要有企業和行業的用戶,要真正了解用戶的需求和行業的痛點,才能形成行業大模型應用的商業閉環。” LF AI & Data 董事會主席孟偉對記者說。
孟偉強調,LF AI & Data的使命是建立和支持開源開放的人工智能和數據的開源社區,為成員提供協作和創新機會,推動人工智能和數據領域的行業落地。自2023年,他當選為LF AI & Data董事會主席,主要負責基金會的日常運作管理,包括基金會的戰略規劃和項目預算。
今年,OPEA項目在中國落地,我們的目標是把最終用戶請過來,例如金融行業、能源行業、教育行業、法律行業等等用戶。“從基金會的角度來說,我們明年將重點聚焦人工智能行業應用,不管是軟件、硬件,我們都要明確落地的抓手,形成標桿案例;第二個重點,LF AI & Data基金會已經形成對全球芯片高新技術企業的吸引力,國際芯片大廠如英偉達、AMD、英特爾都已經加入基金會,中國本土的芯片企業也應當積極參與到國際合作中來;第三,我們和RISC-V基金會、PyTorch基金會的合作,也是明年重點推動的工作。”孟偉分享說。
談到開源大模型落地的挑戰,孟偉認為一方面來自有效數據的挑戰,一方面行業大模型在可用性和許可協議還不健全。比如某些行業數據孤島現象嚴重,對于行業大模型的發展造成限制;通用大模型在特定行業的可用性程度并不高,需要進一步的利用行業語料進行精調;此外,開源大模型項目里面包含算力投入、數據資產,涉及到隱私問題、數據流通問題和安全問題,都還需要不斷解決。
在采訪的最后,LF AI & Data董事會主席孟偉總結說:“不管世界政治格局怎么變,開源還是講究包容和開放的。現在AI硬件受到地區的限制,但是開源軟件受到的影響還不多。我們不僅需要在中國把開源項目做好,還希望更多的公司和項目能夠參與到國際的交流和合作中去。”我們也相信,LF AI & Data不僅持續致力于在中國深化開源項目的發展,同時也期待能引領更多企業和項目跨越國界,共同推動全球開源人工智能生態的繁榮與進步。
本文由電子發燒友原創,轉載請注明以上來源。微信號zy1052625525。需入群交流,請添加微信elecfans999,投稿爆料采訪需求,請發郵箱zhangying@huaqiu.com。
-
Linux
+關注
關注
87文章
11225瀏覽量
208910 -
AI
+關注
關注
87文章
30106瀏覽量
268395 -
基金會
+關注
關注
0文章
3瀏覽量
6664
發布評論請先 登錄
相關推薦
評論