精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大模型,開源干不掉閉源

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2023-07-24 19:33 ? 次閱讀

開源大模型對閉源大模型的沖擊,變得非常猛烈。

今年3月,Meta發(fā)布了Llama(羊駝),很快成為AI社區(qū)內(nèi)最強大的開源大模型,也是許多模型的基座模型。有人戲稱,當前的大模型集群,就是一堆各種花色的“羊駝”。

而就在前些天,Meta又推出了免費可商用版本的“羊駝2號”——Llama2,據(jù)說性能比肩GPT-3.5。

這在整個大模型圈都是非常炸裂的。

我們知道,各個互聯(lián)網(wǎng)、科技公司都在競相訓(xùn)練、推出自己的大模型,投入了大量的計算資源和成本,如果不能有效的完成商業(yè)化,那么這些大模型就很難回收成本,后續(xù)的迭代、更新、升級都成問題,不僅研發(fā)企業(yè)會虧個底掉,更苦惱的大概就是“前功盡棄”的用戶了。

而現(xiàn)在有了自由開放強大的開源大模型,誰還愿意給閉源大模型送錢呢?

還真的有。

開源是大勢所趨,但閉源大模型依然有其存在意義和商業(yè)價值。按照目前的AI產(chǎn)業(yè)落地經(jīng)驗來看,用好大模型,還是得靠閉源。

今天我們就來聊聊這個問題,到底是誰,需要閉源大模型?

到產(chǎn)業(yè)去,到產(chǎn)業(yè)去

大模型的商業(yè)化終點是產(chǎn)業(yè),想必已經(jīng)是不用過多解釋的共識了。

前不久,我參加某一個國產(chǎn)大模型的內(nèi)部溝通會,對方高層就明確表示,自己全部用的是閉源代碼,并且堅持走閉源路線,就是考慮到訓(xùn)練大模型與行業(yè)伙伴合作,其中很多隱私數(shù)據(jù)是不方便開源的。

見一斑可窺全豹,至少在短期內(nèi),大模型走向產(chǎn)業(yè),落地還是要靠閉源。

模型方面,閉源大模型的質(zhì)量更高。

就拿目前最能打的Llama 2為例,Meta 將 Llama 2 70B 的結(jié)果,與閉源模型進行了比較,結(jié)果在 MMLU 和 GSM8K 上接近 GPT-3.5,但在編碼基準上,還存在顯著差距,不少數(shù)據(jù)在多樣性和質(zhì)量方面有所欠缺。

當然,開源大模型的優(yōu)化迭代速度很快。但開源的本質(zhì)和“有性繁殖”很像,就是通過大量繁殖和變異,如同開篇那張“羊駝集群”一樣,面對不確定的未來,借助進化的“優(yōu)勝劣汰”,讓最優(yōu)質(zhì)的后代持續(xù)涌現(xiàn)。所以,開源軟件的分支多,對用戶來說,這個選擇的成本是很高的,加上開發(fā)人員眾多,版本控制是一個問題。

安全性方面,閉源大模型的可靠性更高。

開源大模型要遵守開源協(xié)議,商業(yè)使用需要獲得授權(quán),海外開源大模型也要受到屬地管轄,github就曾封禁俄羅斯開發(fā)者賬號。使用海外開源大模型開發(fā)產(chǎn)品,供應(yīng)鏈的風險,是客觀存在的。

那么,使用國產(chǎn)開源大模型呢?安全性得到保障,但從商業(yè)角度看,很多客戶,如大型政企,也非常看重大模型在業(yè)務(wù)上的可靠性,采購時往往需要大公司的品牌背書。一方面研發(fā)投入更大,口碑更高;另一方面,萬一大模型生成不當,導(dǎo)致商業(yè)損失或商譽問題,使用閉源大模型可以問責服務(wù)商,使用開源大模型總不能找全球開發(fā)者算賬吧?

比如大模型創(chuàng)業(yè)公司Huging Face,為客戶提供AI咨詢,是開源社區(qū)的臺柱子,表示有大量客戶希望把自己的私有數(shù)據(jù)/專業(yè)數(shù)據(jù)用來訓(xùn)模型,并不想把這些數(shù)據(jù)給到 OpenAl。

產(chǎn)業(yè)化方面,閉源大模型的長期服務(wù)能力更強、更可用。

大模型落地,并不是接入API、塞進數(shù)據(jù)、調(diào)參優(yōu)化就結(jié)束了。作為一種新興技術(shù),大模型與業(yè)務(wù)場景的融合,還有非常多挑戰(zhàn)。比如大模型需要通過蒸餾壓縮,減小模型規(guī)模,才能在端側(cè)部署,很多企業(yè)根本沒有這類專業(yè)人才。

再比如,大模型與業(yè)務(wù)結(jié)合,需要產(chǎn)品、運營、測試工程師等多種角色共同參與,這些服務(wù)能力是以coder為主的開源團隊,所很難提供的。此外,大模型的長期應(yīng)用,算力、存儲、網(wǎng)絡(luò)等配套都要跟上,開源社區(qū)無法幫助用戶“一站式”解決這些細節(jié)問題。

還有數(shù)據(jù)隱私顧慮,大模型是不能直接為產(chǎn)業(yè)所用的,還要通過專有場景數(shù)據(jù)進行優(yōu)化,而這些數(shù)據(jù)訓(xùn)練完的模型會被開源開放出去,讓企業(yè)顧慮重重。

我們曾采訪過一個智慧醫(yī)療研發(fā)團隊,對方表示,大量醫(yī)療數(shù)據(jù)分布在各大醫(yī)院、研究機構(gòu),又涉及患者隱私,大家對于把數(shù)據(jù)拿出來共同訓(xùn)練一個行業(yè)模型,都存在顧慮。一方面是安全得不到保障,另一方面是自己的數(shù)據(jù)質(zhì)量高,但從中得不到恰當?shù)幕貓螅推渌麛?shù)據(jù)質(zhì)量低的機構(gòu)一樣,很難協(xié)調(diào)。在開源大模型的共建中,如何得到數(shù)據(jù)、把握配方、確定各方貢獻,還存在很多難題。

開源大模型需要平衡技術(shù)創(chuàng)新自由和版權(quán)收益之間的沖突,而使用閉源大模型就沒有這方面的麻煩,數(shù)據(jù)和模型的所有權(quán)、使用權(quán)都很清晰,牢牢掌握在企業(yè)自己手里。

可以說,目前開源大模型還無法達到實際的業(yè)務(wù)需求。而開源大模型使用者和ISV集成商,是需要獲得商業(yè)回報的,如果開源大模型不可商用、效果不好、很難賺錢,那么即使免費,企業(yè)也會慎重考慮要不要投入人來開發(fā)。

所以,未來一段時間,閉源依然是大模型落地產(chǎn)業(yè)的熱門選擇。

到群眾去,到群眾去

可能有人不理解了,開源免費商用,大家都能用上白菜價的大模型了,對開發(fā)者和企業(yè)用戶多友好,你怎么還說閉源好?是不是為一門心思賺錢的大廠站臺?

非也。

但凡了解開源,都會支持開源。但凡支持開源,都會關(guān)注開源的商業(yè)化。

中國科學(xué)院梅宏院士曾說過,開源以理想主義為源起,以商業(yè)化為蓬勃助力,是開放創(chuàng)新的典范。沒有商業(yè)化,不可能有開源。

所以,開源也好,閉源也好,誰能更早“可商用”,誰就更有未來。這一點上,閉源大模型可能更占優(yōu)勢,畢竟有底氣閉源的廠商,還是有兩把刷子和研發(fā)家底兒的。

那么,開源大模型的優(yōu)勢在哪里呢?如果說閉源大模型要到產(chǎn)業(yè)去,那么開源大模型就要到群眾中去,主打一個人多力量大。

wKgaomS-YZ2AaAXTAAIzvnlGYRo290.jpg

(LeCun認為Llama-v2會改變LLM的市場格局)

開源大模型不同于傳統(tǒng)開源軟件,把源代碼放上去,然后全球開發(fā)者來貢獻代碼就完了。大模型的協(xié)同共建,更多體現(xiàn)在社區(qū)繁榮,大家一起把模型做優(yōu)化、數(shù)據(jù)做豐富、工具做完善、應(yīng)用做全面……

這時候,開源模式能夠帶來幾個好處:

1.技術(shù)創(chuàng)新。開源社區(qū)可以匯聚廣大科技企業(yè)、研究機構(gòu)和開發(fā)者,對模型進行優(yōu)化、改進、加速迭代,讓模型技術(shù)和配套數(shù)據(jù)集、應(yīng)用工具等,變得豐富、高質(zhì),從而保持領(lǐng)先。

2.人才爭奪。大模型作為新興技術(shù),人才緊缺,通過開源社區(qū)吸引全球優(yōu)秀人才做貢獻,加速大模型升級,能夠拉開差距。有競爭才有壓力,所以LLama 2發(fā)布之后,很快傳出OpenAI也開始考慮半年內(nèi)開源GPT-3.5的消息,開發(fā)者們有福了。

3.生態(tài)合攏。目前各行各業(yè)的IT解決方案和數(shù)字化轉(zhuǎn)型,大量使用開源技術(shù)和應(yīng)用,建設(shè)大模型開源生態(tài),讓IT人才和企業(yè)使用相關(guān)技術(shù),對于后期的商業(yè)化非常有幫助。比如OpenAI 的合作伙伴/投資方微軟,這次也選擇成為Llama 2 的首要合作伙伴,支持個人開發(fā)者和中小公司以最低成本調(diào)用Llama 2,這對azure無疑是一大利好。

不是所有開源大模型都能成功,生態(tài)是關(guān)鍵的護城河。

夾心餅干,向何處去?

就像手機操作系統(tǒng)iOS 與 Andriod,開源與閉源的競爭,并不是某一個領(lǐng)域打的“你死我活”,而是各自走出一條差異化的道路,迎來自己的天地。大模型也是如此。

閉源大模型開門迎客,開源大模型紅紅火火,大家都有光明的未來。

既然如此,為什么還有專家認為,Llama 2開源對開源來說是一個巨大的飛躍,但對閉源的大模型公司是一個巨大打擊?

究竟打擊了誰?

答案應(yīng)該是,既不甘心只做應(yīng)用層、又沒能力卷過大廠的基礎(chǔ)大模型廠商。

谷歌研究人員曾發(fā)文說,因為有開源社區(qū),我們(Google和OpenAI)沒有護城河。但是,OpenAI還有GPT-4這樣的閉源大模型作為殺手锏,只有被開源逼急了的情況下,才考慮把GPT-3.5開源,這里面是有技術(shù)代差的。而且GPT-3.5開源只透露了口風,具體進展還是未知數(shù)。

所以,這類頭部科技廠商和云巨頭,如海外的谷歌、OpenAI,國內(nèi)的BATH,卡、錢、人才、數(shù)據(jù)、市場認知度、客戶基礎(chǔ)都有優(yōu)勢,走閉源路線來完成大模型商業(yè)化、產(chǎn)業(yè)化是有一定先發(fā)優(yōu)勢和壁壘的。

這就苦了那些一心想訓(xùn)基礎(chǔ)通用大模型的二三線廠商了。

此前,全球大小科技公司和各類科研機構(gòu),一擁而上訓(xùn)基礎(chǔ)大模型,比如某些機器視覺AI獨角獸,不小心就成了基礎(chǔ)層和應(yīng)用層之間的“夾心餅干”。

實力上打不過GPT,成本上打不過Llama,訓(xùn)出來的基礎(chǔ)通用大模型,還沒等到正式開放商用,就已經(jīng)過時了,注定是明日黃花。市場上拼不過巨頭,開放度不如開源社區(qū),幾乎不可能收回高昂的開發(fā)成本。

趁早放棄死磕大模型,或許才是明智選擇。

比如國內(nèi)某AI公司的大模型,此前私有化報價是一年30萬,隨后就宣布對學(xué)術(shù)研究完全開放,獲得授權(quán)可免費商用。做大模型開源社區(qū),也有商業(yè)化的可能(如Linux/ Android/紅帽),同時也能避免跟頭部的通用大模型的“硬碰硬”。

wKgZomS-YZ2AcLCNAACBf0k5pdA672.jpg

知名投資人關(guān)于Llama2開源的討論截圖/來自網(wǎng)絡(luò))

對于應(yīng)用層開發(fā)者和ISV集成商企業(yè)來說,用好產(chǎn)業(yè)接受度高的閉源大模型,可以更快讓客戶接受,更適合私有化定制部署的業(yè)務(wù)需求,更快完成商業(yè)落地和收入增長。

對于AI創(chuàng)業(yè)公司來說,開源直接就能用,避免重復(fù)造輪子,可能是更理想、低成本試錯的商業(yè)化手段,“報團取暖”貢獻大模型開源項目,推動大模型開源社區(qū)的發(fā)展,也會獲得社區(qū)回饋和商業(yè)回饋。

中國大模型發(fā)展到高水平,既要有全球領(lǐng)先的閉源大模型打頭陣,也要有具備世界影響力的大模型開源社區(qū)。

道阻且長,行則將至。不妨用建設(shè)性心態(tài),來看待開源閉源之爭,給國產(chǎn)閉源大模型一些信心,也給國內(nèi)開源社區(qū)一些鼓勵和支持。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30239

    瀏覽量

    268474
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2339

    瀏覽量

    2499
收藏 人收藏

    評論

    相關(guān)推薦

    開源之爭:最新的開源模型到底還落后多少?

    一,引言 隨著人工智能(AI)技術(shù)的迅猛發(fā)展,大模型已經(jīng)成為推動科技進步的重要力量。然而,超大規(guī)模模型在帶來高性能的同時,也面臨著資源消耗大、部署困難等問題。本文將探討AI大模型未來的發(fā)展方向
    的頭像 發(fā)表于 11-15 11:16 ?129次閱讀
    <b class='flag-5'>開源</b>與<b class='flag-5'>閉</b><b class='flag-5'>源</b>之爭:最新的<b class='flag-5'>開源</b><b class='flag-5'>模型</b>到底還落后多少?

    阿里通義千問代碼模型全系列開源

    近日,阿里云通義大模型團隊宣布了一項重大決策:將通義千問代碼模型全系列正式開源。此次開源模型系列共包含6款Qwen2.5-Coder
    的頭像 發(fā)表于 11-14 15:26 ?221次閱讀

    科技云報到:假開源真噱頭?開源模型和你想的不一樣!

    查看、修改、分發(fā)。開源自此深刻影響了互聯(lián)網(wǎng)行業(yè)的每一個角落。 在大模型和GenAI崛起的當下,開源再次成為業(yè)界關(guān)注焦點,對于開源
    的頭像 發(fā)表于 11-03 10:46 ?176次閱讀

    Llama 3 與開源AI模型的關(guān)系

    在人工智能(AI)的快速發(fā)展中,開源AI模型扮演著越來越重要的角色。它們不僅推動了技術(shù)的創(chuàng)新,還促進了全球開發(fā)者社區(qū)的合作。Llama 3,作為一個新興的AI項目,與開源AI模型的關(guān)系
    的頭像 發(fā)表于 10-27 14:42 ?324次閱讀

    浪潮信息2.0大模型與百度PaddleNLP全面適配

    近日,浪潮信息宣布其開源模型2.0已全面適配百度PaddleNLP。這一舉措標志著大模型開發(fā)生態(tài)正加速進化,為用戶提供了更加便捷、高效的大模型
    的頭像 發(fā)表于 10-17 18:15 ?472次閱讀

    2024世界人工智能大會,大咖們都在關(guān)注這件事

    “沒有應(yīng)用,光有基礎(chǔ)模型,不管是開源還是都一文不值。” 在近期閉幕的2024世界人工智能大會(WAIC)上,各業(yè)界大咖們圍繞大模型和AI
    的頭像 發(fā)表于 07-09 09:28 ?522次閱讀
    2024世界人工智能大會,大咖們都在關(guān)注這件事

    浪潮信息重磅發(fā)布“2.0-M32”開源模型

    浪潮信息近日發(fā)布了一款全新的開源模型——“2.0-M32”。這款大模型在“2.0”系列大模型
    的頭像 發(fā)表于 06-05 14:50 ?737次閱讀

    浪潮信息發(fā)布2.0-M32開源模型,模算效率大幅提升

    5月28日,浪潮信息發(fā)布“2.0-M32”開源模型。“2.0-M32”在基于”2.0”系列大模型
    的頭像 發(fā)表于 05-29 09:34 ?389次閱讀
    浪潮信息發(fā)布<b class='flag-5'>源</b>2.0-M32<b class='flag-5'>開源</b>大<b class='flag-5'>模型</b>,模算效率大幅提升

    浪潮信息發(fā)布“2.0-M32”開源模型

    浪潮信息近日推出了革命性的“2.0-M32”開源模型。該模型2.0系列基礎(chǔ)上,引入了“基于注意力機制的門控網(wǎng)絡(luò)”技術(shù),構(gòu)建了一個包含
    的頭像 發(fā)表于 05-29 09:08 ?605次閱讀

    研究院揭曉大模型測評結(jié)果,豆包與百川智能大模型表現(xiàn)優(yōu)異

    在多模態(tài)理解圖文問答任務(wù)中,開源模型表現(xiàn)相當,而國產(chǎn)模型則表現(xiàn)出色。此外,在中文語境下的文生圖能力方面,國產(chǎn)多模態(tài)
    的頭像 發(fā)表于 05-20 09:26 ?687次閱讀

    HDMI論壇出手,AMD開源HDMI 2.1驅(qū)動被拒

    喜愛的原因之一。然而,在高分辨率+高幀率的顯示器上,Linux卻在正式的開源驅(qū)動一直缺席,甚至連AMD也無能為力。 ? 開源系統(tǒng)上的標準 ? 對于Linux這個
    的頭像 發(fā)表于 03-05 00:10 ?2808次閱讀

    聊聊小公司如何做大模型

    通過SFT、DPO、RLHF等技術(shù)訓(xùn)練了領(lǐng)域?qū)懽?b class='flag-5'>模型。實測下來,在該領(lǐng)域?qū)懽魃希瑥娪趪鴥?nèi)大多數(shù)的模型
    的頭像 發(fā)表于 02-21 11:28 ?623次閱讀

    模型開源開放評測體系司南正式發(fā)布

    近日,大模型開源開放評測體系司南(OpenCompass2.0)正式發(fā)布,旨在為大語言模型、多模態(tài)模型等各類模型提供一站式評測服務(wù)。Open
    的頭像 發(fā)表于 02-05 11:28 ?1014次閱讀

    機器人基于開源的多模態(tài)語言視覺大模型

    ByteDance Research 基于開源的多模態(tài)語言視覺大模型 OpenFlamingo 開發(fā)了開源、易用的 RoboFlamingo 機器人操作模型,只用單機就可以訓(xùn)練。
    發(fā)表于 01-19 11:43 ?367次閱讀
    機器人基于<b class='flag-5'>開源</b>的多模態(tài)語言視覺大<b class='flag-5'>模型</b>

    中文大模型基準測評2023年度報告

    國內(nèi)學(xué)術(shù)和產(chǎn)業(yè)界在過去一年也有了實質(zhì)性的突破。大致可以分為三個階段,即準備期(ChatGPT發(fā)布后國內(nèi)產(chǎn)學(xué)研迅速形成大模型共識)、成長期(國內(nèi)大模型數(shù)量和質(zhì)量開始逐漸增長)、爆發(fā)期(各行各業(yè)開源
    的頭像 發(fā)表于 01-02 16:24 ?910次閱讀
    中文大<b class='flag-5'>模型</b>基準測評2023年度報告