精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

開源與閉源之爭:最新的開源模型到底還落后多少?

jf_23871869 ? 來源:jf_23871869 ? 作者:jf_23871869 ? 2024-11-15 11:16 ? 次閱讀

一,引言

隨著人工智能AI)技術的迅猛發展,大模型已經成為推動科技進步的重要力量。然而,超大規模模型在帶來高性能的同時,也面臨著資源消耗大、部署困難等問題。本文將探討AI大模型未來的發展方向。

開放性一直是人工智能研究領域的常態,促進了該領域的合作。然而,人工智能的快速發展引發了關于發布最強大模型可能帶來的后果的擔憂。此外,像ChatGPT這樣的模型的銷售企業有保持模型私有的商業動機。

行業AI實驗室以多種方式回應了這些發展:

未發布模型:例如,谷歌DeepMind的Chinchilla模型尚未發布。

結構化訪問控制:像GPT-4這樣的模型有結構化的訪問控制,控制用戶如何與模型交互。

有限制的開源模型:Meta的Llama模型的權重可以下載,但使用條款有限制。

二,開源與閉源模型的對比

1,爭議

發布模型、代碼和數據集能夠促進創新和外部審查,但這也是不可逆的,并且如果模型的安全措施被繞過,就有被濫用的風險。關于這種權衡是否可接受或可避免,存在持續的爭論。開源AI的支持者認為,開放性通過開放社區開發的創新和工具,對社會以及模型開發者都有益。甚至有人認為,更多的閉源AI開發者已經被開源社區超越,保持封閉變得毫無意義。

wKgZomc2vO6AY1-9AAKqJNUwB60231.png

2,二者用戶基數對比

ChatGPT(封閉模型):每月大約有3.5億用戶。

Meta AI助手(開放模型):每月有近5億用戶。

3,性能和訓練計算方面的差距

為了系統地比較開放和封閉AI模型隨時間的能力,我們收集了自2018年以來發布的數百個著名AI模型的權重和訓練代碼的可訪問性數據。以下是主要發現:

基準性能:

最好的開源大型語言模型(LLMs)在多個基準測試上落后于最好的閉源LLMs5到22個月。Meta的Llama 3.1 405B是最新的一個在多個基準上縮小差距的開源模型。即使不考慮Meta的Llama模型,結果也類似。

訓練計算:

在訓練計算方面,最大的開源模型落后于最大的閉源模型大約15個月。

Llama 3.1 405B相對于GPT-4的發布,差距為16個月。由于我們尚未看到比GPT-4規模更大的閉源模型,Llama 3.1 405B已經在縮小訓練計算的差距。

wKgaoWc2vM2ACnpVAAEfqJGsG8k232.png

訓練效率:

盡管開源LLMs在達到與閉源LLMs相似的基準性能后,通常使用較少的訓練計算,但新模型通常更高效。因此,我們缺乏同樣高效的新閉源模型的數據。

訓練數據污染和“為排行榜而學習”也可能導致更高的分數。

wKgZoWc2vNyAD19cAAEcuaFiRTg664.png

三,總結

開源與閉源AI模型之間的競爭和差距反映了AI領域的多樣性和復雜性。盡管開源模型在某些方面落后于閉源模型,但它們在促進創新和安全性研究方面具有獨特的優勢。未來的發展將是結合兩者的優點,開發能力優秀、規模適中、邊緣友好的AI模型,以滿足多樣化的應用需求。當然也取決于技術進步、市場需求和政策監管的綜合影響。

這兩種模型你更看好哪一個呢?歡迎評論留言討論。

更多精彩內容請關注“算力魔方?”!

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 開源
    +關注

    關注

    3

    文章

    3253

    瀏覽量

    42408
  • 模型
    +關注

    關注

    1

    文章

    3174

    瀏覽量

    48716
收藏 人收藏

    評論

    相關推薦

    阿里通義千問代碼模型全系列開源

    近日,阿里云通義大模型團隊宣布了一項重大決策:將通義千問代碼模型全系列正式開源。此次開源模型系列共包含6款Qwen2.5-Coder
    的頭像 發表于 11-14 15:26 ?212次閱讀

    科技云報到:假開源真噱頭?開源模型和你想的不一樣!

    查看、修改、分發。開源自此深刻影響了互聯網行業的每一個角落。 在大模型和GenAI崛起的當下,開源再次成為業界關注焦點,對于開源
    的頭像 發表于 11-03 10:46 ?172次閱讀

    Llama 3 與開源AI模型的關系

    在人工智能(AI)的快速發展中,開源AI模型扮演著越來越重要的角色。它們不僅推動了技術的創新,促進了全球開發者社區的合作。Llama 3,作為一個新興的AI項目,與開源AI
    的頭像 發表于 10-27 14:42 ?319次閱讀

    人民郵電報:“開源到底是什么?為啥熱度越來越高?

    ? ? ? 本文轉載自人民郵電報 這些年,“開源”這個詞越來越火,開源AI大模型開源數據庫、開源框架、
    的頭像 發表于 10-17 14:21 ?458次閱讀
    人民郵電報:“<b class='flag-5'>開源</b>”<b class='flag-5'>到底</b>是什么?為啥熱度越來越高?

    英偉達將全面轉向開源GPU內核模塊

    英偉達公司近期宣布了一項重大決策,即全面轉向開源GPU內核模塊,并計劃最終以此取代驅動程序。這一戰略轉變標志著英偉達在開源領域邁出了重要一步,旨在為用戶提供更強大、更全面的Linu
    的頭像 發表于 07-19 15:26 ?537次閱讀

    浪潮信息重磅發布“2.0-M32”開源模型

    浪潮信息近日發布了一款全新的開源模型——“2.0-M32”。這款大模型在“2.0”系列大模型
    的頭像 發表于 06-05 14:50 ?736次閱讀

    浪潮信息發布2.0-M32開源模型,模算效率大幅提升

    5月28日,浪潮信息發布“2.0-M32”開源模型。“2.0-M32”在基于”2.0”系列大模型
    的頭像 發表于 05-29 09:34 ?387次閱讀
    浪潮信息發布<b class='flag-5'>源</b>2.0-M32<b class='flag-5'>開源</b>大<b class='flag-5'>模型</b>,模算效率大幅提升

    浪潮信息發布“2.0-M32”開源模型

    浪潮信息近日推出了革命性的“2.0-M32”開源模型。該模型2.0系列基礎上,引入了“基于注意力機制的門控網絡”技術,構建了一個包含
    的頭像 發表于 05-29 09:08 ?602次閱讀

    研究院揭曉大模型測評結果,豆包與百川智能大模型表現優異

    在多模態理解圖文問答任務中,開源模型表現相當,而國產模型則表現出色。此外,在中文語境下的文生圖能力方面,國產多模態
    的頭像 發表于 05-20 09:26 ?678次閱讀

    李彥宏說開源模型會越來越落后,為什么很多人不認同?

    上周,百度董事長兼CEO李彥宏對于開源模型的一番言論引發了爭議。
    的頭像 發表于 04-24 09:37 ?429次閱讀
    李彥宏說<b class='flag-5'>開源</b><b class='flag-5'>模型</b>會越來越<b class='flag-5'>落后</b>,為什么很多人不認同?

    HDMI論壇出手,AMD開源HDMI 2.1驅動被拒

    喜愛的原因之一。然而,在高分辨率+高幀率的顯示器上,Linux卻在正式的開源驅動一直缺席,甚至連AMD也無能為力。 ? 開源系統上的標準 ? 對于Linux這個
    的頭像 發表于 03-05 00:10 ?2797次閱讀

    機器人基于開源的多模態語言視覺大模型

    ByteDance Research 基于開源的多模態語言視覺大模型 OpenFlamingo 開發了開源、易用的 RoboFlamingo 機器人操作模型,只用單機就可以訓練。
    發表于 01-19 11:43 ?365次閱讀
    機器人基于<b class='flag-5'>開源</b>的多模態語言視覺大<b class='flag-5'>模型</b>

    心寄 | 2023開源法律熱點,Pick您最關心的話題

    務、律師 等法律專業人士。 2023年,“心寄”本著“開啟開源法律相關人才交流的新紀元”的初心,舉辦了 8 場線下及線上沙龍活動,其成員們積極參與了 1 場2023開放原子全球開源
    的頭像 發表于 12-30 16:30 ?1194次閱讀
    心寄<b class='flag-5'>源</b> | 2023<b class='flag-5'>開源</b>法律熱點,Pick您最關心的話題

    阿里云通義千問720億參數模型宣布開源

    12月1日,阿里云通義千問720億參數模型Qwen-72B宣布開源。與此同時,他們開源了18億參數模型Qwen-1.8B和音頻大
    的頭像 發表于 12-01 17:08 ?1321次閱讀

    浪潮信息發布2.0基礎大模型,千億參數全面開源

    11月27日,浪潮信息發布"2.0"基礎大模型,并宣布全面開源2.0基礎大模型包括1026億、518億、21億等三種參數規模的
    的頭像 發表于 11-28 09:10 ?792次閱讀
    浪潮信息發布<b class='flag-5'>源</b>2.0基礎大<b class='flag-5'>模型</b>,千億參數全面<b class='flag-5'>開源</b>