国产成人精品免费视频大全_无码人妻精品一二三区免费_精品极品国产呦在线观看_99久久精品无码一区二区三区

斯坦福大學(xué)研發(fā)的大語(yǔ)言模型評(píng)測(cè) AlpacaEvalLeaderboard備受業(yè)內(nèi)認(rèn)可，在 2023 年 12 月 7 日更新的排行榜中，Yi-34B-Chat 以 94.08% 的勝率，超越 LLaMA2 Chat 70B、Claude 2、ChatGPT，在 Alpaca 經(jīng)認(rèn)證的模型類(lèi)別中，成為僅次于 GPT-4 英語(yǔ)能力的大語(yǔ)言模型。

同一周，在加州大學(xué)伯克利分校主導(dǎo)的LMSYS ORG排行榜中，Yi-34B-Chat也以1102的Elo評(píng)分，晉升最新開(kāi)源SOTA開(kāi)源模型之列，性能表現(xiàn)追平GPT-3.5。

多個(gè)Benchmark遙遙領(lǐng)先

在五花八門(mén)的大模型評(píng)測(cè)中，伯克利LMSYS ORG排行榜采用了一個(gè)最為接近用戶(hù)體感的「聊天機(jī)器人競(jìng)技場(chǎng)」特殊測(cè)評(píng)模式，讓眾多大語(yǔ)言模型在評(píng)測(cè)平臺(tái)隨機(jī)進(jìn)行一對(duì)一 battle，通過(guò)眾籌真實(shí)用戶(hù)來(lái)進(jìn)行線(xiàn)上實(shí)時(shí)盲測(cè)和匿名投票，11月份經(jīng)25000的真實(shí)用戶(hù)投票總數(shù)計(jì)算了20個(gè)大模型的總得分。
Elo評(píng)分越高，說(shuō)明模型在真實(shí)用戶(hù)體驗(yàn)上的表現(xiàn)越出色，可說(shuō)是眾多大模型評(píng)測(cè)集中最能展現(xiàn)「Moment of Truth」真實(shí)關(guān)鍵一刻” 的用戶(hù)導(dǎo)向體驗(yàn)對(duì)決。

在開(kāi)源模型中，Yi-34B-Chat成為當(dāng)之無(wú)愧的「最強(qiáng)王者」之一（英語(yǔ)能力），LMSYS ORG 在12月8日官宣11月份總排行時(shí)評(píng)價(jià)：「Yi-34B-Chat 和 Tulu-2-DPO-70B 在開(kāi)源界的進(jìn)擊表現(xiàn)已經(jīng)追平 GPT-3.5」。

風(fēng)波終結(jié)，爭(zhēng)議理清

Yi-34B開(kāi)源發(fā)布后，開(kāi)發(fā)者Eric Hartford發(fā)現(xiàn)了模型存在的一個(gè)問(wèn)題，就簡(jiǎn)略留言在 Yi 的項(xiàng)目頁(yè)面。然而Eric自己也沒(méi)有預(yù)想到，他的留言引發(fā)了后續(xù)輿論關(guān)于Yi模型「抄襲」LLaMA的質(zhì)疑。

他在郵件中寫(xiě)道，「感謝你們提供了一個(gè)優(yōu)秀的模型。Yi模型使用了與LLaMA模型完全相同的架構(gòu)，只是將兩個(gè)張量改了名字。由于圍繞LLaMA架構(gòu)有很多投資和工具，保持張量名稱(chēng)的一致性是有價(jià)值的。」Eric建議，在Yi被廣泛傳播前，及時(shí)恢復(fù)張量名稱(chēng)。客觀來(lái)說(shuō)，一個(gè)模型核心技術(shù)護(hù)城河是在架構(gòu)之上，通過(guò)數(shù)據(jù)訓(xùn)練獲得的參數(shù)和代碼。大多數(shù)有志于參與基座大模型競(jìng)爭(zhēng)的團(tuán)隊(duì)，也多是從零開(kāi)始，用高質(zhì)量的數(shù)據(jù)集再進(jìn)行訓(xùn)練，普遍都是在沿用LLaMA架構(gòu)。零一后來(lái)解釋他們?yōu)榱藞?zhí)行對(duì)比實(shí)驗(yàn)的需要，對(duì)部分推理參數(shù)進(jìn)行了重新命名，原始出發(fā)點(diǎn)是為了充分測(cè)試模型，而非刻意隱瞞來(lái)源。

身處這場(chǎng)輿論風(fēng)暴的中心，Eric 意識(shí)到了可能給一些人帶來(lái)了誤解，開(kāi)始解釋自己之前的發(fā)言。

他在X（twitter）上寫(xiě)道，「他們沒(méi)有在任何事情上撒謊。所有的模型都是在相互借鑒架構(gòu)。架構(gòu)是學(xué)術(shù)研究的產(chǎn)物，已經(jīng)發(fā)表在論文中，任何人都可以自由使用，這絲毫不減損Yi團(tuán)隊(duì)的成就。他們從零開(kāi)始使用自己創(chuàng)建的數(shù)據(jù)集訓(xùn)練Yi，對(duì)開(kāi)源領(lǐng)域的貢獻(xiàn)是值得贊揚(yáng)的。使用Llama架構(gòu)沒(méi)有任何問(wèn)題。訓(xùn)練才是關(guān)鍵。Yi給了我們目前可獲得的最佳模型，沒(méi)有任何可抱怨的。」現(xiàn)在，Eric 自己也在使用Yi-34B 系列，用Yi-34b-200k數(shù)據(jù)集訓(xùn)練其他的模型產(chǎn)品。 Yi模型開(kāi)源首月，數(shù)據(jù)也很亮眼。在Hugging Face社區(qū)下載量為16.8萬(wàn)，魔搭社區(qū)下載量1.2萬(wàn)。在GitHub 獲得超過(guò)4900個(gè)Stars。

由于性能表現(xiàn)強(qiáng)勁，多家知名公司和機(jī)構(gòu)推出了基于Yi模型基座的微調(diào)模型，比如獵豹旗下的獵戶(hù)星空公司推出的OrionStar-Yi-34B-Chat模型，南方科技大學(xué)和粵港澳大灣區(qū)數(shù)字經(jīng)濟(jì)研究院（簡(jiǎn)稱(chēng)IDEA研究院）認(rèn)知計(jì)算與自然語(yǔ)言研究中心（簡(jiǎn)稱(chēng)CCNL中心）聯(lián)合發(fā)布的SUS-Chat-34B等，均性能表現(xiàn)優(yōu)異。而AMD和Hugging Face合作的GPU加速大模型的實(shí)驗(yàn)中，也選擇了Yi-6B作為范例項(xiàng)目。

模型好不好，開(kāi)發(fā)者最知道在大模型實(shí)際使用體驗(yàn)上，最有發(fā)言權(quán)的還是一線(xiàn)的開(kāi)發(fā)者。知名技術(shù)作者蘇洋表示，在他觀察的近期Hugging Face榜單中，前三十名有一半多都是 Yi 和其他用戶(hù)微調(diào)的 Yi-34B 的變體模型，原本占據(jù)榜單頭部的 68B 和 70B 模型的數(shù)量目前只留有幾個(gè)，「從這點(diǎn)看 Yi 對(duì)于開(kāi)源生態(tài)的幫助還是非常巨大的。」他會(huì)時(shí)不時(shí)的瀏覽下 HF 的榜單，在最近榜單中的前三十名，有一半多都是 Yi 和其他用戶(hù)微調(diào)的 Yi-34B 的變體模型，原本占據(jù)榜單頭部的 68B 和 70B 模型的數(shù)量目前只留有幾個(gè)，從這點(diǎn)看 Yi 對(duì)于開(kāi)源生態(tài)的幫助還是非常巨大的。

蘇洋還將他的訓(xùn)練經(jīng)驗(yàn)和心得在CSDN上做了分享（https://blog.csdn.net/soulteary/article/details/134904434）。

蘇洋認(rèn)為 34B 普通用戶(hù)努努力還是能自己相對(duì)低成本跑起來(lái)的，68 和 70B 的模型想要本地運(yùn)行，需要更多的資源。但其實(shí)目前分?jǐn)?shù)其實(shí)相比較 34B 拉不開(kāi)太多，也就三四分平均分，但參數(shù)量差了一倍。換言之，企業(yè)想部署使用，所需要的成本也可以得到非常大的節(jié)約。

目前國(guó)產(chǎn)大模型在開(kāi)源榜單上已經(jīng)是第一梯隊(duì)，但如果把競(jìng)爭(zhēng)范圍追加到閉源模型、尤其是海外的模型，仍有很大的距離要去追趕。目前的普遍體驗(yàn)是開(kāi)源模型最多只有 GPT-3.5 + 的水平。

蘇洋認(rèn)為國(guó)產(chǎn)大模型，是能夠很快追趕至第一梯隊(duì)的。時(shí)間也會(huì)證明大模型自身的價(jià)值，以及驗(yàn)證出團(tuán)隊(duì)是否對(duì)開(kāi)源有真的持續(xù)投入。

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

語(yǔ)言模型

語(yǔ)言模型

+關(guān)注

關(guān)注
0

文章
508

瀏覽量
10245
聊天機(jī)器人

聊天機(jī)器人

+關(guān)注

關(guān)注
0

文章
332

瀏覽量
12295
大模型

大模型

+關(guān)注

關(guān)注
2

文章
2335

瀏覽量
2493

原文標(biāo)題：開(kāi)源風(fēng)波后在 AlpacaEval 直追 GPT4，零一靠技術(shù)如何重建生態(tài)信心

文章出處：【微信號(hào)：AI科技大本營(yíng)，微信公眾號(hào)：AI科技大本營(yíng)】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

Llama 3 與 GPT-4 比較

沿。一、技術(shù)架構(gòu) Llama 3和GPT-4都是基于深度學(xué)習(xí)的自然語(yǔ)言處理（NLP）模型，但它們的設(shè)計(jì)理念和技術(shù)細(xì)節(jié)有所不同。 Llama 3 采用了一種創(chuàng)新的混合架構(gòu)，結(jié)合了傳統(tǒng)的Transformer模型和最新的神經(jīng)網(wǎng)絡(luò)

發(fā)表于 10-27 14:17 ?276次閱讀

如何使用 ChatGPT 進(jìn)行內(nèi)容創(chuàng)作

到ChatGPT平臺(tái)。選擇模型： ChatGPT目前支持GPT3.5和GPT4兩個(gè)模型。根據(jù)創(chuàng)作需求，選擇合適的模型。一般來(lái)說(shuō)，GPT4在性能和生成質(zhì)量上可能更優(yōu)。明確創(chuàng)作目標(biāo)

發(fā)表于 10-25 16:08 ?366次閱讀

請(qǐng)回答OpenHarmony | 關(guān)于開(kāi)源生態(tài)的未來(lái)想象，我們現(xiàn)場(chǎng)回答

第三屆OpenHarmony技術(shù)大會(huì)即將啟幕今年相聚，OpenHarmony又迎來(lái)了怎樣的突破與發(fā)展？在萬(wàn)物智聯(lián)的時(shí)代，如何通過(guò)技術(shù)創(chuàng)新引領(lǐng)智能未來(lái)？ OpenHarmony的開(kāi)源

發(fā)表于 10-12 00:09

開(kāi)放原子開(kāi)源生態(tài)大會(huì)OpenHarmony生態(tài)主題演講報(bào)名開(kāi)啟

展示OpenHarmony的技術(shù)創(chuàng)新和產(chǎn)業(yè)落地成果，分享開(kāi)源社區(qū)生態(tài)進(jìn)展。誠(chéng)邀全球開(kāi)源操作系統(tǒng)產(chǎn)業(yè)伙伴、技術(shù)大咖和學(xué)術(shù)專(zhuān)家，共同見(jiàn)證

發(fā)表于 09-19 22:02

OpenAI 推出 GPT-4o mini 取代GPT 3.5 性能超越GPT 4 而且更快 API KEY更便宜

OpenAI推出了GPT-4o mini模型，用來(lái)取代GPT-3.5.這是目前市場(chǎng)上最具成本效益的小模型。 ? 該模型在MMLU上得分為82%，在LMSYS排行榜上的聊天偏好測(cè)試中表

發(fā)表于 07-21 10:20 ?931次閱讀

OpenAI 推出 <b class='flag-5'>GPT-4</b>o mini 取代<b class='flag-5'>GPT</b> 3.5 性能超越<b class='flag-5'>GPT</b> <b class='flag-5'>4</b> 而且更快 API KEY更便宜

【議題征集】國(guó)際開(kāi)源及RISC-V人才暨開(kāi)源技術(shù)與生態(tài)之旅

【議題征集】國(guó)際開(kāi)源及RISC-V人才暨開(kāi)源技術(shù)與生態(tài)之旅

發(fā)表于 07-02 08:36 ?240次閱讀

【議題征集】國(guó)際<b class='flag-5'>開(kāi)源</b>及RISC-V人才暨<b class='flag-5'>開(kāi)源</b><b class='flag-5'>技術(shù)</b>與<b class='flag-5'>生態(tài)</b>之旅

國(guó)內(nèi)直聯(lián)使用ChatGPT 4.0 API Key使用和多模態(tài)GPT4o API調(diào)用開(kāi)發(fā)教程！

1. 前言 ChatGPT-4o API 是 OpenAI 提供的強(qiáng)大工具，可用于自然語(yǔ)言處理和多模態(tài)任務(wù)。在國(guó)內(nèi)直聯(lián)使用這些服務(wù)需要一些配置和技巧。本文將詳細(xì)介紹GPT-4o模型以及如何獲取

發(fā)表于 06-08 00:33 ?4516次閱讀

國(guó)內(nèi)直聯(lián)使用ChatGPT 4.0 API Key使用和多模態(tài)<b class='flag-5'>GPT4</b>o API調(diào)用開(kāi)發(fā)教程！

開(kāi)發(fā)者如何調(diào)用OpenAI的GPT-4o API以及價(jià)格詳情指南

，高達(dá)每分鐘1000萬(wàn)字符。速度：GPT-4o的速度是GPT-4 Turbo的兩倍。視覺(jué)能力：在視覺(jué)能力相關(guān)的評(píng)估中，GPT-4o表現(xiàn)優(yōu)于G

發(fā)表于 05-29 16:00 ?1w次閱讀

OpenAI推出面向所有用戶(hù)的AI模型GPT-4o

在周一的直播盛會(huì)上，OpenAI揭開(kāi)了其最新的人工智能模型GPT-4o的神秘面紗。這款新模型旨在為其著名的聊天機(jī)器人ChatGPT提供更強(qiáng)大、更經(jīng)濟(jì)的支持。GPT-4o是此前備受矚目的GPT-

發(fā)表于 05-15 09:23 ?370次閱讀

OpenAI發(fā)布GPT-4o模型，供全體用戶(hù)免費(fèi)使用

OpenAI首席技術(shù)官穆里·穆拉蒂（Muri Murati）指出，GPT-4o具備與GPT-4相同的智能水平，且在文本、圖像及語(yǔ)音處理方面有顯著進(jìn)步。

發(fā)表于 05-14 11:17 ?459次閱讀

阿里云發(fā)布通義千問(wèn)2.5大模型，多項(xiàng)能力超越GPT-4

阿里云隆重推出了通義千問(wèn) 2.5 版，宣稱(chēng)其“技術(shù)進(jìn)步，全面超越GPT-4”，尤其是在中文環(huán)境中的多種任務(wù)（如文本理解、文本生成、知識(shí)問(wèn)答及生活建議、臨時(shí)聊天及對(duì)話(huà)以及安全風(fēng)險(xiǎn)評(píng)估）方面表現(xiàn)出色，超越了

發(fā)表于 05-09 14:17 ?922次閱讀

股價(jià)久違飆漲，商湯要用自己的Scaling law挑戰(zhàn)GPT4

前一天的“2024年商湯技術(shù)交流日”上，商湯發(fā)布了對(duì)標(biāo)GPT4-Turbo的大模型日日新大模型SenseNova5.0，追趕GPT4可能是當(dāng)下中國(guó)大模型行業(yè)的集體目

發(fā)表于 05-08 08:05 ?276次閱讀

賦能行業(yè)，共贏未來(lái)：2023開(kāi)源產(chǎn)業(yè)生態(tài)大會(huì)OpenHarmony生態(tài)論壇成功舉辦

信息技術(shù)協(xié)會(huì)統(tǒng)籌主辦的2023開(kāi)源產(chǎn)業(yè)生態(tài)大會(huì)在上海開(kāi)幕。華為攜手OpenAtom OpenHarmony（以下簡(jiǎn)稱(chēng)“OpenHarmony”）項(xiàng)目群生態(tài)委員會(huì)舉辦OpenHarmon

發(fā)表于 12-21 21:15 ?505次閱讀

ChatGPT plus有什么功能？OpenAI 發(fā)布 GPT-4 Turbo 目前我們所知道的功能

OpenAI 發(fā)布 GPT-4 Turbo 目前我們所知道的功能分析解答在最近的OpenAI DevDay上，該組織發(fā)布了一項(xiàng)備受期待的公告：推出GPT-4 Turbo，這是對(duì)其突破性AI模型

發(fā)表于 12-13 09:19 ?1071次閱讀

微軟Copilot（Bing Chat）將升級(jí)至GPT-4 Turbo

微軟Copilot（Bing Chat）將升級(jí)至GPT-4 Turbo 微軟廣告和網(wǎng)絡(luò)服務(wù)負(fù)責(zé)人Mikhail Parakhin在X平臺(tái)透露，Copilot（Bing Chat）目前還在解決一些問(wèn)題

發(fā)表于 11-28 18:37 ?1142次閱讀

精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

搜索歷史

開(kāi)源風(fēng)波后在AlpacaEval直追GPT4，零一靠技術(shù)如何重建生態(tài)信心

評(píng)論

Llama 3 與 GPT-4 比較

如何使用 ChatGPT 進(jìn)行內(nèi)容創(chuàng)作

請(qǐng)回答OpenHarmony | 關(guān)于開(kāi)源生態(tài)的未來(lái)想象，我們現(xiàn)場(chǎng)回答

開(kāi)放原子開(kāi)源生態(tài)大會(huì)OpenHarmony生態(tài)主題演講報(bào)名開(kāi)啟

OpenAI 推出 GPT-4o mini 取代GPT 3.5 性能超越GPT 4 而且更快 API KEY更便宜

【議題征集】國(guó)際開(kāi)源及RISC-V人才暨開(kāi)源技術(shù)與生態(tài)之旅

國(guó)內(nèi)直聯(lián)使用ChatGPT 4.0 API Key使用和多模態(tài)GPT4o API調(diào)用開(kāi)發(fā)教程！

開(kāi)發(fā)者如何調(diào)用OpenAI的GPT-4o API以及價(jià)格詳情指南

OpenAI推出面向所有用戶(hù)的AI模型GPT-4o

OpenAI發(fā)布GPT-4o模型，供全體用戶(hù)免費(fèi)使用

阿里云發(fā)布通義千問(wèn)2.5大模型，多項(xiàng)能力超越GPT-4

股價(jià)久違飆漲，商湯要用自己的Scaling law挑戰(zhàn)GPT4

賦能行業(yè)，共贏未來(lái)：2023開(kāi)源產(chǎn)業(yè)生態(tài)大會(huì)OpenHarmony生態(tài)論壇成功舉辦

ChatGPT plus有什么功能？OpenAI 發(fā)布 GPT-4 Turbo 目前我們所知道的功能

微軟Copilot（Bing Chat）將升級(jí)至GPT-4 Turbo