精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

云知聲山海大模型位居全球大模型第一梯隊

云知聲 ? 來源:云知聲 ? 2024-09-12 14:41 ? 次閱讀

SuperCLUE發(fā)布《中文大模型基準測評2024上半年報告》,報告選取國內(nèi)外有代表性的33個大模型在6月份的版本,通過多維度綜合性測評,對國內(nèi)外大模型發(fā)展現(xiàn)狀進行觀察與思考。

報告顯示,云知聲山海大模型在本次半年度評測中取得總分72的優(yōu)異成績,與360gpt2-pro、字節(jié)跳動豆包、月之暗面Kimi、百川智能Baichuan4并列國內(nèi)大模型第四,穩(wěn)居全球大模型第一梯隊。

SuperCLUE作為國內(nèi)權(quán)威通用大模型綜合性測評基準,其前身可追溯至第三方中文語言理解評估基準CLUE(The Chinese Language Understanding Evaluation)。自2019年成立以來,CLUE基準一直致力于提供科學(xué)、客觀、中立的語言模型評測,其先后推出了CLUE、FewCLUE、KgCLUE、DataCLUE等多個被廣泛認可的評估標(biāo)準。根據(jù)CLUE多年測評經(jīng)驗,SuperCLUE基于通用大模型在學(xué)術(shù)、產(chǎn)業(yè)與用戶側(cè)的廣泛應(yīng)用,構(gòu)建了多層次、多維度的綜合性測評基準。

作為一個完全獨立的第三方評測機構(gòu),SuperCLUE采用自動化評測技術(shù),有效消除人為因素帶來的不確定性,確保提供無偏倚的客觀評測結(jié)果。不同于傳統(tǒng)測評通過選擇題形式的測評,SuperCLUE納入開放主觀問題的測評,通過多維度多視角多層次的評測體系以及對話的形式,模擬大模型的應(yīng)用場景,真實有效考察模型生成能力。與此同時,SuperCLUE根據(jù)全球的大模型技術(shù)發(fā)展趨勢,不斷升級迭代測評體系、測評維度和方法,以保證盡可能精準量化大模型的技術(shù)演進程度。

為進一步真實反映大模型能力,本次通用測評采用多維度、多層次的綜合性測評方案,由理科、文科和Hard三大維度構(gòu)成:理科任務(wù)分為計算、邏輯推理、代碼測評集;文科任務(wù)分為知識百科、語言理解、長文本、角色扮演、生成與創(chuàng)作、安全和工具使用七大測評集;Hard任務(wù)聚焦精確指令遵循測評集,未來將陸續(xù)推出復(fù)雜多步推理和高難度問題解決等評測。

從代表通用能力的一級總分來看,山海大模型得分72,與360gpt2-pro、字節(jié)跳動豆包、月之暗面Kimi、百川智能Baichuan4并列國內(nèi)大模型第四,位居全球大模型第一梯隊。

具體到二級維度得分,山海大模型在理科和文科領(lǐng)域均表現(xiàn)優(yōu)異——在理科能力方面,山海大模型以76分的高分緊隨GPT-4o、GPT-4-Turbo-0409之后,力壓一眾國內(nèi)大模型,并列排名國內(nèi)第一;文科能力以75分的成績并列國內(nèi)第二,實力同樣不容小覷。

在SuperCLUE基于基礎(chǔ)能力和應(yīng)用能力兩個維度構(gòu)建的模型象限圖中,山海大模型被定位為“卓越領(lǐng)導(dǎo)者”。這一分類反映了山海大模型在基礎(chǔ)和場景應(yīng)用能力上均達到了領(lǐng)先水平,持續(xù)引領(lǐng)國內(nèi)大模型技術(shù)發(fā)展和創(chuàng)新。

此外,與GPT4-Turbo-0409的對戰(zhàn)勝率統(tǒng)計數(shù)據(jù)顯示,山海勝率為17.67%,和率為65.37%,位列國內(nèi)大模型第五,整體實力依舊不俗。

自2023年5月問世以來,山海大模型已相繼在C-Eval全球大模型綜合性評測、OpenCompass大模型評測、MedBench評測等多個權(quán)威評測中屢創(chuàng)佳績,充分展現(xiàn)出業(yè)界一流的通用能力和領(lǐng)先于世界的行業(yè)大模型能力。

正如報告所言,隨著技術(shù)進步和應(yīng)用場景拓展,2024年下半年國內(nèi)外大模型市場競爭將持續(xù)加劇,推動技術(shù)創(chuàng)新和產(chǎn)業(yè)升級。接下來,云知聲將繼續(xù)保持大模型能力穩(wěn)步提升,以山海為抓手,在產(chǎn)業(yè)側(cè)實現(xiàn)加速落地,致力成為真正助力各行各業(yè)的“新質(zhì)生產(chǎn)力”。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 云知聲
    +關(guān)注

    關(guān)注

    0

    文章

    142

    瀏覽量

    8331
  • 字節(jié)跳動
    +關(guān)注

    關(guān)注

    0

    文章

    296

    瀏覽量

    8823
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2126

    瀏覽量

    1965

原文標(biāo)題:SuperCLUE 2024半年度報告:云知聲山海大模型位居全球大模型第一梯隊,理科能力國內(nèi)并列第一,文科能力并列國內(nèi)第二

文章出處:【微信號:云知聲,微信公眾號:云知聲】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    山海模型助力司法領(lǐng)域智慧化升級

    近期,成功助力上海市徐匯區(qū)虹梅街道司法所打造基于山海模型的司法領(lǐng)域應(yīng)用,極大提升了司法服務(wù)的可及性與便利性。這不僅是
    的頭像 發(fā)表于 09-12 14:44 ?379次閱讀

    推出山海多模態(tài)大模型

    在人工智能技術(shù)的浩瀚星海中,多模態(tài)交互技術(shù)正成為引領(lǐng)未來的新航標(biāo)。繼OpenAI的GPT-4o掀起滔天巨浪后,以創(chuàng)新之姿,推出了其匠心獨運的山海多模態(tài)大
    的頭像 發(fā)表于 08-27 15:20 ?254次閱讀

    GenAI IaaS增速驚人,商湯科技躋身第一梯隊

    ,與火山引擎、阿里巴巴共同躋身2023年下半年中國GenAI IaaS服務(wù)廠商TOP 3,以顯著的市場份額優(yōu)勢位居GenAI IaaS領(lǐng)域的第一梯隊
    的頭像 發(fā)表于 07-30 11:00 ?519次閱讀
    GenAI IaaS增速驚人,商湯科技躋身<b class='flag-5'>第一梯隊</b>

    國產(chǎn)大模型第一梯隊玩家,為什么pick了CPU?

    AI從“燒錢游戲”變?yōu)椤捌栈菘萍肌?,正是AIGC產(chǎn)業(yè)應(yīng)對算力門檻,推動規(guī)?;瘧?yīng)用落地的關(guān)鍵招。未來,隨著技術(shù)創(chuàng)新和生態(tài)完善,這模式還將為更多企業(yè)創(chuàng)造價值,為產(chǎn)業(yè)發(fā)展注入新的動力。
    的頭像 發(fā)表于 07-10 20:13 ?238次閱讀
    國產(chǎn)大<b class='flag-5'>模型</b><b class='flag-5'>第一梯隊</b>玩家,為什么pick了CPU?

    在邊緣側(cè)大模型技術(shù)探索和應(yīng)用

    解決的課題。 2024高工智能汽車開發(fā)者大會暨艙駕智能與跨域論壇上,智慧座艙解決方案中心總經(jīng)理鮑晴峰以《邊緣側(cè)大模型帶來智能座艙交互新體驗》為題,分享了
    的頭像 發(fā)表于 06-29 15:30 ?669次閱讀

    曝華為Mate 70將迎重大突破,性能重回第一梯隊!

    會很明顯,將重回第一梯隊,而最快9月份發(fā)布。 此外,華為Mate 70系列的備貨量相比Mate 60系列將有顯著提升,預(yù)計增長幅度在40%至50%之間。 這意味著相較于Mate 60系列的供應(yīng)緊張情況,Mate 70系列的市場供應(yīng)壓力將大為緩解。 在這之前,就已經(jīng)有消息稱,華為的新麒麟CPU已調(diào)試很好,
    的頭像 發(fā)表于 05-17 09:22 ?230次閱讀

    山海模型醫(yī)療行業(yè)版登頂上海AI實驗室權(quán)威大模型評測榜

    近日,上海AI實驗室和上海市數(shù)字醫(yī)學(xué)創(chuàng)新中心聯(lián)合推出的MedBench評測更新榜單,山海模型醫(yī)療行業(yè)版(UNIGPT-MED) 以綜
    的頭像 發(fā)表于 04-24 14:28 ?1680次閱讀
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b><b class='flag-5'>山海</b>大<b class='flag-5'>模型</b>醫(yī)療行業(yè)版登頂上海AI實驗室權(quán)威大<b class='flag-5'>模型</b>評測榜

    山海模型再赴港IPO

    智能科技股份有限公司(簡稱“”)于3月15日更新了招股書,繼續(xù)其在港交所主板上市的步
    的頭像 發(fā)表于 03-22 14:51 ?560次閱讀

    山海模型獲得華為昇騰技術(shù)認證

    山海模型近日取得了重大突破,順利通過了華為Atlas 800訓(xùn)練服務(wù)器和華為AI框架昇思MindSpore的兼容性測試。這
    的頭像 發(fā)表于 02-05 09:32 ?815次閱讀

    全新推出AIGC內(nèi)容創(chuàng)作平臺藍藻AI

    近日,基于智能語音技術(shù)和山海模型技術(shù),全新推出AIGC內(nèi)容創(chuàng)作平臺——藍藻AI,為創(chuàng)作者提供AI聲音克隆、AI文字配音、AI文案創(chuàng)作
    的頭像 發(fā)表于 01-10 13:38 ?647次閱讀

    山海模型助力實現(xiàn)換乘節(jié)點無縫高效換乘

    、出租車、網(wǎng)約車等多種出行方式于體的大型綜合交通樞紐,是南寧對外銜接的主要門戶和窗口。 此次南寧火車東站升級,是以山海
    的頭像 發(fā)表于 10-31 09:27 ?898次閱讀

    開發(fā)首個面向行業(yè)垂直領(lǐng)域的AI產(chǎn)品“龍政”政務(wù)GPT大模型

    隨著大模型能力的不斷完善,聚焦特定領(lǐng)域的大模型落地實踐正迎來發(fā)展熱潮。 近日,攜手深圳市龍華數(shù)據(jù)有限公司,以
    的頭像 發(fā)表于 10-21 09:38 ?2319次閱讀

    “數(shù)字龍華”再添新動力,山海助力龍華構(gòu)建深圳首個政務(wù)垂直領(lǐng)域GPT大模型

    隨著大模型能力的不斷完善,聚焦特定領(lǐng)域的大模型落地實踐正迎來發(fā)展熱潮。 近日,攜手深圳市龍華數(shù)據(jù)有限公司,以
    發(fā)表于 10-19 17:33 ?271次閱讀
    “數(shù)字龍華”再添新動力,<b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b><b class='flag-5'>山海</b>助力龍華構(gòu)建深圳首個政務(wù)垂直領(lǐng)域GPT大<b class='flag-5'>模型</b>

    AI語音芯片產(chǎn)品解鎖更多交互場景

    人工智能技術(shù)熱點,共話AI產(chǎn)業(yè)未來。 本次大會,山海模型及系列場景應(yīng)用、AI語音芯片及最新應(yīng)用成果亮相展會,帶領(lǐng)觀眾開啟
    的頭像 發(fā)表于 10-13 09:30 ?1536次閱讀

    國內(nèi)外AI芯片、算力、大模型綜合對比(2023)

    國內(nèi)AI芯片廠商格局:一梯隊,有成熟產(chǎn)品、批量出貨的企業(yè),包括寒武紀、華為海思、百度昆侖芯、燧原科技等;二梯隊,以AI芯片起家的壁 仞科技、天數(shù)智心、摩爾線程、沐曦等;三梯隊,如海光、景嘉微等。
    的頭像 發(fā)表于 09-28 16:01 ?8286次閱讀