精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

國內8種大模型體驗測評報告(2023)

智能計算芯世界 ? 來源:智能計算芯世界 ? 2023-08-21 15:48 ? 次閱讀

人工智能大模型體驗報告2.0》報告指出當前國產大模型產品已具有顯著進步,訊飛星火、百度文心一言、商湯商量和智譜AI-ChatGLM均表現搶眼,但與接受過高等教育的人類相比,在智商、情商等方面仍存在一定程度差距。

報告選取360智腦、百度文心一言、瀾舟 Mchat、商湯商量、訊飛星火、阿里通義千問、昆侖天工、智譜 ChatGLM 共 8 種大模型產品進行評測,根據基礎能力、智商能力、情商能力、工具提取四個維度計算總分。

報告顯示,與2023年6月相比,當前中國大模型產品進步顯著。但與接受過高等教育的人類相比,大模型在智商、情商等方面還存在一定程度差距。具體來看,訊飛星火在工作提效方面優勢明顯,百度文心一言基礎能力仍處領軍水準,商湯商量則在情商方面表現優秀,智譜AI-ChatGLM整體表現優秀。

針對各維度能力測評,該報告還給出了相應的案例展示和分析。

在基礎能力方面,人類與AI之間的差距并不顯著。課題組分別從語言能力(35%)、AI向善(10%)、跨模態(20%)和多輪對話(35%)四大指標進行測評。測評顯示,科技企業大模型中,百度文心一言表現最為搶眼,商湯商量、智譜AI-ChatGLM、360智腦表現優良。

在智商評估方面,人類在智商方面仍然具有明顯優勢。課題組分別從常識知識(20%)、邏輯能力(50%)和專業知識(30%)方面對科技企業大模型進行考量。結果顯示,訊飛星火、智譜AI-ChatGLM表現突出,百度文心一言、昆侖萬維天工表現優良。

在情商方面,AI與人類之間的差距最為明顯。人類在情緒理解和處理方面通常具有更強的優勢,和更靈活的處理能力。通過對處理日常事項(35%)、一語雙關(30%)、人際關系(35%)問題進行分析發現,科技企業大模型中,商湯商量表現亮眼,百度文心一言、瀾舟科技Mchat、智譜AI-ChatGLM及360智腦均表現優良。

在工作效率提升方面,課題組重點在工具提效(50%)和生成創新(50%)方面進行考量。結果顯示,訊飛星火表現最為搶眼,百度文心一言、商湯商量、智譜AI-ChatGLM表現優良。不過,盡管AI具有高速度和高效率的優勢,但在某些復雜和具有創新性的任務中,人類的智慧和想象力仍然具有無法替代的作用。

在不同領域中,AI和人類表現出不同的優劣勢,但在整體上,AI大模型的發展為人類工作和生活的提質增效帶來了重要的積極影響,大模型正在加速走進生活、走進產業。在本次體驗測評基礎上,研究團隊將繼續深耕,加強在大模型安全可解釋性、工作提效能力、實際落地情況、產業優秀案例等維度上的探索與研究。


8c6e799a-3fb7-11ee-ac96-dac502259ad0.jpg

8c96aa82-3fb7-11ee-ac96-dac502259ad0.jpg

8cb26e98-3fb7-11ee-ac96-dac502259ad0.jpg

8cc9a55e-3fb7-11ee-ac96-dac502259ad0.jpg

8cee04e4-3fb7-11ee-ac96-dac502259ad0.jpg

8d38e482-3fb7-11ee-ac96-dac502259ad0.jpg

8d5ead5c-3fb7-11ee-ac96-dac502259ad0.jpg

8da5e230-3fb7-11ee-ac96-dac502259ad0.jpg

8dce081e-3fb7-11ee-ac96-dac502259ad0.jpg

8de89c24-3fb7-11ee-ac96-dac502259ad0.jpg

8e007768-3fb7-11ee-ac96-dac502259ad0.jpg

8e2299f6-3fb7-11ee-ac96-dac502259ad0.jpg

8e5c568c-3fb7-11ee-ac96-dac502259ad0.jpg

8e7e38d8-3fb7-11ee-ac96-dac502259ad0.jpg

8eae686e-3fb7-11ee-ac96-dac502259ad0.jpg

8ee20034-3fb7-11ee-ac96-dac502259ad0.jpg

8f073304-3fb7-11ee-ac96-dac502259ad0.jpg

8f266f8a-3fb7-11ee-ac96-dac502259ad0.jpg

8f4c71bc-3fb7-11ee-ac96-dac502259ad0.jpg

8f8e1482-3fb7-11ee-ac96-dac502259ad0.jpg

8fb0075e-3fb7-11ee-ac96-dac502259ad0.jpg

8fe6b218-3fb7-11ee-ac96-dac502259ad0.jpg

901e1cc6-3fb7-11ee-ac96-dac502259ad0.jpg

90417d24-3fb7-11ee-ac96-dac502259ad0.jpg

9072bea2-3fb7-11ee-ac96-dac502259ad0.jpg

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    30239

    瀏覽量

    268478
  • 人工智能
    +關注

    關注

    1791

    文章

    46896

    瀏覽量

    237670
  • 大模型
    +關注

    關注

    2

    文章

    2339

    瀏覽量

    2500

原文標題:國內8種大模型體驗測評報告(2023)

文章出處:【微信號:AI_Architect,微信公眾號:智能計算芯世界】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    商湯日日新·商量大模型位列國內模型第一梯隊

    剛剛,中文大模型測評基準SuperCLUE發布《中文大模型基準測評2024年10月報告》。
    的頭像 發表于 11-08 15:38 ?259次閱讀

    高通發布《2023高通中國企業責任報告

    不久前,高通公司發布《2023高通中國企業責任報告》,這是高通連續第九年發布其中國區企業責任報告。此份報告介紹了高通如何通過賦能數字化轉型、負責任地經營以及可持續地運營這三個戰略重點領
    的頭像 發表于 11-08 11:18 ?303次閱讀

    中興通訊發布2023年可持續發展報告

    近日,中興通訊發布2023年度可持續發展報告報告全面展現了2023年中興通訊秉承“數字經濟筑路者”的生態定位,在綠色創新、社會貢獻、企業治理等領域的戰略布局、實施舉措和進展成果。自2
    的頭像 發表于 09-14 14:33 ?1359次閱讀

    云知聲山海大模型位居全球大模型第一梯隊

    SuperCLUE發布《中文大模型基準測評2024上半年報告》,報告選取國內外有代表性的33個大模型
    的頭像 發表于 09-12 14:41 ?570次閱讀

    【附實操視頻】聆思CSK6大模型開發板接入國內主流大模型(星火大模型、文心一言、豆包、kimi、智譜glm、通義千問)

    本帖最后由 jf_40317719 于 2024-8-22 10:15 編輯 多模態交互離不開硬件載體,近期有不少開發者在研究聆思CSK6大模型開發板除了使用出廠示例自帶的星火大模型,能不能
    發表于 08-22 10:12

    中文大模型測評基準SuperCLUE:商湯日日新5.0,刷新國內最好成績

    日前,中文大模型測評基準SuperCLUE發布最新榜單,對商湯科技全新升級「日日新SenseNova 5.0」大模型進行了全方位綜合性測評,結果顯示在SuperCLUE綜合基準上,日日
    的頭像 發表于 05-21 14:45 ?700次閱讀
    中文大<b class='flag-5'>模型</b><b class='flag-5'>測評</b>基準SuperCLUE:商湯日日新5.0,刷新<b class='flag-5'>國內</b>最好成績

    ChatGPT、Gemini、通義千問等一眾大語言模型,哪家更適合您?

    ]?就以“ChatGPT、Gemini、通義千問等一眾大語言模型,哪家更適合您”這樣的主題,開展了一次深度的大語言模型測評。開放夜現場測評了十幾個
    的頭像 發表于 05-14 17:35 ?603次閱讀

    2023年光伏行業發展回顧報告

    電子發燒友網站提供《2023年光伏行業發展回顧報告.pdf》資料免費下載
    發表于 04-30 11:32 ?51次下載

    2023 “IBM 影響力”報告

    4月 11日,IBM 發布 2023年“IBM 影響力”報告。該報告總結了公司 2023年在環境、社會和治理 (ESG) 方面實施的舉措、合作伙伴以及投資情況,以便持續推進構建更加可持
    的頭像 發表于 04-21 09:36 ?584次閱讀

    理想汽車發布2023年ESG報告

    2024年4月12日,理想汽車發布《2023年環境、社會及管治報告》(簡稱“ESG報告”),從“合規經營 責任管理”“創新先行 卓越產品”“包容關愛 共同成長”“低碳運營 綠色理想”“同心協力 溫暖
    的頭像 發表于 04-14 10:22 ?1273次閱讀

    芯原股份正式發布《2023年社會責任報告

    芯原股份正式發布《2023年社會責任報告》,敘述了芯原2023年在追求經營績效的同時,積極踐行社會責任的工作成果,主動回應利益相關方及社會各界的關注重點。
    的頭像 發表于 04-01 09:32 ?458次閱讀
    芯原股份正式發布《<b class='flag-5'>2023</b>年社會責任<b class='flag-5'>報告</b>》

    名單公布!【書籍評測活動NO.30】大規模語言模型:從理論到實踐

    2023年10月,國產大模型玩家就有近200家,國內AI大模型如雨后春筍般涌現,一時間形成了百家爭鳴、百花齊放的發展態勢。 “大模型”當之無
    發表于 03-11 15:16

    佐思汽研發布《2023-2024年汽車AI大模型技術和應用趨勢報告

    2023年以來,越來越多車型開始接入大模型,越來越多Tier1推出汽車大模型解決方案。
    的頭像 發表于 02-28 14:21 ?3113次閱讀
    佐思汽研發布《<b class='flag-5'>2023</b>-2024年汽車AI大<b class='flag-5'>模型</b>技術和應用趨勢<b class='flag-5'>報告</b>》

    OpenHarmony社區運營報告2023年12月)

    。 ? 2023 年 12 月新增 19 款產品通過兼容性測評,累計 467 款產品通過兼容性測評。 一、代碼貢獻 1、2023 年度,累計新增 1615 萬行代碼;華為貢獻 89%,
    發表于 01-10 15:44

    中文大模型基準測評2023年度報告

    國內學術和產業界在過去一年也有了實質性的突破。大致可以分為三個階段,即準備期(ChatGPT發布后國內產學研迅速形成大模型共識)、成長期(國內模型
    的頭像 發表于 01-02 16:24 ?910次閱讀
    中文大<b class='flag-5'>模型</b>基準<b class='flag-5'>測評</b><b class='flag-5'>2023</b>年度<b class='flag-5'>報告</b>