精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

從M6到“通義千問”,阿里大模型的迭代之路

智能計算芯世界 ? 來源:智能計算芯世界 ? 2023-04-19 09:51 ? 次閱讀

阿里AI大模型“通義千問”于 2023 阿里云峰會重磅發布。基礎大模型的核心是能夠支撐各行各業,阿里希望能夠為客戶與合作伙伴提供面向千行百業的專屬大模型。 從 M6 項目到“通義千問”的發展之路。阿里 AI 大模型“通義千問”前身系阿里達摩院 M6 項目,阿里達摩院于 2020 年 6 月發布 3 億參數基礎模型,21 年 1 月模型參數規模達百億,同年 5 月達萬億參數,同年 10月達 10 萬億,成為全球首個 10 萬億參數多模態大模型,并落地應用于天貓虛擬主播等 40 多個細分場景。22年 9 月達摩院發布“通義”大模型系列,打造業界首個 AI 底座,且兼顧大小模型的層次化建構體系。

1 阿里大模型的迭代進階之路

項目啟動階段:M6 項目于 2020 年啟動,同年 6 月推出 3 億參數的基礎模型,2021年 1 月,模型參數規模達百億,成為世界最大的中文多模態模型。

萬億模型階段:2021 年 5 月,達摩院發布萬億參數模型 M6 并正式投入使用,追上谷歌發展腳步。M6 在多模態 GreenAI、文到圖生成、商業化領域并肩世界一流水平,與英偉達、谷歌相比,M6 僅用 480 卡 V100 32G GPU 就實現了萬億模型,節省算力資源超 80%,訓練效率提升近 11 倍。

十萬億模型階段:2021 年 10 月,M6 進一步升級成為全球首個 10 萬億參數的多模態大模型,并應用于天貓虛擬主播等 40 多個創造相關場景中;在綠色低碳方面,相比 GPT-3,M6 實現了同等參數規模下,能耗僅為 1%。

大模型階段:2022 年 9 月,達摩院發布“通義”大模型系列,打造業界首個 AI 統一底座,并構建了大小模型協同的層次化人工智能體系,其中,統一底座 M6-OFA 模型在不引入新增結構情況下,可同時處理 10 余項單模態和跨模態任務,通義大模型的出現將為 AI 從感知智能邁向知識驅動的認知智能提供先進基礎設施。

63879810-de35-11ed-bfe3-dac502259ad0.png

2 阿里達摩院年度科技趨勢:阿里對 AI 大模型高度重視 達摩院每年都會發布對當年的十大科技趨勢預測,在最近兩年的科技趨勢預測中,充分體現阿里對 AI 技術及大模型的重視:

2022 年,達摩院在十大科技趨勢中提到多項 AI 相關內容,包括 AI for Science(將AI 應用于高技術領域科學研究)、大小模型協同進化、綠色能源 AI(基于 AI 算力對資源消耗嚴重的現實,從降本增效角度提出了綠色能源 AI 新概念)等。

2023 年,達摩院在十大科技趨勢中,將多模態預訓練大模型放在首位,足以顯現其對大模型的重視。CLIP 和 BEiT-3 等多模態模型實現技術突破,多模態融合的通用人工智能成為未來發展趨勢。多模態預訓練的發展將重塑人工智能商業模式。多模態統一建模,目的增強模型的跨模態語義對齊能力,打通各模態之間的關系,促使模型逐步標準化。基于多領域知識,構建統一的、跨場景、多任務的多模態基礎模型將成為未來人工智能的重點發展方向。

63a27a40-de35-11ed-bfe3-dac502259ad0.png

通用模型層主要包含通義-M6、通義-AliceMind、通義-視覺三種通用模型。1)通義-M6 是國際首個參數規模達到 10 萬億的全球最大預訓練模型。2)通義-AliceMind作為開源深度語言模型體系,形成了從文本 PLUG 到多模態 mPLUG 再到模塊化統一模型演化趨勢。3)通義-視覺可在電商行業實現圖像搜索和萬物識別等場景應用,并在文生圖以及交通和自動駕駛領域發揮作用。

63c98cfc-de35-11ed-bfe3-dac502259ad0.png

3 統一技術底座-三位一體:M6-OFA 為通義大模型底座,實現架構、模態、任務三方面統一 通義大模型在國內率先構建 AI 統一底座,在業界首次實現模態表示、任務表示、模型結構的統一,統一學習范式 OFA 是通義大模型背后的核心技術支撐。 架構統一:M6-OFA 采用了 Transformer Encoder-Decoder + ResNet Blocks 架構,ResNet Blocks 用于提取圖像特征,Transformer Encoder 負責多模態特征的交互,Transformer Decoder 采用自回歸方式輸出結果。無需增加任何任務特定的模型層,即可實現預訓練與微調的相同學習模式。 模態統一:M6-OFA 構建了一個涵蓋不同模態的通用詞表,以便模型使用該詞表表示不同任務的輸出結果。其中 BPE 編碼的自然語言 token 用于表示文本類任務或圖文類任務的數據;圖片中連續的橫縱坐標編碼為離散化 token,用于表示視覺定位、物體檢測的數據;圖片中的像素點信息編碼為離散化 token,用于表示圖片生成、圖片補全等任務的數據。 任務統一:通過設計不同的 instruction,M6-OFA 將涉及多模態和單模態(即 NLP 和CV)的所有任務都統一建模成序列到序列(seq2seq)任務。M6-OFA 覆蓋了 5 項多模態任務,視覺定位、定位字幕、圖文匹配、圖像字幕和視覺問答;2 項視覺任務,檢測和圖像填補和 1 項文本任務,即文本填補。

63e085e2-de35-11ed-bfe3-dac502259ad0.png

4 通用模型層-通義視覺大模型 通義-視覺大模型自下往上分為了底層統一算法架構、中層通用算法和上層產業應用。在應用層面,通義-視覺大模型可以在電商行業實現圖像搜索和萬物識別等場景應用,并在文生圖以及交通和自動駕駛領域發揮作用。

640be4f8-de35-11ed-bfe3-dac502259ad0.png

阿里大模型賦能天貓精靈有望承擔智能家居生態入口角色。結合真格基金 7 項針對大模型的測試題與答復,阿里大模型天貓精靈壓縮版的成績為 4.5/2.5,表現優于文心一言(1/6)和 GPT3.5(4/3),遜于 GPT4.0(7/0)。可見在簡單的邏輯推理和垂直能力領域,阿里大模型壓縮版已初步具備與 ChatGPT 與文心一言一較高下的實力。

6427ba52-de35-11ed-bfe3-dac502259ad0.png

644757d6-de35-11ed-bfe3-dac502259ad0.png

通義千問賦能天貓精靈有望成為智能居家生態入口的不二選擇。阿里大模型通義千問有望賦能旗下智能音箱天貓精靈打造居家場景智能生態入口,與螢石網絡等智能家居廠商優勢互補,通過“人機自然交互、信息上傳云端,聯動控制反饋”的機制,開展智能家居生態共建。

645de73a-de35-11ed-bfe3-dac502259ad0.png

647c9df6-de35-11ed-bfe3-dac502259ad0.png

阿里大模型“通義千問”有望基于其升級版天貓精靈(智能居家入口)、淘寶(智能電商入口)、釘釘(智能辦公入口)、高德地圖(智能汽車入口)等,協同合作廠商共建阿里系生態,借助多項生態入口打造覆蓋“衣食住行工”的全域智能生態場景。目前,發布會已披露三大場景:智能居家:通義千問×智能家居(天貓精靈等),有望成為具備個性化故事生成、個性化歌單推薦、個性化菜譜生成等功能的智能生活助理。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    30155

    瀏覽量

    268426
  • 模型
    +關注

    關注

    1

    文章

    3173

    瀏覽量

    48715
  • 阿里達摩院
    +關注

    關注

    0

    文章

    29

    瀏覽量

    3322

原文標題:從M6到“通義千問”,阿里大模型的迭代之路

文章出處:【微信號:AI_Architect,微信公眾號:智能計算芯世界】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    阿里通義代碼模型全系列開源

    近日,阿里通義模型團隊宣布了一項重大決策:將通義代碼
    的頭像 發表于 11-14 15:26 ?210次閱讀

    通義三款主力模型再降價

    阿里云百煉平臺再次掀起降價風暴,三款通義主力模型——Qwen-Turbo、Qwen-Plus及Qwen-Max,繼5月首次大幅度降價后,
    的頭像 發表于 09-20 16:46 ?822次閱讀

    【附實操視頻】聆思CSK6模型開發板接入國內主流大模型(星火大模型、文心一言、豆包、kimi、智譜glm、通義

    接入文心一言、通義、豆包、智譜glm、kimi等國內的大模型,但由于各家接口和數據格式不一樣,調試驗證會浪費很多時間。因此本篇以聆思CSK6
    發表于 08-22 10:12

    智能硬件接入主流大模型做語音交互(附文心一言、豆包、kimi、智譜glm、通義示例)

    接入文心一言、通義、豆包、智譜glm、kimi等國內的大模型,這個是必須可以的。但由于各家接口和數據格式不一樣,有些朋友直接參考chatgpt的方式沒有走通,因此本篇以聆思CSK
    發表于 08-21 19:13

    阿里通義Qwen2大模型發布并同步開源

    阿里巴巴集團旗下的通義團隊宣布,全新的Qwen2大模型正式發布,并在全球知名的開源平臺Hugging Face和ModelScope上同
    的頭像 發表于 06-11 15:33 ?1043次閱讀

    阿里通義Qwen2大模型發布

    阿里巴巴最近發布了其通義系列的新成員——Qwen2大模型,并在Hugging Face和ModelScope兩大平臺上實現了同步開源。這
    的頭像 發表于 06-07 15:59 ?734次閱讀

    阿里云正式發布通義2.5,中文性能全面趕超GPT-4 Turbo

    通義模型發布一周年之際,阿里云邁出了歷史性的一步。近日,阿里云正式發布通義
    的頭像 發表于 05-13 11:16 ?928次閱讀

    阿里云發布通義2.5

    阿里云近日正式發布了通義2.5,標志著其人工智能技術在中文語境下取得了重要突破。據阿里云智能集團首席技術官周靖人介紹,
    的頭像 發表于 05-10 09:57 ?495次閱讀

    阿里云發布通義2.5大模型,多項能力超越GPT-4

    阿里云隆重推出了通義 2.5 版,宣稱其“技術進步,全面超越GPT-4”,尤其是在中文環境中的多種任務(如文本理解、文本生成、知識問答及生活建議、臨時聊天及對話以及安全風險評估)方
    的頭像 發表于 05-09 14:17 ?919次閱讀

    通義開源千億級參數模型

    通義近日開源了其首個千億級參數模型Qwen1.5-110B,這是其全系列中首個達到千億級別的開源模型。Qwen1.5-110B
    的頭像 發表于 05-08 11:01 ?705次閱讀

    通義推出1100億參數開源模型

    通義近日震撼發布1100億參數的開源模型Qwen1.5-110B,這一舉措標志著通義
    的頭像 發表于 05-06 10:49 ?556次閱讀

    聯發科天璣9300等旗艦芯片搭載通義模型,成功實現

    通義模型可在離線環境下輕松應對多輪AI對話。此外,阿里云也承諾與聯發科進行深度合作,為全球手機制造商提供端側大
    的頭像 發表于 03-28 16:35 ?766次閱讀

    聯發科天璣9300搭載通義模型阿里云提供解決方案

    通義模型已開源多項版本,包括18億、70億、140億及720億參數等版本伴隨視覺、音頻多模態能力提升。阿里云于去年10月發布的
    的頭像 發表于 03-28 09:55 ?532次閱讀

    阿里通義重磅升級,免費開放1000萬字長文檔處理功能

    近日,阿里巴巴旗下的人工智能應用通義迎來重磅升級,宣布向所有人免費開放1000萬字的長文檔處理功能,這一創新舉措使得通義
    的頭像 發表于 03-26 11:09 ?748次閱讀

    阿里通義720億參數模型宣布開源

    12月1日,阿里通義720億參數模型Qwen-72B宣布開源。與此同時,他們還開源了18億參數模型
    的頭像 發表于 12-01 17:08 ?1320次閱讀