精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

160億參數(shù),新增多項能力,復(fù)旦MOSS開源了

3D視覺工坊 ? 來源:機器之心 ? 2023-04-27 15:51 ? 次閱讀

今年 2 月份,機器之心報道了復(fù)旦大學推出中國版 ChatGPT 的消息,引起了廣泛關(guān)注。當時,邱錫鵬教授就曾表示將于四月份開源 Moss。

昨天,開源版的 Moss 真的來了。

項目地址:https://github.com/OpenLMLab/MOSS

MOSS 是一個支持中英雙語和多種插件的開源對話語言模型,但參數(shù)數(shù)量比 ChatGPT 少得多。在 v0.0.2 之后,團隊持續(xù)對其進行調(diào)整,推出了 MOSS v0.0.3,也就是目前開源的版本。相比于早期版本,功能也實現(xiàn)了多項更新。

最初的測試中,MOSS 的基礎(chǔ)功能與 ChatGPT 類似,可以按照用戶輸入的指令完成各類自然語言處理任務(wù),包括文本生成、文本摘要、翻譯、代碼生成、閑聊等等。

開放內(nèi)測后,團隊繼續(xù)加大中文語料的預(yù)訓練:「截止目前,MOSS 003 的基座語言模型已經(jīng)在 100B 中文 token 上進行了訓練,總訓練 token 數(shù)量達到 700B,其中還包含約 300B 代碼。」

在開放內(nèi)測后,我們也收集了一些用戶數(shù)據(jù),我們發(fā)現(xiàn)真實中文世界的用戶意圖和 OpenAI InstructGPT 論文中披露的 user prompt 分布有較大差異(這不僅與用戶來自的國家差異有關(guān),也跟產(chǎn)品上線時間有關(guān),早期產(chǎn)品采集的數(shù)據(jù)中存在大量對抗性和測試性輸入),于是我們以這部分真實數(shù)據(jù)作為 seed 重新生成了約 110 萬常規(guī)對話數(shù)據(jù),涵蓋更細粒度的 helpfulness 數(shù)據(jù)和更廣泛的 harmlessness 數(shù)據(jù)。

內(nèi)容來源:https://www.zhihu.com/question/596908242/answer/2994534005

目前,團隊已將 moss-moon-003-base、moss-moon-003-sft、moss-moon-003-sft-plugin 三個模型上傳到 HuggingFace。后續(xù),還有三個模型將會開源。

0ea0e28e-e4ca-11ed-ab56-dac502259ad0.png

根據(jù)項目主頁介紹,moss-moon 系列模型具有 160 億參數(shù),在 FP16 精度下可在單張 A100/A800 或兩張 3090 顯卡運行,在 INT4/8 精度下可在單張 3090 顯卡運行。

團隊同時表示,由于模型參數(shù)量較小和自回歸生成范式,MOSS 仍然可能生成包含事實性錯誤的誤導(dǎo)性回復(fù)或包含偏見 / 歧視的有害內(nèi)容,請謹慎鑒別和使用 MOSS 生成的內(nèi)容,請勿將 MOSS 生成的有害內(nèi)容傳播至互聯(lián)網(wǎng)。

新增能力

在 MOSS v0.0.3 中,團隊加入了多項新能力。

團隊構(gòu)造了約 30 萬插件增強的對話數(shù)據(jù),包含搜索引擎、文生圖、計算器、方程求解等。關(guān)于插件版 MOSS 如何使用,后續(xù)團隊將在 GitHub 公布。

0eacf600-e4ca-11ed-ab56-dac502259ad0.png

MOSS v0.0.3 現(xiàn)已引入使用多種插件的能力。

下圖展示了調(diào)用搜索引擎的能力:

0eb1dee0-e4ca-11ed-ab56-dac502259ad0.png

下圖展示了調(diào)用方程求解器的能力:

0eba72d0-e4ca-11ed-ab56-dac502259ad0.png

下圖展示了從文本生成圖片的能力:

0ec1c2ce-e4ca-11ed-ab56-dac502259ad0.png

項目作者孫天祥補充說,MOSS 003 支持啟用插件的能力是通過 meta instruction 來控制,類似 gpt-3.5-turbo 里的 system prompt。「因為是模型控制的,所以并不能保證 100% 控制率,以及還存在一些多選插件時調(diào)用不準、插件互相打架的缺陷,我們正在盡快開發(fā)新的模型來緩解這些問題。」

下載安裝

下載本倉庫內(nèi)容至本地 / 遠程服務(wù)器:

git clone https://github.com/OpenLMLab/MOSS.gitcd MOSS

創(chuàng)建 conda 環(huán)境:

conda create --name moss python=3.8 conda activate moss

安裝依賴:

pip install -r requirements.txt

其中 torch 和 transformers 版本不建議低于推薦版本。

根據(jù)協(xié)議,開源的 MOSS 可用于商業(yè)用途:

0ed45e98-e4ca-11ed-ab56-dac502259ad0.png

此外,開發(fā)者也可通過 API 調(diào)用 MOSS 服務(wù),團隊將根據(jù)當前服務(wù)壓力考慮通過 API 接口形式提供服務(wù),接口格式可參考:https://github.com/OpenLMLab/MOSS/blob/main/moss_api.pdf

目前,已有開發(fā)者根據(jù)開源內(nèi)容進行而創(chuàng),比如通過 VideoChat 進行視頻問答

VideoChat 是一款多功能視頻問答工具,結(jié)合了動作識別、視覺字幕和 StableLM 的功能。該工具可為視頻中的任何對象和動作生成密集的描述性字幕,提供一系列語言風格以滿足不同的用戶偏好。它支持用戶進行不同長度、情緒、語言真實性的對話。

0edbf838-e4ca-11ed-ab56-dac502259ad0.png

項目地址:https://github.com/OpenGVLab/Ask-Anything/tree/main/video_chat_with_MOSS

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 開源
    +關(guān)注

    關(guān)注

    3

    文章

    3256

    瀏覽量

    42420
  • 語言模型
    +關(guān)注

    關(guān)注

    0

    文章

    508

    瀏覽量

    10247
  • ChatGPT
    +關(guān)注

    關(guān)注

    29

    文章

    1549

    瀏覽量

    7507

原文標題:160億參數(shù),新增多項能力,復(fù)旦MOSS開源了

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    AMD發(fā)布10參數(shù)開源AI模型OLMo

    AMD公司近日宣布一項重大進展,推出了首個完全開放的10參數(shù)語言模型系列——AMD OLMo。這一舉措為開發(fā)者和研究人員提供強大的AI研究工具,有助于推動AI技術(shù)的進一步發(fā)展。
    的頭像 發(fā)表于 11-12 18:08 ?396次閱讀

    云知聲山海大模型多項能力全球領(lǐng)跑

    國內(nèi)人工智能權(quán)威機構(gòu)清華大學基礎(chǔ)模型研究中心發(fā)布SuperBench九月綜合榜單。本次評測選取海內(nèi)外24個具有代表性的大模型,結(jié)果顯示,山海大模型對齊、智能體、安全等多項能力全球領(lǐng)跑。
    的頭像 發(fā)表于 10-12 14:30 ?370次閱讀
    云知聲山海大模型<b class='flag-5'>多項</b><b class='flag-5'>能力</b>全球領(lǐng)跑

    開放原子開源基金會五月新增捐贈人

    2024年5月,新增以下單位成為開放原子開源基金會及旗下項目捐贈人。
    的頭像 發(fā)表于 09-24 10:48 ?628次閱讀

    緯鋰能發(fā)布的開源電池,循環(huán)壽命超過7000次

    緯鋰能發(fā)布的“開源電池”具備3C超快充電速度,15分鐘可從20%快充至80%SOC,比能量大于160Wh/kg,循環(huán)壽命超過7000次。
    的頭像 發(fā)表于 05-19 11:25 ?1688次閱讀

    通義千問推出1100參數(shù)開源模型

    通義千問近日震撼發(fā)布1100參數(shù)開源模型Qwen1.5-110B,這一舉措標志著通義千問在AI領(lǐng)域邁出了重大步伐。該模型成為通義千問全系列首個千億級參數(shù)
    的頭像 發(fā)表于 05-06 10:49 ?560次閱讀

    微信WCDB最新開源版本發(fā)布,優(yōu)化數(shù)據(jù)庫接口及核心邏輯,新增多項功能

    如今,微信已經(jīng)發(fā)布此項重大技術(shù)升級的新版本 WCDB,以及其更為豐富的開發(fā)語言支持,如新增 C++以及對 Java 和 Kotlin 語言的 ORM 提供完整支援,覆蓋越發(fā)廣泛的終端平臺;更強大的 SQL 表達能力,通過對 Winq 的重新書寫和強化體現(xiàn)出來;
    的頭像 發(fā)表于 04-09 15:59 ?615次閱讀

    阿維塔12發(fā)布3.2.0版本更新,新增多項功能并優(yōu)化細節(jié)

    特殊車道智能通行功能:城市和鄉(xiāng)村的智駕領(lǐng)航輔助(NCA)和車道巡航輔助(LCC)均新增此功能,支持通過潮汐車道、公交車道控制桿進入NCA模式,并實現(xiàn)自動駛出的操作。
    的頭像 發(fā)表于 03-28 14:27 ?554次閱讀

    聯(lián)發(fā)科天璣9300搭載通義千問大模型,阿里云提供解決方案

    通義千問大模型已開源多項版本,包括18、70、140及720
    的頭像 發(fā)表于 03-28 09:55 ?537次閱讀

    OBS Studio 30.1發(fā)布,新增多元功能,優(yōu)化HDR色調(diào)映射濾鏡

    在圖像功能方面,HDR Tone Mapping 濾鏡新增用于 SDR 的 maxRGB 色調(diào)映射器,Image Slideshow 可異步加載文件,自動裁剪至邊界框添新選項。流媒體與錄制過程中的 GPU 重采樣設(shè)置亦得到簡化。
    的頭像 發(fā)表于 03-14 14:53 ?1117次閱讀

    全球行業(yè)首次!北醒通過多項DO-160G認證測試

    近日,北醒新一代航空器用激光雷達產(chǎn)品通過多項DO-160G航空機載設(shè)備環(huán)境標準測試。作為全球首個參與DO-160G認證的激光雷達公司,這一系列測試的通過標志著北醒在安全飛行領(lǐng)域上達到了國際領(lǐng)先水平
    的頭像 發(fā)表于 03-06 16:44 ?316次閱讀

    東威科技PCB業(yè)務(wù)今年1-2月新增訂單已過

    東威科技近期于機構(gòu)調(diào)研時表示,公司比較看好2024年P(guān)CB業(yè)務(wù),今年1—2月新增訂單已過
    的頭像 發(fā)表于 03-04 14:33 ?522次閱讀

    北醒新一代激光雷達產(chǎn)品通過多項DO-160G航空機載設(shè)備環(huán)境標準測試

    近日,北醒新一代航空器用激光雷達產(chǎn)品通過多項DO-160G航空機載設(shè)備環(huán)境標準測試。
    的頭像 發(fā)表于 02-28 14:57 ?499次閱讀

    華為新增多項芯片制造設(shè)備及方法專利

    據(jù)這份專利陳述,其主題是關(guān)于晶圓處理設(shè)備及其操作方式。該設(shè)備包含晶圓載臺,其可沿旋轉(zhuǎn)軸線上進行轉(zhuǎn)動;還有機械臂,其設(shè)有抓取晶圓的手部;此外還有一個控制器;
    的頭像 發(fā)表于 12-14 14:19 ?599次閱讀

    復(fù)旦科創(chuàng)母基金啟動,首期規(guī)模10

    據(jù)復(fù)旦大學消息,復(fù)旦科創(chuàng)母基金將注重長期,推動創(chuàng)新突破,以國家重點領(lǐng)域和上海重點產(chǎn)業(yè)戰(zhàn)略部署為牽引,聚焦集成電路,人工智能,生物醫(yī)藥,新材料等關(guān)鍵“卡脖子”領(lǐng)域。健全機制,集聚創(chuàng)新資源,充分發(fā)揮戰(zhàn)略科委決策功能
    的頭像 發(fā)表于 12-05 10:30 ?505次閱讀

    阿里云通義千問720參數(shù)模型宣布開源

    12月1日,阿里云通義千問720參數(shù)模型Qwen-72B宣布開源。與此同時,他們還開源18
    的頭像 發(fā)表于 12-01 17:08 ?1326次閱讀