精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

訊飛星辰MaaS平臺完成全新升級

訊飛開放平臺 ? 來源:訊飛開放平臺 ? 2024-11-22 10:38 ? 次閱讀

高質(zhì)量數(shù)據(jù)的助攻,讓微調(diào)大模型青出于藍而勝于藍!

海量數(shù)據(jù)的預訓練,讓通用大模型擁有十八般武藝,幾乎能夠輕松應對所有問題。但面向特定行業(yè)與場景,模型效果卻難以讓人滿意,問題同樣也是數(shù)據(jù)。

通過將特定數(shù)據(jù)“投喂”給通用大模型,在保持“通才”優(yōu)勢的基礎上,微調(diào)大模型輕松兼容行業(yè)“專才”的優(yōu)勢,指哪打哪。但訓練專屬大模型,看似簡單,背后需要從數(shù)據(jù)、算力到微調(diào)工具等一系列支撐。 訊飛星辰MaaS平臺已匯集訊飛星火、Llama3、SD-XL等20+行業(yè)內(nèi)知名的優(yōu)質(zhì)模型,無需復雜調(diào)整或重新訓練,甚至零代碼也可能完成微調(diào)。 圍繞數(shù)據(jù)管理、模型微調(diào)、評估、托管、推理服務,訊飛星辰MaaS平臺提供了完善大模型全生命周期管理,覆蓋內(nèi)容創(chuàng)作、代碼、邏輯推理等多場景。近期,模型與數(shù)據(jù)集豐富度,以及功能特性再次完成全新升級。

微調(diào)模型更豐富:支持星火系列大模型及多個優(yōu)質(zhì)開源大模型

數(shù)據(jù)集構建更輕松:基本支持行業(yè)主流數(shù)據(jù)集,可實現(xiàn)數(shù)據(jù)批量處理

微調(diào)體驗顯著提升:提供靈活可用的全棧工具鏈,讓大模型效果符合預期

01豐富模型,滿足多樣業(yè)務場景

訊飛星辰MaaS平臺已匯集星火、Llama3等行業(yè)優(yōu)質(zhì)模型,讓每一個場景需求都能找到合適的模型搭子。本次升級,新加入了Spark Max、Spark Mini、Spark Tiny等星火自研模型,讓模型“隊伍”再次壯大。

Spark Max適用于對內(nèi)容質(zhì)量和知識專業(yè)性要求高的業(yè)務場景,如高端內(nèi)容創(chuàng)作、專業(yè)知識服務等。Spark Tiny的部署和精調(diào)成本在星火系列模型中最具性價比,在對成本較為敏感但又需要一定性能支持的場景表現(xiàn)良好,比如小型創(chuàng)業(yè)公司的在線客服系統(tǒng),能在滿足性能需求的同時節(jié)省成本。

同時,平臺還引入了書生系列、Qwen2.5系列等多個開源模型的精調(diào),給開發(fā)者提供更多選擇。

模型學習如何在特定任務中做出正確的判斷?首發(fā)文本分類的bert模型,可以分析文本特征后進行分類,將數(shù)據(jù)提供給bert模型進行微調(diào)后的分類器效果非常精準,而且能夠直接在Spark API中進行應用。

02夯實數(shù)據(jù)工程,提效加速更易用

數(shù)據(jù)量的大小和質(zhì)量高低是大模型產(chǎn)業(yè)發(fā)展的關鍵,也是決定大模型是「專家」或是「磚家」的一條分界線。大模型微調(diào)過程中,數(shù)據(jù)集就像老師教課時用的書和資料。這些書和資料里有很多例子和題目,可以幫助學生(也就是大模型)更好地學習和理解新知識。

通過選擇合適的數(shù)據(jù)集構建方法,并遵循關鍵步驟進行操作,可以顯著提升微調(diào)效果,使模型更好地適應新任務。但開發(fā)者在數(shù)據(jù)構建中很容易遇到不少難題:只有文本數(shù)據(jù)、無問答對數(shù)據(jù),數(shù)據(jù)量少,沒辦法判斷數(shù)據(jù)質(zhì)量、不知道如何優(yōu)化數(shù)據(jù)集、積累數(shù)據(jù)困難。

基于問答抽取、數(shù)據(jù)增強、prompt工程等維度出發(fā),訊飛星辰MaaS平臺構建了全方位的數(shù)據(jù)工程能力,幫助用戶輕松構建高質(zhì)量數(shù)據(jù)。以數(shù)據(jù)增強為例,支持常見文本生成、語義理解、知識問答數(shù)據(jù)泛化,擴展數(shù)據(jù)集數(shù)量;支持混合訓練(平臺自動添加數(shù)據(jù)集)。

大模型微調(diào)過程中,因為不同的任務需求、數(shù)據(jù)來源和處理方式會導致數(shù)據(jù)集的結(jié)構和內(nèi)容有所不同。不同的微調(diào)框架可能支持不同的數(shù)據(jù)集格式。

現(xiàn)在,訊飛星辰MaaS平臺的數(shù)據(jù)集格式擴充,已支持ShareGPT、Alpaca格式數(shù)據(jù)集,實現(xiàn)了對幾乎所有行業(yè)主流數(shù)據(jù)集格式的支持。無論你的數(shù)據(jù)集什么樣,在訊飛星辰MaaS平臺上都能訓。

如果你不想或者來不及準備測試集,也不用慌。訊飛星辰MaaS平臺支持從訓練集中拆分出一定比例,在訓練完成后,平臺會自動把拆出來的這部分數(shù)據(jù)拿去做驗證,就可以直觀的看到微調(diào)效果展示。

當我們有大量數(shù)據(jù)需要處理時,而不是一次只處理一條數(shù)據(jù),可以把很多數(shù)據(jù)一起“放”進模型中,讓模型一次處理多條數(shù)據(jù)。現(xiàn)在,訊飛星辰MaaS平臺最多支持10個模型同時在線批量推理,大大提高了數(shù)據(jù)處理的效率。

03擴展功能邊界,輔助創(chuàng)新更專業(yè)

選好了合適模型,數(shù)據(jù)準備好后,進入到具體的微調(diào)環(huán)節(jié),如何讓模型的功能更強大、效果符合預期?訊飛星辰MaaS平臺還提供了多種讓人驚喜的功能。

?兼容OpenAI協(xié)議,「絲滑」搬家國產(chǎn)大模型

今年6月,OpenAI 停止向中國大陸地區(qū)提供 API 服務,對于依賴 OpenAI API 構建產(chǎn)品和服務的企業(yè)來說,無疑是一次技術上的挑戰(zhàn)。然而國內(nèi)大模型已經(jīng)大幅縮小了與 OpenAI 的差距,可以滿足大部分日常的場景。10月24日發(fā)布的訊飛星火4.0 Turbo七項核心能力在中文領域已全面超過GPT-4 Turbo,代碼能力和數(shù)學能力超越GPT-4o。

方便開發(fā)者進行能力遷移,訊飛星辰MaaS平臺現(xiàn)已兼容OpenAI協(xié)議,用戶之前用OpenAI的能力,可以一鍵切換成星火的能力,實現(xiàn)「絲滑」搬家。

?支持function_call 精調(diào)訓練,高效調(diào)用獨立工具

由于大模型的訓練數(shù)據(jù)有時間期限,無法了解最近發(fā)生的事情。因此,當用戶詢問模型一些它不了解的數(shù)據(jù)信息時,模型本身就無法給出答案。此時,function_call 就像放大器一樣,通過調(diào)用外部工具,增強大語言模型的能力。

使用function_call,可以讓模型能夠理解什么時候需要調(diào)用函數(shù)、調(diào)用哪種函數(shù),以及如何正確地傳遞參數(shù)給函數(shù),從而增強模型在實際應用中的實用性,使其能夠更好地與外部工具或系統(tǒng)進行交互。

?支持Loss曲線展示和裁判員模型效果評估對比,模型效果隨時評估

大模型的調(diào)試評估不能等精調(diào)完再檢查,要在過程中就把握好。

訊飛星火系列模型已支持Loss曲線展示,在微調(diào)模態(tài)訓練過程中即可通過精細化的數(shù)據(jù)配比和動態(tài)調(diào)整,在提升目標領域能力的同時,最大限度避免災難性遺忘,保持模型的全面性能。

如果你選擇了多個大模型進行微調(diào)訓練,不知道最終該用哪一個。訊飛星辰MaaS平臺提供了裁判員打分模型,基于星火最優(yōu)模型提供的評估報告,評判模型效果的好壞。

面向?qū)I(yè)開發(fā)者的更多需求,訊飛星辰MaaS平臺還支持部分高級參數(shù),支持分詞長度、Lora Merge,UnSloth等特性配置。

訊飛星辰MaaS平臺之外,訊飛星火還構建了豐富且高性價比API矩陣。目前,Spark Pro版本每百萬token僅需5元,并支持128K上下文;Ultra和Max 均提供Batch版本 API。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 開源
    +關注

    關注

    3

    文章

    3245

    瀏覽量

    42396
  • 訊飛開放平臺

    關注

    0

    文章

    12

    瀏覽量

    11533
  • 大模型
    +關注

    關注

    2

    文章

    2322

    瀏覽量

    2479

原文標題:大模型人人皆可“煉”,訊飛星辰MaaS平臺精調(diào)門檻再降低

文章出處:【微信號:訊飛開放平臺,微信公眾號:訊飛開放平臺】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    科大發(fā)布星火4.0 Turbo大模型及星火多語言大模型

    近日,科大正式推出了其最新研發(fā)成果——星火4.0 Turbo大模型。這一發(fā)布不僅標志著科大飛在人工智能領域的又一次重大突破,也預示
    的頭像 發(fā)表于 10-24 13:58 ?320次閱讀

    科大發(fā)布星火4.0 Turbo:七大能力超GPT-4 Turbo

    10月24日,在科大全球1024開發(fā)者節(jié)上,科大董事長劉慶峰正式發(fā)布了星火大模型的最
    的頭像 發(fā)表于 10-24 11:39 ?378次閱讀

    星火大模型V4.0正式發(fā)布

    日前,星火V4.0正式發(fā)布,升級成為更懂你的AI助手!星火4.0 API同步上線,Ultra版本首次公開發(fā)布!
    的頭像 發(fā)表于 10-14 10:06 ?766次閱讀

    科大星火APP/Desk全新升級

    星火V4.0 如期而至,升級成為更懂你的AI助手。
    的頭像 發(fā)表于 09-14 14:41 ?2049次閱讀

    科大AI學習機暑期重磅升級

    。得益于這些大獎AI技術的支撐,科大AI學習機自2019年問世以來,即持續(xù)引領行業(yè)發(fā)展,開創(chuàng)了個性化精準學這一革命性學習方式。 ? 6月27日,科大發(fā)布全面
    的頭像 發(fā)表于 07-08 09:38 ?576次閱讀

    科大發(fā)布星火大模型V4.0

    在科技創(chuàng)新的浪潮中,科大再度引領潮流,于北京隆重發(fā)布了星火大模型V4.0及其在多領域的人工智能應用。此次更新不僅標志著飛在人工智能
    的頭像 發(fā)表于 07-01 10:33 ?839次閱讀

    中國電信與昆侖萬維等聯(lián)合發(fā)布星辰MaaS平臺

    在近日于福州舉辦的第七屆數(shù)字中國建設峰會智算云生態(tài)大會高峰論壇上,中國電信攜手昆侖萬維等合作伙伴,共同推出了星辰MaaS平臺(Model as a Service,模型即服務)。該平臺
    的頭像 發(fā)表于 06-07 09:18 ?1003次閱讀

    星火長文本功能全新升級

    科大近日宣布,其首個長文本、長圖文、長語音大模型已完成全新升級。這一大模型不僅具備強大的學習能力,可以快速吸收海量文本、圖文資料以及會議錄音等多元化信息,更能在各行業(yè)場景中提供精準
    的頭像 發(fā)表于 05-06 11:22 ?522次閱讀

    科大華中總部已封頂 年內(nèi)交付使用

    科大華中總部已封頂 年內(nèi)交付使用 科大華中總部位于武漢經(jīng)開區(qū)車谷資本島,投資額50億;計劃建成科大
    的頭像 發(fā)表于 04-16 14:49 ?1463次閱讀

    云知聲AIGC內(nèi)容創(chuàng)作平臺藍藻AI全新升級

    近日,云知聲AIGC內(nèi)容創(chuàng)作平臺藍藻AI宣布完成全新升級,并推出超值會員服務,旨在為廣大創(chuàng)作者提供更豐富多元的聲音選擇,助力內(nèi)容創(chuàng)作更高效、更精彩。此次升級聚焦于AI聲音克隆和AI配音
    的頭像 發(fā)表于 03-16 14:05 ?1196次閱讀

    醫(yī)療遞交港股IPO申請

    近日,醫(yī)療AI解決方案提供商醫(yī)療正式向港交所遞交了IPO申請,其IPO備案資料已由證監(jiān)會接收??拼?b class='flag-5'>訊作為
    的頭像 發(fā)表于 03-05 13:49 ?747次閱讀

    科大子公司醫(yī)療正式申請港交所上市

    科大旗下控股子公司醫(yī)療已于1月26日正式向港交所遞交上市申請,計劃在香港主板上市。這是科大
    的頭像 發(fā)表于 02-04 13:57 ?1216次閱讀

    科大星火認知大模型V3.5發(fā)布

    近日,科大舉辦了星火認知大模型V3.5升級發(fā)布會。在發(fā)布會上,科大董事長劉慶峰和研究院院長劉聰共同宣布了基于首個全國產(chǎn)算力訓練的
    的頭像 發(fā)表于 01-31 17:28 ?1369次閱讀

    科大發(fā)布星火認知大模型V3.5

    科大近日發(fā)布了星火認知大模型V3.5版本,該版本基于全國產(chǎn)化算力底座“星一號”平臺進行訓練。與
    的頭像 發(fā)表于 01-31 14:40 ?838次閱讀

    軟通天璇MaaS平臺2.0與華為昇騰AI完成兼容性測試認證

    近日,軟通動力天璇MaaS平臺2.0與華為昇騰Atlas 800訓練服務器(型號:9000)、Atlas 800推理服務器(型號:3000)完成并通過相互兼容性測試認證。測試期間整體運行流暢穩(wěn)定,未來將為客戶業(yè)務國產(chǎn)化AI需求提
    的頭像 發(fā)表于 01-05 11:41 ?873次閱讀