精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

傳音AI技術部在ASRU 2023 MADASR低資源語音識別比賽斬獲多項佳績

傳音控股 ? 來源:傳音控股 ? 2023-12-21 16:33 ? 次閱讀

國際頂級語音會議ASRU 2023(IEEE Workshop on Automatic Speech Recognition and Understanding,簡稱ASRU)于12月16日-20日順利舉辦。傳音AI技術部在ASRU 2023 MADASR(Model ADaptation for ASR in low-resource Indian languages,簡稱MADASR)關于孟加拉語和博杰普爾語的低資源語音識別比賽中斬獲多項佳績,在受限和非受限的4個賽道、2個語種與WER、CER 2個評價指標共16個細分子賽道上獲得2個第一名、6個第二名和5個第三名。

ASRU研討會是語音與語言處理學術圈的頂級會議,由IEEE語音和語言處理技術委員會主辦,每兩年舉行一次,歷史悠久,影響廣泛。此次MADASR比賽是ASRU 2023的重要賽事,由IBM、布爾諾理工大學、微軟研究院、愛丁堡大學和印度科學研究所舉辦,旨在以孟加拉語和博杰普爾語為例,探索低資源語言的語音識別難題。比賽吸引了中科院自動化所、愛沙尼亞塔林理工大學、印度坎普爾理工學院、印度科學研究所-馬德拉斯語音實驗室、印度科學研究所-孟買數字音頻處理實驗室、印度浦那高級計算發展中心等多家國內外知名高校和研究機構參賽。

自動語音識別(Automatic Speech Recognition,簡稱ASR)主要用于將人類語音轉換為計算機可讀的文本或命令,實現人機交互和自然語言處理。近年來,得益于基于自監督學習的聲學模型(如 wav2vec2)和大規模多語言訓練(如 Whisper),自動語音識別性能大幅提高,然而低資源語言由于音頻和文本數據有限,仍面臨巨大的挑戰。

在ASRU 2023 MADASR比賽中,傳音AI技術部開發的語音識別系統,在算法層面使用了兩種方案,一種是基于U2(Unified-2 pass)框架的編碼器和解碼器結構,使用短時連接分類(Connectionist Temporal Classification)和注意力重打分(Attention Rescore);另一種是基于Whisper的改進和微調的結構。該系統顯著提升了低資源語言語音識別的準確性和效率,克服了語音數據的稀缺難題,其解決方案將為其他低資源語言提供參考。

b69609e2-9faf-11ee-8b88-92fbcf53809c.jpg

b6ad96a2-9faf-11ee-8b88-92fbcf53809c.jpg

據Ethnologue網站統計,世界上有7000多種語言,其中90%的語種使用人數少于10萬人,不同語種尤其是小語種之間的溝通交流仍面臨極大挑戰。傳音長期深耕新興市場,面對新興市場智能語音技術空白,不斷加強多語種數據建設,開發小語種語音識別、語義理解、知識圖譜、語音合成等算法模型,除了提供多語種語音轉寫的服務能力,未來還將提供大語言模型生成式交互和跨語種翻譯能力,使不同語種之間的交流更順暢,讓更多的小語種使用群體受益。

傳音始終以新興市場的消費者為中心,重視新興市場用戶的需求。未來,傳音將繼續結合行業技術發展趨勢和本地消費者洞察,在AI技術研究和智能終端應用領域發力,通過技術為用戶、為社會創造更多價值,讓盡可能多的人盡早享受科技和創新帶來的美好生活。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 語音識別
    +關注

    關注

    38

    文章

    1725

    瀏覽量

    112565
  • ai技術
    +關注

    關注

    1

    文章

    1261

    瀏覽量

    24254
  • 傳音
    +關注

    關注

    0

    文章

    54

    瀏覽量

    6208

原文標題:傳音AI技術部在ASRU 2023 MADASR低資源語音識別比賽斬獲多項佳績

文章出處:【微信號:TranssionHoldings,微信公眾號:傳音控股】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    語音識別技術醫療領域的應用

    語音識別技術醫療領域的應用已經越來越廣泛,為醫療服務帶來了諸多便利和效率提升。以下是對語音識別
    的頭像 發表于 11-26 09:35 ?119次閱讀

    聆思CSK6視覺語音大模型AI開發板入門資源合集(硬件資料、大模型語音/多模態交互/英語評測SDK合集)

    自定義大模型應用并接入到開發套件上實現語音交互,由淺入深地展示如何開發自己的大模型助手。 離線AI能力示例SDK清單 序號AI 能力 1語音喚醒 + 坐姿檢測 2
    發表于 06-18 17:33

    加碼多膚色影像技術 這是找到的“出海利器“?

    全球化時代,市場競爭愈演愈烈,產品差異化已然成為了企業脫穎而出的關鍵。黃、白膚色長期占據人像攝影主賽道的背景下,就憑借獨一無二的多膚色影像技術走出非洲,走向了更廣闊的新興市場。
    的頭像 發表于 06-13 16:43 ?389次閱讀

    研發中心與騰訊游戲語音GVoice移動語音技術領域展開深入合作

    近日,研發中心與騰訊游戲語音GVoice在上海研創園簽署了技術創新合作協議,雙方將在移動
    的頭像 發表于 06-07 16:46 ?817次閱讀

    控股2023年業績出爐:手機出貨量增24%,營收增34.88%

    5月17日夜晚,控股發布了一項股權轉讓計劃,該公司旗下的深圳投資將出售1%的股票。值得注意的是,
    的頭像 發表于 05-18 14:57 ?716次閱讀

    復盤控股2023年報:中國企業是如何贏得海外市場的?

    近日,控股相繼發布了2023年報和第一季度財報,根據兩階段報告顯示,新市場開拓、產品結構升級及成本優化,成為整體出貨量及銷售收入增長
    的頭像 發表于 05-16 15:13 ?481次閱讀

    控股2023年凈利潤增幅達122.93%,非洲智能機市場占比再創新高

    控股表示,公司積極拓展新興市場,得益于產品結構升級與成本優化,整體出貨量和毛利率均有顯著提高。2023年,控股手機總銷量約為1.94
    的頭像 發表于 04-24 09:36 ?369次閱讀

    AI等前沿技術大放異彩 控股以創新突圍海外市場

    近日,第四屆深圳企業創新促進大會暨深圳工業總會2023年度年會上,控股憑借扎實的創新實力入選“2023粵港澳大灣區企業創新力榜單——創
    的頭像 發表于 03-28 10:24 ?385次閱讀

    車內語音識別技術智能駕駛中的應用與前景

    詳細介紹車內語音識別技術智能駕駛中的應用、挑戰以及未來的發展趨勢。 二、車內語音識別
    的頭像 發表于 02-19 11:46 ?765次閱讀

    首次躋身全球智能機市場第四 手機新興市場“殺瘋了”?

    近日,研究機構IDC全球手機季度跟蹤報告顯示,2023年第四季度全球智能手機市場同比增長8.5%,出貨量達3.261 億臺,其中控股的業績表現尤為亮眼,第四季度智能手機出貨量達2820萬
    的頭像 發表于 01-31 10:44 ?649次閱讀

    紫光展銳接連斬獲多項行業重要榮譽

    近期,紫光展銳憑借技術和產品創新領域的實力和成果,接連斬獲多項行業重要榮譽。
    的頭像 發表于 01-20 17:21 ?1256次閱讀

    南芯科技獲控股【2023年度精誠合作伙伴】稱號

    本月5日,控股2023年度優秀供應商頒獎典禮于大廈隆重舉行。
    的頭像 發表于 01-18 18:17 ?1135次閱讀

    控股為晶能光電頒發2023年度“卓越質量獎”

    近日,素有“非洲手機之王”之稱的控股(Transsion)為晶能光電隆重頒發了2023年度“卓越質量獎”,
    的頭像 發表于 01-18 16:23 ?486次閱讀

    敦泰榮獲2023年度精誠合作伙伴”獎

    近日,知名智能終端廠商向敦泰頒發 “2023年度精誠合作伙伴”獎,以此表達對敦泰現場應用技術支持服務的認可與信任。
    的頭像 發表于 01-15 10:46 ?582次閱讀

    語音數據集:AI語音技術的靈魂

    一、引言 人工智能領域,語音技術被譽為“未來人機交互的入口”,而語音數據集則是AI語音
    的頭像 發表于 12-14 14:33 ?982次閱讀