精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

「揭秘」Speech AI 技術發展與前沿應用

NVIDIA英偉達企業解決方案 ? 來源:未知 ? 2022-11-10 11:00 ? 次閱讀

Speech AI 線上技術研討會

精彩議程搶先看



自二十世紀下半葉第一個基于計算機的語音合成系統誕生,至以隱馬爾可夫模型為代表的統計機器學習合成語音占據主流,再到近十年來基于神經網絡的語音合成快速發展,計算機語音合成技術如今已能媲美真人發聲,并走向大規模的商業化落地階段。


Gartner 技術成熟度曲線表明,語音識別和語音合成技術如今已經達到穩步爬升恢復期和生產成熟期。國內的智能語音市場也形成了比較成熟的格局,智能語音科技企業和互聯網企業成為主導。因此,要實現差異化競爭,企業也在紛紛思考如何從單一的智能語音技術提供商轉型為提供全方位的人工智能技術和應用的服務商。此外,盡管技術已經趨近成熟,門檻大大降低,開發和運行可落地的語音人工智能服務仍然是一項復雜而艱巨的任務,通常需要面臨實時性、可理解性、自然性、低資源、魯棒性等挑戰。


在智能語音市場的競爭格局中,一大空缺是算法、通用類芯片和云端 AI 芯片。借助以 GPU 為代表的通用類芯片上的技術優勢,NVIDIA 進軍了智能語音領域?;谧詣诱Z音識別( ASR )和語音合成( TTS ),NVIDIA Riva 簡化了開發語音 AI 服務的端到端流程,并為語音交互提供實時性能。此外,包括 NVIDIA TensorRTTriton 推理服務器在內的諸多 NVIDIA 技術也幫助各種 Speech AI 工作負載進行大幅的降本增效。不論是 AI 呼叫中心、虛擬主力語音接口,還是視頻會議中的實時字幕等應用,NVIDIA GPU 及 NVIDIA 加速技術都在幫助用戶進一步為技術落地降低門檻,為自動駕駛、醫療等場景的智能語音應用創新賦能。


2022 年 10 月 25 日和 27 日,NVIDIA 在 DataFun 直播間,舉辦 Speech AI 線上技術研討會,由資深專家介紹 NVIDIA NeMo / RIVA 構建語音應用的工作流、GPU 加速和部署 Speech AI 任務全流程的最佳實踐,更榮幸邀請到了 WeNet 開源社區發起人為我們分享 WeNet 社區的最新技術進展


議題介紹


NVIDIA NeMo 工具介紹,以及如何利用 NeMo 進行語音相關任務的訓練


NeMo 是 NVIDIA 推出的一款主打GPU 訓練的工具,可以支持常見的 Speech AI 相關的任務,例如ASR、NLP、TTS、Speaker Recognition 等。將以中文語音識別為例,介紹如何利用 NeMo 快速地完成該任務的訓練。同時也會介紹 NeMo 中目前已有的一些功能,例如 VAD、說話人日志等。


通過本次演講您將收獲以下內容:


  • 如果利用 NeMo 訓練 ASR 模型?


  • NeMo 對中文語音任務的支持有哪些?


  • NeMo 支持其他哪些 Speech processing 的任務?



演講嘉賓


丁文 NVIDIA 解決方案架構師

畢業于上海交通大學,導師為俞凱教授。畢業后曾就職于頭部互聯網公司語音交互部門,主要負責流式 ASR 的迭代與優化、粵語 ASR 等。目前就職于 NVIDIA,負責 Riva 中文 ASR 模型迭代,中文 ASR 模型 GPU 部署方案落地與優化等。


使用 NVIDIA Riva 部署企業級 ASR 服務


NVIDIA Riva 提供了最先進的 GPU 優化部署解決方案,用于構建和部署完全可定制的實時語音識別服務,用于諸如呼叫中心代理協助、虛擬助理、數字化身、品牌語音和視頻會議轉錄等應用程序。


本次分享將為大家介紹 NVIDIA Riva 的主要特性,包括高精度的預訓練語音模型,高性能推理模型,以及高可擴展的推理服務。


通過本次演講您將收獲以下內容:


  • 如何使用 NVIDIA Riva 在 GPU 上快速部署語音識別服務?


  • Riva 是如何針對 GPU 進行優化加速的?


  • 怎樣進行定制化達到更好的語音識別精度?



演講嘉賓


齊家興 NVIDIA 解決方案架構師

德國亞琛工業大學博士,目前于英偉達企業解決方案部門擔任高級架構師,多年來從事自然語言處理和語音識別等方向研究,助力多家企業基于 GPU 平臺實現高效易用的訓練和推理平臺。他是英偉達 NeMo,Riva 語音識別訓練推理平臺的中文模型開發者之一。


利用 Triton Inference Server 和 TensorRT 加速語音 AI 在云端的運行效率


演講將主要介紹云上部署端到端 ASR 服務最佳實踐以及云上部署端到端 TTS 服務最佳實踐。


通過本次演講您還將收獲以下內容:


  • 了解如何加速語音 AI 模型


  • 了解如何節省語音 AI服務的部署成本



演講嘉賓


劉川 NVIDIA 資深解決方案架構師

NVIDIA 中文語音解決方案主要負責人,對基于 GPU 的語音識別和語音合成在云上的部署有豐富經驗。


WeNet 在 Speech AI 的應用與探索


演講將主要介紹開源極簡史、語音開源簡史、WeNet 開源社區以及基于 GPU 的語音識別實踐。


通過本次演講您將收獲以下內容:


  • 了解 WeNet 開源社區


  • WeNet 社區中如何支持和使用 GPU



演講嘉賓


張彬彬 WeNet 開源社區發起人

碩士畢業于西北工業大學音頻語音與語音處理研究組。WeNet 開源社區發起人,主導了業界領先的開源端到端語音識別項目 WeNet 和大規模多領域中文語音識別開源數據集 WenetSpeech 的開發?,F任地平線語音算法專家,曾先后在微軟、出門問問等公司從事語音識別算法和產品研發。



參與方式


精彩連續,點擊“閱讀原文”掃描下方海報二維碼,馬上注冊預約!



原文標題:「揭秘」Speech AI 技術發展與前沿應用

文章出處:【微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 英偉達
    +關注

    關注

    22

    文章

    3748

    瀏覽量

    90842

原文標題:「揭秘」Speech AI 技術發展與前沿應用

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    DEKRA德凱探討AI安全技術前沿趨勢

    近日,DEKRA德凱在蘇州成功舉辦了一場聚焦智能化發展的研討會,深入探討了汽車、高科技及工業領域人工智能(AI)應用中的安全與管理。研討會吸引了眾多行業專家及產業鏈合作伙伴的參與,共同探討了AI安全
    的頭像 發表于 11-14 13:48 ?205次閱讀

    揭秘高精度貼裝技術如何助力AI芯片量產飛躍

    在當今科技日新月異的時代,人工智能(AI)作為推動社會進步和產業升級的關鍵力量,正以前所未有的速度改變著我們的生活和工作方式。而AI芯片,作為支撐AI技術發展的核心硬件,其性能與生產效
    的頭像 發表于 10-29 11:09 ?253次閱讀
    <b class='flag-5'>揭秘</b>高精度貼裝<b class='flag-5'>技術</b>如何助力<b class='flag-5'>AI</b>芯片量產飛躍

    智能駕駛技術發展趨勢

    智能駕駛技術是當前汽車行業的重要發展趨勢之一,它融合了傳感器技術、人工智能、大數據和云計算等多種先進技術,旨在實現車輛的自主駕駛和智能化管理。以下是對智能駕駛
    的頭像 發表于 10-23 15:41 ?508次閱讀

    AI for Science:人工智能驅動科學創新》第二章AI for Science的技術支撐學習心得

    ,推動科學研究的深入發展。 總結 通過閱讀《AI for Science:人工智能驅動科學創新》第二章,我對AI for Science的技術支撐有了更加全面和深入的理解。我深刻認識到
    發表于 10-14 09:16

    科幻前沿技術發展論壇召開 十余名科幻大咖暢議科幻創意賦能科技創新

    提供無限可能。那么下一個,會是什么呢? 4月28日,2024第八屆中國科幻大會科幻前沿技術發展論壇在石景山區首鋼園召開。 論壇由北京市科學技術委員會、中關村科技園區管理委員會主辦,石景山區人民政府、首鋼集團聯合主辦,北京
    的頭像 發表于 09-10 17:18 ?213次閱讀
    科幻<b class='flag-5'>前沿技術發展</b>論壇召開 十余名科幻大咖暢議科幻創意賦能科技創新

    開啟全新AI時代 智能嵌入式系統快速發展——“第六屆國產嵌入式操作系統技術與產業發展論壇”圓滿結束

    航空計算技術研究所研究員崔西寧做了“AI時代的機載嵌入式操作系統”專題報告。 崔西寧回顧了機載軟件技術發展歷程,介紹機載智能計算的演進之路,分享了天脈操作系統現狀和發展計劃。 圖3
    發表于 08-30 17:24

    無線充電技術發展趨勢

    目前無線充電技術還處于發展階段,距離方案的成熟尚需不斷探索和完善!降低熱損耗,提升效率縮短充電時間,改良充電曲線以更好的保護負載設備(終端或者電池等)。
    發表于 08-03 14:26

    阿丘科技攜前沿AI技術實踐亮相VisionChina2024上海站

    展暨機器視覺技術及工業應用研討會將在上海新國際博覽中心舉辦。阿丘科技將以其前沿AI技術實踐,為觀眾帶來一場AI+工業的視覺盛宴。本次展會,
    的頭像 發表于 07-04 08:25 ?694次閱讀
    阿丘科技攜<b class='flag-5'>前沿</b><b class='flag-5'>AI</b><b class='flag-5'>技術</b>實踐亮相VisionChina2024上海站

    Build 2024發布多項Azure AI Speech全新多模態功能

    客戶們持續使用 Azure OpenAI 和 Azure AI Speech 進行創新,為企業引入新的效率,并構建新的多模態體驗。
    的頭像 發表于 05-28 09:08 ?543次閱讀
    Build 2024發布多項Azure <b class='flag-5'>AI</b> <b class='flag-5'>Speech</b>全新多模態功能

    揭秘氣候技術發展的關鍵平臺Earth-2的核心—CorrDiff

    在全球變暖背景下,NVIDIA Earth-2 已成為推動氣候技術發展的關鍵平臺。針對因氣候變化而日益加重的災難性極端天氣影響,該平臺能夠生成可供執行的洞察。
    的頭像 發表于 04-20 09:23 ?566次閱讀

    巖土工程中的振弦采集儀技術發展與前景展望

    巖土工程中的振弦采集儀技術發展與前景展望 河北穩控科技振弦采集儀是一種常用的巖土工程監測儀器,用于測量土壤或巖石的振動特性。隨著巖土工程領域的發展技術的進步,振弦采集儀技術也得到了不
    的頭像 發表于 03-01 10:57 ?340次閱讀
    巖土工程中的振弦采集儀<b class='flag-5'>技術發展</b>與前景展望

    高通在2024 MWC展示AI領域新突破

    在2024年巴塞羅那世界移動通信大會(2024 MWC)上,高通技術公司展現了其在AI領域的最新成果,從全新的高通?AI Hub到前沿研究突破,再到
    的頭像 發表于 02-27 10:57 ?943次閱讀

    AI大模型加速落地! 西部數據助力數據中心智能化升級

    面對AI大模型的發展和普及,西部數據作為全球數據存儲解決方案提供商,如何看待這種浪潮到來,生成式AI技術發展對現有基礎設施部署工作帶來哪些挑戰?對存儲產品帶來了哪些新的
    的頭像 發表于 02-18 00:03 ?4542次閱讀
    <b class='flag-5'>AI</b>大模型加速落地! 西部數據助力數據中心智能化升級

    AI加速智能家居分布式語音技術發展

    中的任何地方通過語音命令來控制智能設備,實現更具有體驗性的居家生活。 ? 什么是分布式語音技術? ? 分布式語音技術,也稱為DSR(Distributed Speech Recognition),是一種將語音識別任務分布到多個計
    的頭像 發表于 02-01 00:16 ?5765次閱讀

    2024年可預見的藍牙技術發展趨勢

    近期,Silicon Labs(亦稱“芯科科技”)負責藍牙技術的高級產品經理Parker Dorris先生參與藍牙技術聯盟(Bluetooth SIG)的會員訪談,就2024年可預見的藍牙技術發展趨勢進行了討論,包括電子貨架標簽
    的頭像 發表于 01-08 17:27 ?1441次閱讀