精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

英偉達推出實時對話式AI模型工具

我快閉嘴 ? 來源:智東西 ? 作者:心緣 ? 2021-03-02 10:06 ? 次閱讀

憑借聽、讀、譯三大功能,對話式人工智能AI)正逐漸深入人們的生活,成為解放雙手和提高生產力的關鍵工具。

當你說話時,對話式AI能實時將你說的話記錄成文字,甚至可以實時翻譯成其他語言。

當你聽不懂、記不住醫生叮囑的藥物或治療方案時,接受過海量醫學文本訓練的對話式AI,能幫你準確地記下全部醫囑。

當你因為開車等原因不方便看手機時,對話式AI能將屏幕上的文字讀給你聽。

它既能做穩定的速記員,也能勝任專業的翻譯官,越來越多企業采用對話式AI來改善工作效率與優化客戶支持。

不過,要開發出一款優質的對話式AI,并不是一件容易的事。如果只追求最快的響應速度,難免犧牲語音識別、語言理解、語音生成的質量,而如果過于重視質量,可能會響應的不夠及時。

怎樣能快速開發出高質量的對話式AI,滿足專業的轉錄和編譯需求?知名硅谷芯片巨頭NVIDIA剛剛推出了一個相當有用的工具。

一、降低實時對話式AI開發門檻的神器

2020年初突然爆發的新冠肺炎疫情正刺激企業AI的應用,從遠程教育、遠程辦公、客戶服務到醫療健康,眾多行業加速出現對AI的需求。

知名市場調研機構IDC的數據顯示,2019年中國對話式AI的支出約為58億美元,這一數字有望到2023年攀升至138億美元。其中,中國對話式AI市場規模有望從2019年的5.761億美元增至2023年的18.593億美元,年均復合增長率(CAGR)為34.0%。

什么是對話式AI?簡單理解,就是一種能自動理解人類語言的系統,使得人與機器的交流像人與人之間的交流那樣輕松、自然而高效。

想想我們的日常溝通過程,我們不會向對方發出固定的指令,而是用自然的語言進行交流。

而要讓機器更加自然、擬人化的與人類互動,需要先讓機器理解你所說的話,即時了解上下文和語言,判斷話的意圖和隱藏含義,并以最自然的對話方式做出回應。

在疫情刺激下,英國高性能語音識別服務供應商Intelligent Voice發展勢頭相當迅猛,幾個月內即推出了新產品Myna,能連接到虛擬會議工具,自動記錄、將錄音轉換成文本并發送文本記錄。

Myna得以快速實現的秘密武器,即是NVIDIA去年5月首次公布的實時對話式AI模型工具Jarvis。

Jarvis是一個基于NVIDIA GPU提供實時性能的靈活、多模態對話式AI服務應用框架。

“Jarvis采用多模態的方法,將自動語音識別的關鍵元素與實體和意圖匹配相融合,滿足需要高吞吐量和低延遲的新用例的需求。Jarvis API不但易于使用,還能整合和自定義客戶的工作流程,實現性能優化。”Intelligent Voice首席技術官Nigel Cannings說。

另一家創建阿拉伯語虛擬助手的公司InstaDeep同樣是Jarvis的早期采用者。通過Jarvis中的NeMo工具包,這家公司對阿拉伯語語音–文本模型進行微調,將單詞錯誤率降低至7.84%。

通過早期采用者的反饋與優化,Jarvis逐漸實現了更高的吞吐量和更低的延遲。在打磨成熟后,NVIDIA于昨日正式推出GPU加速的Jarvis 1. 0公測版。

二、延時小于300毫秒,開發速度提升高達10倍

Jarvis 1. 0公測版中包含用于構建和部署實時對話式AI應用程序的端到端工作流程,使開發者能輕松實現實時語音識別、轉錄、翻譯、封閉式字幕、虛擬助手和聊天機器人等功能。

它對于改善企業服務非常友好。如果從頭開始構建對話式AI服務,必然需要深厚的AI專業知識、海量數據和充足的計算資源,而由NVIDIA GPU加速的Jarvis框架使開發者無需為這些成本而煩憂。

Jarvis的一大能力是定制解決方案。基于NVIDIA Jarvis,企業開發者能很容易地用專有的視頻和語音數據,對最新模型進行微調,從而更深入地理解特定上下文,并對推理進行優化,從而構建針對其自身行業、產品和客戶特征而量身定制的高質量、端到端實時對話式AI服務。

這些服務運行時間不到300毫秒,在GPU上的吞吐量比CPU高7倍。

首先是自動語音識別(ASR),整個系統需要先輸入音頻、提取特征,用聲學模型嘗試找出特定聲音生成相應的等效詞,從而識別語音音頻并生成對應文本;然后借助Jarvis,可以實現機器翻譯、搜索、意圖識別、語言分析、問答系統等自然語言理解(NLU)服務;最后從這些服務獲得文本作為輸出,通過語音合成(TTS)技術和語音編碼模塊生成像人類聲音的對應語音。

此次發布的Jarvis提供有多個新型對話式AI預訓練模型,包括基于數千小時語音數據訓練的ASR、NLU和TTS模型,提供使用一行代碼部署服務的端到端工作流程和工具,并支持遷移學習工具包(TLT),方便企業根據自己的具體用例和領域調整應用。

其遷移學習工具包是一個拖放界面,不需要任何先驗編碼經驗,即可采用自定義數據通過零編碼的方法,快速重新訓練模型。

開發者可以再訓練TLT,也可以探索用于構建和訓練GPU加速的對話式AI模型的Python工具包NeMo,然后用Jarvis集成使用最先進的AI語言模型進行語音識別、語音合成、語義理解的虛擬助手,未來Jarvis還將支持計算機視覺服務。

通過Jarvis,企業可以獲得各種先進的模型、通過TLT遷移學習將開發速度提升高達10倍,以及全面優化的GPU加速流程,從而創建能理解每家公司獨特專業術語的實時智能語言型應用。

其全面加速的深度學習流程經過優化,可作為可擴展服務運行。

即日起,NVIDIA Jarvis和TLT可供NVIDIA開發者計劃成員免費下載

三、對話式AI正改變各行業服務體驗

NVIDIA Jarvis服務現有的三大功能分別是語音識別、語音合成、自然語言理解。

其語音識別服務有不同的模式選擇,可以使用不同采樣率,可用于語音識別的英語語音數據已經被訓練了7000個小時,并提供有Jasper、Quartznet等不同聲學模型,全流程端到端優化。

其語音合成有流模式和批處理模式,支持22kHz采樣率,提供acoTron2、Waveglow等模型和完全端到端優化的流程。

如果要識別特定領域的實體,Jarvis的自然語言理解模型即可提供幫助,該服務提供高級NLP API和低級API,能滿足命名實體識別、領域分類、分別標簽等需要。

例如,在醫療健康領域,眼科醫生進行遠程診療時,自然語言理解服務能識別醫學文本的實體,在對話過程中能檢測出哪些醫療實體,輔助終端系統為患者進行診斷。

除了醫療健康外,NVIDIA Jarvis也正為政務、金融、消費者服務等更多行業帶來新的機遇。

企業和政府機構每天都要記錄數以千萬計的通話,但通過搜索提取這些通話中的關鍵信息幾乎難以實現。而通過Jarvis把錄音轉換成文本,就可以利用AI工具快速搜索并分析這些數據。

在金融領域,以用AI顛覆金融分析行業而聞名的英國公司Kensho用NVIDIA對話式AI開發了金融和商業語音識別解決方案Scribe,該方案據稱在財報電話和財務音頻方面的準確率比同類其他商業解決方案高出約20%。

得益于在推薦引擎Merlin、對話式AI Jarvis等關鍵框架的押注,NVIDIA正不斷強化其數據中心業務的軟件優勢。

本周NVIDIA剛剛公布的最新財報顯示,其數據中心業務在截至2021年1月31日的第四季度創下19億美元收入新紀錄,同比增長97%,全年收入創下67.0億美元的紀錄,同比增長124%。

結語:加速對話式AI落地普及

通過虛擬助手、實時轉錄、聊天機器人等形態,對話式AI正帶給企業客戶更多沉浸式的體驗。

隨著越來越多企業及消費者擁抱數字化,更多中小型機構也開始在其聯絡中心部署更具個性化的對話式AI功能,而開發部署的成本與復雜性,往往是制約這一趨勢的核心難題之一。

而NVIDIA Jarvis 1. 0公測版的推出,降低了實時對話式AI開發的準入門檻,有望推動未來對話式AI在更多行業的普及落地。
責任編輯:tzh

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    454

    文章

    50423

    瀏覽量

    421856
  • NVIDIA
    +關注

    關注

    14

    文章

    4940

    瀏覽量

    102818
  • AI
    AI
    +關注

    關注

    87

    文章

    30163

    瀏覽量

    268427
  • 人工智能
    +關注

    關注

    1791

    文章

    46868

    瀏覽量

    237592
收藏 人收藏

    評論

    相關推薦

    AI模型不再依賴英偉GPU?蘋果揭秘自研大模型

    ? 電子發燒友網報道(文/梁浩斌)過去幾年中爆發的AI算力需求,英偉GPU成為了最大的贏家,無論是自動駕駛還是AI模型,比如特斯拉、小鵬
    的頭像 發表于 08-05 06:07 ?3897次閱讀
    <b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>不再依賴<b class='flag-5'>英偉</b><b class='flag-5'>達</b>GPU?蘋果揭秘自研大<b class='flag-5'>模型</b>

    英偉AI服務器將革新采用插槽設計

    英偉AI服務器領域即將迎來重大變革。據里昂證券最新發布的報告預測,從明年下半年起,英偉的旗艦級AI
    的頭像 發表于 09-27 11:47 ?338次閱讀

    英偉與阿聯酋G42合作開發天氣預測AI模型

    英偉近期宣布與阿聯酋的領先AI應用開發企業G42達成戰略合作,共同探索天氣預測技術的新前沿。雙方將整合各自的技術優勢,依托英偉的Eart
    的頭像 發表于 09-24 15:41 ?247次閱讀

    英偉Blackwell可支持10萬億參數模型AI訓練,實時大語言模型推理

    、NVLink交換機、Spectrum以太網交換機和Quantum InfiniBand交換機。 ? 英偉稱,Blackwell擁有6項革命性技術,可支持多達10萬億參數的模型進行AI
    的頭像 發表于 09-04 09:10 ?2824次閱讀

    英偉推出Eagle系列模型

    英偉最新推出的Eagle系列模型,以其1024×1024像素的高分辨率處理能力,重新定義了視覺信息處理的邊界。該模型通過多專家視覺編碼器架
    的頭像 發表于 09-03 16:13 ?416次閱讀

    英偉震撼發布:全新AI模型參數規模躍升至80億量級

    8月23日,英偉宣布,其全新AI模型面世,該模型參數規模高達80億,具有精度高、計算效益大等優勢,適用于GPU加速的數據中心、云及工作站環
    的頭像 發表于 08-23 16:08 ?687次閱讀

    英偉TITAN AI顯卡曝光,性能狂超RTX 409063%!# 英偉# 顯卡

    顯卡英偉
    jf_02331860
    發布于 :2024年07月24日 17:18:28

    英偉推出Flextron AI框架:賦能靈活高效的AI模型部署

    在人工智能與機器學習領域,隨著技術的不斷演進,模型的高效部署與適應性成為研究的新熱點。近日,英偉與德克薩斯大學奧斯汀分校攜手宣布了一項重大突破——推出了一種名為FLEXTRON的新型
    的頭像 發表于 07-18 15:22 ?2698次閱讀

    英偉推出AI模型推理服務NVIDIA NIM

    英偉近日宣布推出一項革命性的AI模型推理服務——NVIDIA NIM。這項服務將極大地簡化AI
    的頭像 發表于 06-04 09:15 ?648次閱讀

    英偉首席執行官黃仁勛:AI模型推動英偉AI芯片需求

    近來,以ChatGPT為代表的AI聊天機器人已經導致英偉AI芯片供應緊張。然而,隨著能夠創造視頻并進行近似人類交流的新型AI
    的頭像 發表于 05-24 10:04 ?462次閱讀

    進一步解讀英偉 Blackwell 架構、NVlink及GB200 超級芯片

    能,加速模型的訓練和推理過程。 2. 生成 AI 解決方案 與英偉 Grace CPU、新一代網絡芯片等產品一起,面向生成
    發表于 05-13 17:16

    西門子和英偉深化合作,基于生成 AI 實現實時的沉浸可視化

    來源:西門子 ·全新解決方案將西門子 Xcelerator 與英偉 Omniverse Cloud API 相連接,依托生成 AI 技術,實現基于物理世界的
    的頭像 發表于 03-27 14:57 ?526次閱讀

    英偉推出生成AI專業認證

    在人工智能日益成為技術發展的核心領域的今天,英偉在近日舉行的GTC大會上將推出生成AI專業認證。這一創新舉措旨在幫助開發者、職場人士以及
    的頭像 發表于 03-19 11:44 ?836次閱讀

    AI引爆英偉業績 美國股市因英偉季績強勁上漲

    AI引爆英偉業績 美國股市英偉季績強勁上漲 AI的持續火爆引發一場全球資本市場狂歡,而且隨著
    的頭像 發表于 02-23 19:37 ?1285次閱讀

    英偉推出全新AI聊天機器人

    近日,英偉(Nvidia)宣布推出其全新的AI聊天機器人——“Chat With RTX”。這款聊天機器人被視為英偉
    的頭像 發表于 02-19 11:09 ?868次閱讀