精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

語音交互流程簡介!語音交互流程設計

lPCU_elecfans ? 來源:lq ? 2019-04-29 13:50 ? 次閱讀

機器學習以及自然語言處理技術的進步,開啟了人與人工智能進行語音交互的可能,人們透過對話的方式獲取信息、與機器進行交互,將不再只是存在科幻情結當中。語音交互是未來的方向,而智能音箱則是語音交互落地的第一代產品

1語音交互流程簡介

AI 語音所需要的技術模塊有 4 個部分,分別為:

·自動語音識別(Automatic Speech Recognition, ASR)

·自然語言理解(Natural Language Understanding, NLU)

·自然語言生成(Natural Language Generation, NLG)

·文字轉語音(Text to Speech, TTS)

以叮咚開發(fā)文檔中的語音交互流程圖來看Ai 對話技術的主要路徑:

從上圖中可以看到,用戶與設備之間的交互,主要是采用語音方式處理和完成的。

2語音交互流程設計

一次完整的語音交互流程,成功的語音對話,通常是有以下幾個階段。

1.交互流程的核心—意圖

所謂意圖,表示用戶在使用應用時所做的動作(譬如:問一個問題或發(fā)送一條指令),這些意圖代表了應用的核心功能。

如果應用成功地識別了用戶意圖,則需要在完成業(yè)務動作后,將結果反饋給用戶;如果應用無法識別用戶意圖,則需要給用戶友好的提示,指導用戶使用。

用戶:七星彩的開獎時間是什么時候?Ai:體育彩票七星彩每周二、周四和周日開獎。

2. 如何識別意圖—語義解析

對語音識別結果進行分析理解,簡單來說就是將用戶語音輸入映射到機器指令。它可能定義了一組包含指定的單詞或短語的語法結構,用戶通過說出滿足這種結構的語句,來調用意圖。

用戶:我要{聽} {周杰倫}的{稻香}Ai:稻香.mp3

3.如何處理意圖—云端交互

調用意圖的結構化請求,向服務器請求處理后做出反饋響應。通俗來講該流程主要處理用戶的請求,解決用戶問題的答案。

4、語言合成模塊 – 組織語言

根據解析模塊得到的內部表示,在對話管理機制的作用下生成自然語言句子。同時將生成模塊生成的句子轉換成語音輸出。(把回答的機器語言再轉換成 口語語言)

3中文自然語言處理的關鍵技術

1、詞法分析

詞法分析包括詞形和詞匯兩個方面。一般來講,詞形主要表現在對單詞的前綴、后綴等的分析,而詞匯則表現在對整個詞匯系統(tǒng)的控制。在中文全文檢索系統(tǒng)中,詞法分析主要表現在對漢語信息進行詞語切分,即漢語自動分詞技術。通過這種技術能夠比較準確的分析用戶輸入信息的特征,從而完成準確的搜索過程。它是中文全文檢索技術的重要發(fā)展方向。

2、句法分析

句法分析是對用戶輸入的自然語言進行詞匯短語的分析,目的是識別句子的句法結構,實現自動句法分析過程。其基本方法有線圖分析法、短語結構分析、完全句法分析、局部句法分析、依存句法分析等。

3、語義分析

語義分析是基于自然語言語義信息的一種分析方法,其不僅僅是詞法分析和句法分析這樣語法水平上的分析,而是涉及到了單詞、詞組、句子、段落所包含的意義。其目的是從句子的語義結構表示言語的結構。中文語義分析方法是基于語義網絡的一種分析方法。語義網絡則是一種結構化的,靈活、明確、簡潔的表達方式。

4、語境分析

語境分析主要是指對原查詢語篇以外的大量“空隙”進行分析從而更為正確地解釋所要查詢語言的技術。這些“空隙”包括一般的知識,特定領域的知識以及查詢用戶的需要等。它將自然語言與客觀的物理世界和主觀的心理世界聯(lián)系起來,補充完善了詞法、語義、語用分析的不足。

4Ai對話目前存在的問題

人機對話過程中,用戶難免會出現表達失誤的情況,導致機器對用戶語言理解出現偏差,在這時, 糾錯機制對機器而言則非常重要,如缺少這個機制,用戶需要花費相當長的時間將其意圖解釋清楚,相應的用戶體驗也會十分糟糕。另一方面,雖然可以很好的識別語音,但是卻不能理解你的對話目的,語義理解上有偏差。

當前,包括Alexa在內的國內外智能音箱之所以沒有表現的那么智能,出現了“人工智障”的嘲笑也是因為在以上兩方面沒有處理太好。

因此語音交互最終需要解決的關鍵問題是 歧義消解問題,和未知語言現象的處理問題。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1791

    文章

    46859

    瀏覽量

    237566
  • 語音技術
    +關注

    關注

    2

    文章

    226

    瀏覽量

    21266
  • 自然語言處理

    關注

    1

    文章

    612

    瀏覽量

    13504

原文標題:四大方面解析AI語音技術,你不了解的人工智能語音識別

文章出處:【微信號:elecfans,微信公眾號:電子發(fā)燒友網】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    【實操文檔】在智能硬件的大模型語音交互流程中接入RAG知識庫

    本帖最后由 jf_40317719 于 2024-9-29 17:13 編輯 智能硬件的語音交互接入大模型后可以直接理解自然語言內容,但大模型作為一個語言模型,對專業(yè)領域知識的訓練缺乏也是
    發(fā)表于 09-29 17:12

    車載導航人機語音交互系統(tǒng)的實現

    車載導航人機語音交互系統(tǒng)的實現引言 語音作為自然的人機接口,可以使車載導航系統(tǒng)實現更安全、更人性化的操作。通過國內外車載導航系統(tǒng)的功能對比可知,支持語音
    發(fā)表于 08-15 21:27

    語音交互系統(tǒng)

    能幫我寫語音交互程序嗎?硬件:MCU為STC89C52;SYN6288 TTS 語音合成模塊; 語音識別模塊 LD3320芯片 非特定語音
    發(fā)表于 05-11 16:00

    【Gokit 3試用體驗】通過Lark 7618模組實現語音交互+語音交互UI設計理念

    語言是人類交互最自然最舒適的方法,而今天,機智云Gokit 3上Lark7618智能語音識別模塊提供了一個很好的外圍音頻實時采集電路,以及快速的音頻合成輸出系統(tǒng),有這兩樣,加持Gokit板載的上位機
    發(fā)表于 08-28 13:46

    車載導航人機語音交互系統(tǒng)的設計和實現

    引言語音作為自然的人機接口,可以使車載導航系統(tǒng)實現更安全、更人性化的操作。通過國內外車載導航系統(tǒng)的功能對比可知,支持語音交互是車載導航系統(tǒng)的一個發(fā)展趨勢。另外,市場信息服務公司J.D Power
    發(fā)表于 05-07 07:00

    語音交互技術感興趣的童鞋戳進來!

    `隨著非接觸經濟的到來,語音交互技術的應用即將迎來爆發(fā)期。而受疫情的影響,語音交互技術以便捷性、簡單性、避免接觸式交叉感染的特點得到人們廣泛的關注。 本期華秋創(chuàng)服硬創(chuàng)直播室<資事
    發(fā)表于 03-11 14:19

    MQTT和OTA應用的數據交互流程

    MQTT數據交互流程OTA數據交互流程
    發(fā)表于 04-02 06:03

    樹莓派語音交互如何實現開關燈?

    樹莓派語音交互如何實現開關燈?
    發(fā)表于 11-08 07:08

    基于語音識別的人機交互方式淺析

    0 引言傳統(tǒng)的人機交互依靠復雜的鍵盤或按鈕來實現,隨著科技的發(fā)展,一些新型的人機交互方式也隨之誕生,帶給人們全新的體驗。基于語音識別的人機交互方式是目前熱門的技術之一。但是
    發(fā)表于 01-25 07:00

    展示MQTT和OTA應用的數據交互流程

    SDK 底層的實現機制,而只需要了解設備如何通過 SDK 與云端進行數據交互即可,方便用戶理解如何使用應用層 API 接口進行業(yè)務邏輯編寫。這里舉例展示了 MQTT 和 OTA 應用的數據交互流程
    發(fā)表于 08-11 10:53

    體驗上汽推出的iVoka語音交互技術

    目前上汽推出了一個應用于汽車上且類似Siri系統(tǒng)的iVoka語音交互技術,中文的語音系統(tǒng)讓國人可以率先體驗到人機交互系統(tǒng)的樂趣與魅力。
    發(fā)表于 07-19 11:34 ?2370次閱讀

    智能語音交互是怎么實現交互流程中的輸入輸出呢?

    智能語音交互是人工智能的分支,相當于語音助手,屬于一款智能型的手機應用,通過智能對話與即時問答的智能交互,實現幫助用戶解決問題的功能。
    的頭像 發(fā)表于 03-13 15:49 ?1.2w次閱讀

    探析智能語音交互應用和技術

    北京聲加科技CEO邱鋒海受邀以《聲加萬物、聆聽未來:智能語音交互應用和技術》為題,分享了目前正在爆發(fā)的智能語音交互市場中的各項明星產品和其技術鏈條。
    的頭像 發(fā)表于 11-23 09:54 ?4791次閱讀

    冠林全新推出新一代智能語音交互工具 全力打造家居語音交互新體驗

    語音交互作為物聯(lián)網智能終端主流的交互方式已越來越普及,讓機器聽懂用戶發(fā)出的指令,享受更為輕松、舒適的智能生活。為此,冠林全新推出了新一代智能語音交互
    發(fā)表于 03-28 13:39 ?946次閱讀

    AI語音交互讓機器交互更加接近真人交互

    提到智能語音交互,普羅大眾對于技術刷屏的記憶停留在2018年的Google開發(fā)者大會“Google I/O”開幕式上。
    發(fā)表于 05-11 09:34 ?1344次閱讀