近年來,電信業出現了大量 AI 驅動的技術,尤其是語音識別和翻譯。多語種 AI 虛擬助手、數字人、聊天機器人、語音客服、音頻轉錄等技術正在大幅改變電信業。企業正在呼叫中心部署 AI 以加快解決來電請求的速度,大幅提升客戶體驗、員工留存率和品牌聲譽。
例如,自動語音識別(ASR),即語音轉文本已被用于實時對話轉錄,這使企業能夠迅速為客戶確定資源或解決方案。語音 AI 還被用于分析情緒、識別分歧來源、提高合規性和坐席表現等。
本文將深入探討語音識別在電信業的變革力量,并著重介紹 AT&T、T-Mobile 等行業領導者如何利用這些最先進的技術在其呼叫中心提供無與倫比的客戶體驗。
語音轉文字對改善客戶服務的影響
語音轉文字技術的落地已為客服領域帶來了巨大改變。通過實現呼叫路由、呼叫分類和語音認證等任務的自動化,企業可以大大縮短客戶的等待時間并將其轉接至最適合處理該請求的坐席。
語音識別還可以用于 AI 驅動的客戶反饋分析,幫助改善客戶滿意度、產品和服務。憑借語音轉文字賦能的 AI 應用,企業可以準確識別并及時滿足客戶需求。
AT&T 數據科學 AI 助理副總裁 Jeremy Fix 在GTC23 上概述了該公司使用 AI 改善呼叫中心體驗的主要原因:
-
優化人員配置資源
-
提供個性化的客戶體驗
-
協作坐席提供可執行的洞察
資源優化
充足的人員配置是呼叫中心的關鍵組成部分之一,包括吸引和維系最好的人才。AT&T 通過 AI 預測呼叫中心坐席與來電數量的平衡情況,為坐席提供發揮其最佳水平所需的支持。
個性化
通過了解客戶首次接通時的意圖,AT&T 可以將來電者與之前解決過類似問題并且向客戶適時提供相關方案的資深坐席相匹配。
語音客服
AT&T 結合呼叫轉錄以及自然語言處理(NLP)驅動的洞察引擎,為坐席及管理人員提供實時、可操作的洞察,幫助他們做出智能化的決策并提供高質量的客戶服務(視頻 1)。
視頻 1. GTC23 上的 AT&T 洞察引擎演示
如何能做到實時的呢?在通話過程中,AT&T 的 NLP 引擎使用實時轉錄和文本挖掘技術識別討論主題,然后推薦后續最佳行動、識別通話情緒、預測客戶滿意度,甚至評估坐席質量和合規性。
常見的語音轉文本準確性問題
盡管語音 AI 可以幫助呼叫中心做出重大改進,但要成功落實語音轉文本仍面臨著一些挑戰。T-Mobile 的首席機器學習工程師 Heather Nolis 在 GTC23 期間談到了這些挑戰:
-
語音歧義
-
不同的說話風格
-
嘈雜的環境
-
電話的局限性
-
特定領域的詞匯
語音歧義
您有多少次在打電話時誤解了別人的意思?比如是“上了一艘郵輪”還是“上了一艘油輪”?這種聽起來相同,但含義不同的詞語會造成語音歧義。如果語音轉文字應用沒有經過訓練,無法按照上下文識別單詞,就會導致轉寫錯誤。
視頻 2. 語音歧義
不同的說話風格
每個人都會有不同的口音、方言和口腔生理結構,這意味著我們所說的每個詞語聽起來都會有所不同。對于全球運營的呼叫中心來說,必須在訓練數據集中捕捉到這些微妙的差別,從而提高語音識別的準確性。
視頻 3. 不同說話風格背后的原因包括生理結構差異和我們學習說話的方式
嘈雜的環境
呼叫中心坐席在與客戶對話時可能受到背景噪聲、同時說話的人、麥克風質量不佳,甚至手機信號不良等干擾,這些都會導致電話中的聲音丟失。部署到呼叫中心的強大語音轉文字應用必須能夠承受這類環境。
視頻 4. 噪聲源包括背景噪聲、同時說話的人和麥克風質量
電話的局限性
電話的局限性,包括無法記錄 “S”、“F” 等某些聲音會進一步阻礙語音轉文字的準確性。例如,即便您在電話中聽到 “free for all Friday” 這句話時實際上沒有聽到未被電話傳送的 “f” 這個音,但您的大腦仍會將 “f” 這個音補進去。而在轉錄過程中,就得由語音轉文本模型來填補缺失的聲音。
特定領域的詞匯
每一座為企業創建的呼叫中心都會遇到具有不同主題和詞匯的企業場景。開箱即用的 ASR 解決方案一般未經過有效的定制化,因此在現實中很少有用。
T-Mobile 展示了他們應對語音識別問題的解決方案。該方案采用 NVIDIA Riva(一款用于構建和部署自定義語音應用的 GPU 加速 SDK)并使用 NVIDIA NeMo(對特定領域的數據進行微調)。T-Mobile 在不同口音、不同說話風格和嘈雜生產環境等干擾下,將語音識別準確率提高了 3 倍(圖 1)。
圖 1. T-Mobile ASR 準確率*:從位于云端到高度定制化的 Riva 語音轉文本(*準確率[%]=100-WER)
實現最佳語音轉文字結果的首要因素
從電信呼叫中心和緊急服務到視頻會議和廣播,企業在部署最先進的語音 AI 技術時必須考慮準確度、延遲、可擴展性、安全性、運營成本等諸多因素,以便在競爭中保持領先地位。
企業正在不斷尋找將呼叫中心變成價值中心的新辦法,而成本在這方面起到至關重要的作用。呼叫數量多的企業必須根據定價模式、總體運營成本(TCO)和隱藏成本評估廠商。
實現全方位的語言、口音和方言覆蓋對所有語言的語音識別準確性都至關重要。值得高興的是,語音AI在多語種準確性上已經取得了很大的進步。例如,Riva現在可以為英語、西班牙語、普通話、印地語、俄語、阿拉伯語、日語、韓語、德語、葡萄牙語、法語和意大利語提供全球領先的語音識別。
最后,語音 AI 模型必須實現低延遲才能為坐席和客戶提供更好的實時體驗。如果在坐席與客戶對話的過程中,AI 無法足夠快地向坐席提供有關后續行動的建議,那就會變得毫無用處。
T-Mobile 詳細介紹了他們的語音轉文本評估流程,展示了一項重要的發現—— Riva 語音識別在延遲、成本效益和準確性方面均優于當前的云供應商模型。
視頻 5. T-Mobile 的語音轉文本評估指標:延遲、成本效益和準確性
在 GTC23 專題討論會“使用先進的語音 AI 技術引領潮流”上,Infosys、Quantiphi 和摩托羅拉分享了他們通過在電信解決方案中部署語音 AI 解決這些問題的經驗。
要點總結
將語音和翻譯 AI 集成到客服 AI 解決方案中正在給電信行業帶來變革。通過使用客戶會話的實時多語種轉錄,電信公司可以更好地對來電進行分類和轉接,并向坐席提供有價值的洞察和個性化的建議。
擁抱這項技術的電信公司可憑借提供卓越的客戶體驗、在競爭中保持領先并滿足客戶不斷變化的需求,從而獲得在市場中的競爭優勢。
點擊“閱讀原文”,或掃描下方海報二維碼,觀看 NVIDIA 創始人兼 CEO 黃仁勛在 COMPUTEX 2023 的主題演講直播回放,主題演講中文字幕版已上線,了解 AI、圖形及其他領域的最新進展!
原文標題:語音識別如何改善電信業客服體驗
文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
-
英偉達
+關注
關注
22文章
3746瀏覽量
90833
原文標題:語音識別如何改善電信業客服體驗
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論