科技是把雙刃劍。對(duì)于電銷而言,智能電話機(jī)器人的出現(xiàn)是一場(chǎng)大變革。因?yàn)樗鼜?qiáng)大的外呼體系、智能篩選客戶信息等優(yōu)勢(shì),提高了企業(yè)的效率,降低了企業(yè)的成本支出,這是很好的應(yīng)用場(chǎng)景。
但在央視315晚會(huì)上,“機(jī)器人撥打騷擾電話”的黑色產(chǎn)業(yè)鏈被曝光。AI成為騷擾電話最大的幫兇。一天撥打5000多個(gè)騷擾電話,停電也能照打,還能清空通話記錄躲避監(jiān)管……技術(shù)不斷升級(jí)的AI對(duì)話機(jī)器人,也讓騷擾電話成了愈難更治的大麻煩。
AI對(duì)話機(jī)器人背后的技術(shù)
從技術(shù)上來(lái)看,國(guó)內(nèi)常用的電銷機(jī)器人所用的智能語(yǔ)音技術(shù)是比較初級(jí)的,主要是將本來(lái)由人說(shuō)的話變?yōu)?a href="http://www.nxhydt.com/v/tag/1247/" target="_blank">電腦來(lái)播出,以及調(diào)用一些簡(jiǎn)單的AI語(yǔ)音識(shí)別技術(shù)。而且,國(guó)內(nèi)大部分電銷公司為了節(jié)省成本,往往對(duì)這部分功能選擇用錄音來(lái)替代解決。
更為智能的AI對(duì)話機(jī)器人主要涉及語(yǔ)音識(shí)別、語(yǔ)義理解、對(duì)話問(wèn)答、語(yǔ)音合成、知識(shí)圖譜等多項(xiàng)AI核心技術(shù),另外還需要流程控制、電話交換平臺(tái)、通訊線路等工程技術(shù)支撐。
例如,谷歌在加州召開(kāi)的2018年度的開(kāi)發(fā)者大會(huì)上推出的Google Duplex,依托 Google 強(qiáng)大的自然語(yǔ)言理解,深度學(xué)習(xí)和語(yǔ)言文字轉(zhuǎn)換技術(shù),Duplex已經(jīng)能夠理解對(duì)話的上下文和每句話所表達(dá)的細(xì)微的意義差別。不僅能像真人對(duì)話般對(duì)答如流,還能模擬真人對(duì)話的語(yǔ)調(diào)語(yǔ)氣。
其背后的技術(shù)核心其實(shí)是由TensorFlow Extended(RFX)構(gòu)建而成的一個(gè)RNN網(wǎng)絡(luò)。為了達(dá)到高精度,谷歌用匿名的電話對(duì)話數(shù)據(jù)訓(xùn)練Duplex的RNN網(wǎng)絡(luò)。這個(gè)網(wǎng)絡(luò)會(huì)使用谷歌自動(dòng)語(yǔ)音識(shí)別(ASR)的識(shí)別結(jié)果文本,同時(shí)也會(huì)使用音頻中的特征、對(duì)話歷史、對(duì)話參數(shù)等等。谷歌為每一種不同的任務(wù)分別訓(xùn)練了不同的理解模型,不過(guò)不同任務(wù)間也有一些訓(xùn)練語(yǔ)料是共享的。最后,谷歌還利用TFX的超參數(shù)優(yōu)化進(jìn)一步改進(jìn)了模型。
為實(shí)現(xiàn)在不同的情境下,控制語(yǔ)音語(yǔ)調(diào),谷歌聯(lián)合使用了一個(gè)級(jí)聯(lián) TTS 引擎和一個(gè)生成式 TTS 引擎。這個(gè)系統(tǒng)還可以生成一些語(yǔ)氣詞,比如“hmmm”、“uh”,發(fā)出的聲音更加自然真實(shí),讓對(duì)方感覺(jué)像是人在思考。
以牙還牙,AI技術(shù)的反擊
面對(duì)機(jī)器人撥打騷擾電話的困擾,程序員表示:AI的問(wèn)題,那就讓AI來(lái)解決。阿里巴巴人工智能實(shí)驗(yàn)室(AI labs)宣布將上線一款對(duì)騷擾電話“以牙還牙”的解決方案:二哈智能防騷擾電話的應(yīng)用程序,可以讓 AI 幫用戶接聽(tīng)騷擾電話,預(yù)計(jì)年內(nèi)將正式以產(chǎn)品的形式面世。
通過(guò)阿里公布的演示視頻來(lái)看,當(dāng)一名推銷貸款的女推銷員接入電話后,1 分鐘時(shí)間內(nèi),“二哈”不但對(duì)答如流,甚至化被動(dòng)為主動(dòng),向這她咨詢“北京能不能貸款?”、“最多能貸多少錢?。全程中女推銷員絲毫沒(méi)有察覺(jué)到與自己通話的是一個(gè)機(jī)器人。
不止阿里巴巴推出了防騷擾利器,美國(guó)的一名匿名程序員去年就發(fā)布了一名叫“Lenny”的聊天機(jī)器人,對(duì)不堪其擾的騷擾電話開(kāi)啟了反擊。Lenny 的技術(shù)與上述相比,倒不是什么高級(jí)的人工智能,也不能識(shí)別騙子的語(yǔ)音作出相應(yīng)的回應(yīng)。僅僅是程序員在 Asterisk(著名用戶交換機(jī)系統(tǒng),支持交互式語(yǔ)音應(yīng)答)上的撰寫了幾行腳本代碼,外加一些真情實(shí)感的老爺爺語(yǔ)音而已。
當(dāng)用戶接到騙子電話時(shí),他們可以選擇呼叫轉(zhuǎn)移功能,讓內(nèi)置 Lenny 的 PBX 服務(wù)器接聽(tīng)電話,或者把黑名單上的電話號(hào)碼直接發(fā)送給 Lenny,讓它自動(dòng)應(yīng)答。該系統(tǒng)由 16 組預(yù)先錄制的消息組成,在對(duì)話的間隔,語(yǔ)音檢測(cè)算法會(huì)暫停1.5秒鐘,然后啟動(dòng)下一條消息。12 段語(yǔ)音會(huì)循環(huán)往復(fù),直到消磨完騷擾電話撥打方的耐性。
在分析了PBX接到的近兩萬(wàn)個(gè)Lenny電話數(shù)據(jù)后,學(xué)者發(fā)現(xiàn):騙子們跟Lenny的平均對(duì)話時(shí)間是10分13秒,平均對(duì)話回合達(dá)到27組,有72%的 Lenny 句庫(kù)循環(huán)了不止一次,只有5%的騙子發(fā)現(xiàn)了Lenny是機(jī)器人。
還有幾個(gè)騙子聽(tīng)到Lenny不停重復(fù)說(shuō)過(guò)的話,懷疑他阿茲海默癥犯了,問(wèn) Lenny 需不需要幫忙聯(lián)系醫(yī)生……
AI對(duì)話機(jī)器人的應(yīng)用場(chǎng)景
除了應(yīng)付騷擾電話,阿里 AI 北京研發(fā)中心負(fù)責(zé)人聶再清表示,“二哈”的進(jìn)一步的目標(biāo)是成為每個(gè)人的 AI 電話秘書,除了幫主人預(yù)約議程,還可以在主人繁忙的時(shí)候詢問(wèn)來(lái)電的主要意圖,還能轉(zhuǎn)換成文字進(jìn)行“匯報(bào)”。
科大訊飛AI研究院副院長(zhǎng)王士進(jìn)表示,電話機(jī)器人技術(shù)應(yīng)該優(yōu)先應(yīng)用在存在較多人工重復(fù)工作的服務(wù)溝通場(chǎng)景,用來(lái)解放人的精力去做更有價(jià)值的事情。例如智能服務(wù)、金融、教育、醫(yī)療等領(lǐng)域的客戶服務(wù)或咨詢服務(wù),比如快遞小哥派送包裹時(shí)與客戶的信息確認(rèn),醫(yī)院或社區(qū)對(duì)于病人的例行回訪等。總的來(lái)說(shuō),AI對(duì)話機(jī)器人專注解決智能服務(wù)領(lǐng)域的問(wèn)題。
小結(jié):
當(dāng)前,人工智能浪潮方興未艾,國(guó)內(nèi)誕生了諸如曠視科技、商湯科技、極鏈科技Video++、依圖科技等優(yōu)秀人工智能初創(chuàng)企業(yè),在很多領(lǐng)域展現(xiàn)出巨大的應(yīng)用前景。然而關(guān)于 AI 倫理、法制、技術(shù)黑暗面等問(wèn)題的討論從未停止。
作為一門技術(shù),人工智能本身是中性的,其最終作用的好壞,取決于使用它的人以及使用方式。就如AI對(duì)話機(jī)器人專注解決智能服務(wù)領(lǐng)域的問(wèn)題,可以有效提升效率降低成本,產(chǎn)生巨大的社會(huì)和經(jīng)濟(jì)效益。而若成了騷擾電話的助推力,就違背了技術(shù)發(fā)展的初衷。
AI技術(shù)是福還是禍,需要政府、社會(huì)、產(chǎn)業(yè)界共同倡導(dǎo)價(jià)值,創(chuàng)造理念,完善法規(guī),讓“科技向善”。
-
AI
+關(guān)注
關(guān)注
87文章
30172瀏覽量
268434 -
人工智能
+關(guān)注
關(guān)注
1791文章
46872瀏覽量
237599
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論