人工智能的發(fā)展走過了從機(jī)器智能到感知智能的階段,正在邁向認(rèn)知智能的階段。然而由于人類復(fù)雜的語言系統(tǒng),一問一答形式的人機(jī)交互已經(jīng)滿足不了用戶的真實(shí)需求,機(jī)器必須學(xué)會(huì)處理人類復(fù)雜的語言。
隨著語音識(shí)別、NLP等技術(shù)的成熟,多輪對(duì)話交互系統(tǒng)將成為人機(jī)交互的重要紐帶和橋梁。
目前市場上人機(jī)對(duì)話交互主要分為三種類型:任務(wù)型、問答型、閑聊型。
任務(wù)型主要目的就是根據(jù)用戶描述的問題,收集必要的參數(shù)信息以完成用戶的任務(wù);問答型主要通過模型的解析,匹配知識(shí)庫的答案并提供給用戶;閑聊型主要以調(diào)節(jié)情緒,在用戶當(dāng)下的使用場景,以貼近用戶情感為目的,拉近用戶的距離。
人機(jī)對(duì)話交互中,機(jī)器處理自然語言時(shí)需要用到不同的語義表達(dá)形式來處理。主要有分布式語義、框架式語義、模型式語義。
01 分布式語義
可以簡單的理解為相似句模型解析。分布式語義需要標(biāo)注大量的訓(xùn)練數(shù)據(jù),大量的知識(shí)點(diǎn)會(huì)形成一個(gè)向量空間。當(dāng)用戶問題過來時(shí),機(jī)器先將用戶的問句進(jìn)行分詞,根據(jù)分詞結(jié)果匹配詞庫,也可以將語義理解成向量,機(jī)器根據(jù)空間向量分布判斷給出最優(yōu)解。
日常在進(jìn)行模型調(diào)優(yōu)時(shí),我們主要從數(shù)據(jù)和算法兩個(gè)方面進(jìn)行調(diào)優(yōu),再根據(jù)模型的正確率和召回率,找到最優(yōu)的f值,給定模型的閾值。
目前大量的機(jī)器學(xué)習(xí)都用的是分布式語義,依靠數(shù)據(jù)來處理語義間的關(guān)系,但分布語義理解比較淺,很難處理深層的語義。
02 框架式語義
現(xiàn)在市場上有很多的語音助手產(chǎn)品,通過獲取用戶問題中的關(guān)鍵參數(shù),然后將參數(shù)填入?yún)f(xié)議中,完成用戶的任務(wù)操作。
例如“查一下7月1日上海到洛杉磯的航班”,這句話中我們需要獲取到用戶的四個(gè)信息槽位:
首先我們明確用戶的場景,用戶是想查飛機(jī)的航班信息,所以結(jié)果里肯定不能出現(xiàn)汽車、火車等場景;
“7月1日”對(duì)應(yīng)的肯定是時(shí)間的參數(shù)time,所以查詢的結(jié)果里肯定是7月1日當(dāng)天的一個(gè)航班信息;
用戶的出發(fā)地是上海,目的地是洛杉磯,分別對(duì)應(yīng)參數(shù)里的origin、destination,所以這邊兩個(gè)參數(shù)不能顛倒,不然查詢的結(jié)果就不是用戶真實(shí)想要的信息了。
可以看到框架式語義最重要的就是要識(shí)別語義中的參數(shù)信息,缺一個(gè)都不能完成用戶的真實(shí)需求。所以在框架式語義中,框架識(shí)別和參數(shù)識(shí)別是非常重要的。
但用框架語義處理一些指代詞等高級(jí)的語言或需要結(jié)合上下文理解的時(shí)候,會(huì)因?yàn)槿鄙倌骋粋€(gè)槽位,而丟失用戶信息,所以現(xiàn)在很多框架語義配置時(shí)用了“平行槽位”。
首先明確在某一場景下,我們需要獲取哪些槽位信息,當(dāng)配置了平行槽位后,用戶語義中缺少哪一個(gè)槽位信息,通過配置追問話術(shù),將槽位信息補(bǔ)全,以完成用戶的最終目的。
03 規(guī)則式語義
規(guī)則式語義就是將用戶問句通過表達(dá)式的形式進(jìn)行匹配,當(dāng)滿足規(guī)則要求時(shí),給出結(jié)果回復(fù)。
要讓用戶問句能通過規(guī)則匹配問題,首先要明確走規(guī)則匹配邏輯要優(yōu)先于相似句匹配。規(guī)則也需要獲取問句中的實(shí)體信息,滿足要求后,即可匹配上。
下面就舉一個(gè)例子:
我們看這條規(guī)則由 {} 。 & | : # 等標(biāo)點(diǎn)符號(hào),也有字段等信息組成的一條規(guī)則。看這規(guī)則會(huì)覺得比較亂,但細(xì)細(xì)分析,其實(shí)還是很簡單的一條規(guī)則。
首先明確這個(gè)規(guī)則的意圖,是一個(gè)打開動(dòng)作,說明是一個(gè)指令。后面需要填寫的槽位信息就是A股、港股、美股的槽位信息、最后一個(gè)就是欄目。所以可以確定這條規(guī)則就是一個(gè)“打開某只股票的個(gè)股資料”。
因?yàn)槊總€(gè)標(biāo)點(diǎn)代表的意思是不同的,這就不細(xì)細(xì)說明了。所以當(dāng)用戶問句滿足這個(gè)規(guī)則要求,就滿足了這個(gè)規(guī)則對(duì)應(yīng)的標(biāo)準(zhǔn)句,那用戶就能得到該標(biāo)準(zhǔn)句對(duì)應(yīng)的答案了。
不同的語義處理形式邏輯都不同,但最終的目的還是為了能完成用戶下達(dá)的任務(wù)或操作。隨著分詞技術(shù)、實(shí)體抽取、NLU等技術(shù)的成熟,人機(jī)交互會(huì)更加和諧,處理效率會(huì)越來越高。
來源:搜狐
評(píng)論
查看更多