精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

您好,歡迎來電子發燒友網! ,新用戶?[免費注冊]

您的位置:電子發燒友網>源碼下載>數值算法/人工智能>

基于NLP、機器學習技術實現動作引擎的實踐進展

大小:0.6 MB 人氣: 2017-09-30 需要積分:1

  搜索引擎大家都很熟悉,比如說一個朋友跑北京馬拉松,你就想到網站去看,你就能得到馬拉松的官網,看到相應的信息,但是有些時候我們會有些具體的問題,比如說深圳的年降雨量,搜索引擎回來的結果很有可能第一個結果不會有,但是你點進去才能找到你的答案,如果你在手機上問這個問題的話,很有可能字很小,是一件很困難的事情,我們在做自動問答的產品,這個產品就是有一個問題,我們希望在搜索結果里頭把這個答案給你找出來,然后你就可以直接看到,用不著點擊到網頁里頭去尋找你的答案。

  這是另一個例子,我們這個產品可以看成是回答引擎,就一般的搜索結果關健詞是黑體,如果是答案那就是我們這個問答產品做的,什么化學物可以殺臭蟲,我們就會把這個答案顯示出來,另外我們也把上下文給你列出來,因為這個時候很多時候會有幫助。

  如果我們內部的信心比較足的時候,還會把答案用很大的字體放到最前頭,比如最快的鳥是什么,這個答案就出來了,這是一種獵鷹,可以看到確實飛的很快,就跟個小飛機一樣,在做問答系統的同時還可以學到很多沒有用的知識。

  但是有些時候你想做事情,比如北京到上海的機票,那時候我們就沒有一個很簡單的答案去給你,但是反正你會看到很多廣告,幫著東家掙錢。我是今年4月份從谷歌出來,然后在一個小創業公司做一款手機助手的產品,這個助手就你如果有一個請求,就希望把這個事情幫用戶給做了,比如北京到上海的機票沒有了,說完以后助手會自動打開攜程,然后填上出發地目的地,最后把攜程里的結果給你查出來。

  下面我就想具體的講一些回答助手的細節,搜索引擎和回答引擎最大的區別是什么呢,我覺得就是說你做搜索的時候你要找什么東西,用戶已經告訴你,那都是關健詞,所以你要知道到哪兒去找,就是有些網頁是可信賴,有些網頁不靠譜,你要給用戶可靠的結果,你要去什么地方找,但是問答引擎呢答案在用戶那里頭并沒有,你要知道找什么東西,就比如說剛才的這個例子,這個下面這個結果就是說如果我們這個回答引擎沒有觸發的話,這個會是谷歌的頭一個搜索結果,這里可以看到深圳降雨量,這個實際上是一個同義詞,這是谷歌的模式之一,就把看著像同義詞的東西找出來,能夠當做同義詞用,但是在同一個結果里頭,你要找的這些詞都有,但并不一定包含這個答案,那么如果我們找到這個答案以后,就可以把有答案的結果放在最前頭。

  這是另一個例子,就比如說我在準備怎樣加這個箭頭搜索到回答,怎樣插入特殊字符,這個也是我們團隊做出來的結果,這個里面你就可以看到,就說哪怕你沒有具體內容,可以看到這是在描述一個過程,這是找答案的時候一個很重要的信息,你要知道找什么東西。其實也找了一個也像是描述這個過程,但這個講的是office。

  下面用一個具體的例子來解釋一下回答的過程,就什么酶可以分解淀粉,然后這是我們找到的答案,首先我們要做分析,然后確定他是不是問問題,而且是問的問題里頭要找的是什么東西,這個結果呢是說這個確實是問題,他找的是這個酶,知道這個以后呢把找出來的紅的叫Focus Words,一個問題里頭他的焦點是什么,然后我們如果找到了這個焦點,我們就可以啟動下面這個問答的過程,找焦點如果是一個顯性的疑問,誰、什么、幾個之類的,其實很容易就找到這個問題的焦點,但有些時候一個query并不像一個問題,比如“fastest bird”,雖然沒有疑問詞,但也是一個問題。實際上有其他的顯性的問題,就比如有別人會問“what is the fastest bird”,這樣的話你就可以知道,如果只是缺少疑問詞,那也可以把它當一個問題去答。

  有的時候有疑問詞,但也不一定是一個問題。比如“when in rome rotten”,實際上不是一個問題。找到焦點以后呢,我們就可以從搜索結果里頭看什么東西有可能是答案,就我們知道要找“enzyme”,就得看這個谷歌比如說頭十個網站里頭有哪些東西有可能是講這個的。這個時候我們就需要定義一個Expected Answer Type,系統必須有一個大的方向,就是你知道用戶問的問題,但是你不能隨便拿來一個東西,不管它是不是enzyme。這個有多種做法,在學術界用的最多的是用比較粗顆粒的Type就把問題的分成很多種,然后就可以用普通的識別去找出這些東西,但是這個問題就是說,在用戶問問題的時候,他可能用的是另一個詞,需要做一個映射,比如melting point映射到TEMPERATURE,annual rainfall映射到LENGTH,assistantcoach映射到PERSON,這些也是要解決的問題。還有一個辦法,就是我們干脆就能夠就從用機器學習的辦法,就有可能用戶問的這些不同的焦點詞都做一個模型,然后就可以用這個模型來決定什么東西是不是有可能的答案。

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

      發表評論

      用戶評論
      評價:好評中評差評

      發表評論,獲取積分! 請遵守相關規定!

      ?