文本相似度計算旨在識別兩段文本在語義上是否相似,是自然語言處理領域的一個重要研究方向,其在智能問答、信息檢索等領域都發揮重要作用,具有很高的商業價值。
近期,思必馳知識服務團隊在中文文本相似度計算方向投入研究,并取得階段性成果:
1)在第十四屆全國知識圖譜與語義計算大會(CCKS: China Conference on Knowledge Graph and Semantic Computing)[1]上發表相關論文一篇《Neural Fusion Model for Chinese Semantic Matching》。
該會議是國內知識圖譜、語義技術、鏈接數據等領域的核心學術會議,聚集了知識表示、自然語言理解、知識獲取、智能問答、鏈接數據、圖數據庫、圖計算、自動推理等相關技術領域的和研究人員的學者和研究人員。
2)在“千言數據集:文本相似度”評測[2]中取得階段性進展。該評測的文本相似度數據集包括公開的三個文本相似度數據集,分別為哈工大(深圳) LCQMC 、 BQ Corpus和谷歌的 PAWS-X(中文)。目前,思必馳知識服務團隊在三個數據集上均暫列第一。
針對中文文本相似度計算的魯棒性和泛化性問題,思必馳知識服務團隊在以下幾個方面開展了技術研究: 1)針對中文特點的字、詞融合編碼器; 2)基于預訓練模型的領域自適應訓練; 3)目標應用領域導向的多階段模型微調。 相關技術實現在上述公開評測中得到了應用和驗證。 語言智能常被稱為人工智能皇冠上的一顆明珠。在未來,思必馳知識服務團隊將繼續深耕認知智能領域,在面向通用領域的文本相似度計算基礎上,打造領域自適應的文本相似度計算系統,推動文本相似度在垂直領域的應用和發展。
原文標題:【會員風采】思必馳在中文文本相似度計算任務上的探索與進展
文章出處:【微信公眾號:深圳市汽車電子行業協會】歡迎添加關注!文章轉載請注明出處。
責任編輯:haq
-
人工智能
+關注
關注
1791文章
46882瀏覽量
237633 -
思必馳
+關注
關注
4文章
280瀏覽量
14269
原文標題:【會員風采】思必馳在中文文本相似度計算任務上的探索與進展
文章出處:【微信號:qidianxiehui,微信公眾號:深圳市汽車電子行業協會】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論