一種面向數學檢索的LaTeX數學表達式解析與索引方法
大小:0.69 MB 人氣: 2017-12-22 需要積分:1
標簽:LATEX(8412)
針對數學表達式復雜二維結構特性所導致的普通文本檢索技術難以對其進行檢索的問題,提出了一種面向數學檢索的LaTeX數學表達式解析與索引方法。在充分考慮公式特點的基礎上,通過對LaTeX構成特點的分析和歸納,設計了LaTeX數學表達式的解析和檢索特征提取算法;以此為基礎,構建了一種適應數學表達式特性的雙層索引結構,利用所提取數學表達式各層次運算數和運算符信息,分別以Treap數據結構和倒排索引結構構成數學表達式索引,為實現進一步的數學表達式檢索匹配打下基礎。在瀏覽器/服務器模式下采用6234條數學教材中的公式作為數據集進行實驗,在解析獲得的124960個基線層數最高為11層的表達式節點上,建立索引平均耗時為33. 8317 s。實驗結果表明所提出的LaTeX表達式解析算法和索引結構能夠適應數學表達式的特點,有助于實現具有較高效率和準確性的數學表達式檢索。
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%