Deep Web數據源選擇和集成方法
大小:1.10 MB 人氣: 2018-02-09 需要積分:1
標簽:數據源(9614)
針對基于數據源質量選擇方法的數據源在數據爬取時存在代價大、重復率高的問題,提出一種結合兩層選擇模型的Deep Web數據源選擇和集成方法。該方法根據數據源本身質量和數據源的效用構建數據源的兩層選擇模型。給出基于該模型的遞歸增量數據源選擇和集成策略,采用基于數據源質量的選擇器過濾大量低質量DeepWeb數據源,僅選擇若干個高質量的數據源作為第2層選擇器的輸入。從候選數據源集合中遞歸地選擇,使集成系統在獲得盡可能多的高質量數據的同時,避免出現較高覆蓋率的K個數據源,作為集成系統最終需要爬取和集成的數據源。實驗結果表明,該方法結合兩類選擇器的優點,縮減了候選數據源的空間并保證集成數據的質量,同時避免了系統處理大量重復數據,有效降低Deep Web數據爬取與集成的代價。
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%
下載地址
Deep Web數據源選擇和集成方法下載
相關電子資料下載
- 大數據采集系統分為幾類 269
- 常見的數據采集工具的介紹 109
- 邊緣計算與晶振技術:實現智能靠近數據源的新型計算范式 407
- 商湯科技攜手國內頭部遙感數據平臺全面升級SenseEarth數據源 272
- 萬維網35周年之際,聯合創始人警告平臺沉迷和數據源控制兩大問題 445
- NBA比賽收視率的背后是什么? 213
- 開發RAG管道過程中的12個痛點 435
- 鴻蒙開發教學-圖片的引用 381
- 鴻蒙HarmonyOS引用圖片的方法 555
- 數據網關機干什么的 數據網關與數據采集器的區別 1097