基于主題與概率模型的非合作深網數據源選擇
大?。?/span>1.87 MB 人氣: 2017-12-22 需要積分:3
在深網數據集成過程中,用戶希望僅檢索少量數據源便能獲取高質量的檢索結果,因而數據源選擇成為其核心技術.為滿足基于相關性和多樣性的集成檢索需求,提出一種適合小規模抽樣文檔摘要的深網數據源選擇方法.該方法在數據源選擇過程中首先度量數據源與用戶查詢的相關性,然后進一步考慮候選數據源提供數據的多樣性.為提升數據源相關性判別的準確性,構建了基于層次主題的數據源摘要,并在其中引入了主題內容相關性偏差概率模型,且給出了基于人工反饋的偏差概率模型構建方法以及基于概率分析的數據源相關性度量方法,為提升數據源選擇結果的多樣性程度,在基于層次主題的數據源摘要中建立了多樣性鏈接有向邊,并給出了數據源多樣性的評價方法,最后,將基于相關性和多樣性的數據源選擇問題轉化為一個組合優化問題,提出了基于優化函數的數據源選擇策略.實驗結果表明:在基于少量抽樣文檔進行數據源選擇時,該方法具有較高的選擇準確率.
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%
下載地址
基于主題與概率模型的非合作深網數據源選擇下載
相關電子資料下載
- 大數據采集系統分為幾類 269
- 常見的數據采集工具的介紹 109
- 邊緣計算與晶振技術:實現智能靠近數據源的新型計算范式 407
- 商湯科技攜手國內頭部遙感數據平臺全面升級SenseEarth數據源 272
- 萬維網35周年之際,聯合創始人警告平臺沉迷和數據源控制兩大問題 445
- NBA比賽收視率的背后是什么? 213
- 開發RAG管道過程中的12個痛點 435
- 鴻蒙開發教學-圖片的引用 381
- 鴻蒙HarmonyOS引用圖片的方法 555
- 數據網關機干什么的 數據網關與數據采集器的區別 1096