查重元數據去冗算法設計
大小:0.79 MB 人氣: 2018-03-09 需要積分:1
標簽:元數據(9107)
隨著重復數據刪除次數的增加,系統中用于存儲指紋索引的清單文件等元數據信息會不斷累積,導致不可忽視的存儲資源開銷。因此,如何在不影響重復數據刪除率的基礎上,對重復數據刪除過程中產生的元數據信息進行壓縮,從而減小查重索引,是進一步提高重復數據刪除效率和存儲資源利用率的重要因素。針對查重元數據中存在大量冗余數據,提出了一種基于壓縮近鄰的查重元數據去冗算法Dedup2。該算法先利用聚類算法將查重元數據分為若干類,然后利用壓縮近鄰算法消除查重元數據中相似度較高的數據以獲得查重子集,并在該查重子集上利用文件相似性對數據對象進行重復數據刪除操作。實驗結果表明,Dedup2可以在保持近似的重復數據刪除比的基礎上,將查重索引大小壓縮50%以上。
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%
下載地址
查重元數據去冗算法設計下載
相關電子資料下載
- 氣象土壤墑情監測站:多元數據融合的智慧農田管理平臺 244
- 哥倫比亞大學開發視聽工具包,幫助研究者探索神經元數據 275
- 蘋果、谷歌曾向政府提供智能手機推送通知,新政執行要求 471
- jvm調優主要是調哪里 948
- 元數據的作用機理是什么?它能解決什么問題? 360
- Linux文件系統層的主要結構 388
- 如何通過注解來優化我們的Java代碼 425
- Java中常見的注解 371
- Java中注解的作用 581
- 基于LRU-K模型如何實現高效的元數據緩存? 702