資料介紹
針對現有Eclat算法中普遍存在的候選集規模大、求交效率低的問題,提出了基于剪枝優化和索引求交的改進Eclat算法。首先根據頻繁集的性質采用預剪枝和后剪枝相結合的候選集優化策略,即利用預剪枝技術裁剪待連接的項集數量以減少項集連接操作,同時利用先驗性質對連接后的項集進行后剪枝處理;接著提出了一種基于事務索引的布爾數組求交方法,即通過將事務標識作為索引來設置并檢索布爾數組,以獲得項集支持度計數;最后通過設計對比實驗,在經典數據集上測試該方法的有效性。實驗表明,通過該方法能夠有效壓縮候選集規模,改善求交計算效率,特別是在支持度閾值小、事務數規模大的情況下,算法的運行效率得到了明顯的提升。
現如今,通過使用數據挖掘技術,我們可以從海量數據中挖掘有趣的信息。其中,關聯規則挖掘是數據挖掘技術中較為重要的一種手段。它一般分為兩個步驟:一是依據事先設定的支持度閾值找出所有符合條件的頻繁項集;二是依據頻繁項集及給定的置信度閾值產生關聯規則。其中,挖掘算法的性能主要取決于頻繁項集的生成,因此識別或發現所有頻繁項目集是關聯規則挖掘算法的核心。隨著數據挖掘技術理論研究的深入,各類關聯規則挖掘算法也在不斷地涌現。傳統的算法主要包括Apriori算法、FP-growth 算法以及Eclat 算法,后續的大部分算法都是在這三類算法的基礎上進行相應的優化和改進。
Apriori 算法使用一種稱為逐層搜索的迭代方法,通過項目集元素數目的不斷增長來逐步完成頻繁項集的發現,核心思想是通過候選集生成和情節的向下封閉檢測兩個階段來挖掘頻繁項集,該算法設計思想簡單,易于實現,但是產生了大量候選集,同時需要多次對事務庫進行掃描,計算耗時過長;FP-growth 算法使用一種稱為頻繁模式增長的方法,采取分治策略,將代表頻繁項集的數據庫壓縮到一棵頻繁模式樹(FP 樹)上,然后把這種壓縮后的數據庫劃分成條件數據庫,每個數據庫關聯一個頻繁項或“模式段”,并分別挖掘每個條件數據庫,這種方法可以顯著地壓縮被搜索的數據集的大小,該算法只掃描事務庫兩次,且無需產生候選集,相比Apriori 算法性能有顯著的提高,但由于所有項集都壓縮在一棵樹上,對內存要求較高,且遞歸算法設計復雜;Eclat 算法[4]的核心思想是將水平數據庫轉換成垂直數據庫,然后將項集的TID_set 進行交運算來得到項集的支持度,該算法由于只掃描一次事務庫,且項集支持度是通過交運算得到的,大大減少了計算時間,但Eclat 算法存在搜索空間大、連接操作頻繁、求交運算耗時的問題。
本文選取上述幾類算法中性能較好的Eclat 算法,結合近年來該算法的相關研究,針對其普遍存在的問題和不足,從候選集的生成和支持度的計算兩個方面對其加以優化和改進,提出了前后剪枝相結合的候選集優化策略以及利用數組索引取值計數的求交運算方法,以達到提高Eclat 算法效率的目的。
- 基于改進郊狼優化算法的淺層神經網絡進化 15次下載
- 基于ReliefF剪枝的多標記分類算法綜述 12次下載
- 改進鯨魚優化算法在路徑規劃的應用綜述 15次下載
- 改進膠囊網絡優化分成卷積的亞健康識別 7次下載
- 可提升全局尋優精度的改進灰狼優化算法 6次下載
- 基于改進自適應權重的立體匹配優化算法 3次下載
- 基于改進的蝗蟲優化算法的LSTM預測方法 7次下載
- 一種改進的聚類聯合相似度推薦算法 10次下載
- 一種改進的花朵授粉算法的WEB服務組合優化 7次下載
- 一種改進的哈里斯鷹優化定位算法 6次下載
- 嵌入式設備的YOLO網絡剪枝算法 4次下載
- 基于深度神經網絡的結構化剪枝算法 2次下載
- 關于蟻群算法的改進優化(源程序)資料下載 5次下載
- 一種改進的神經網絡相關性剪枝算法 0次下載
- 基于平均單元格的三角網格曲面快速求交算法
- 谷歌搜索引擎優化的各個方面和步驟 695次閱讀
- Mysql索引是什么東西?索引有哪些特性?索引是如何工作的? 942次閱讀
- 邊緣計算計算卸載與資源分配聯合優化算法 1033次閱讀
- 如何對spmv算法進行優化 1063次閱讀
- 基于改進FCOS的鋼帶表面缺陷檢測算法 1394次閱讀
- 用于實現并行處理加速硬件的H.264算法的改進和優化 2149次閱讀
- 大數據是如何優化企業搜索引擎 2167次閱讀
- 什么是決策樹?決策樹算法思考總結 1.1w次閱讀
- 基于動態矩陣方法改進了傳統CACC模型預測控制算法 6406次閱讀
- 數據集,網絡架構和剪枝方法 5827次閱讀
- 數據挖掘算法:決策樹算法如何學習及分裂剪枝 5629次閱讀
- K-means的優缺點及改進 3.1w次閱讀
- 關聯規則挖掘——Apriori算法的基本原理以及改進 9325次閱讀
- 配電網絡重構的改進混合遺傳算法 1128次閱讀
- 基于改進模擬退火算法的電網無功優化 769次閱讀
下載排行
本周
- 1ADI高性能電源管理解決方案
- 2.43 MB | 449次下載 | 免費
- 2免費開源CC3D飛控資料(電路圖&PCB源文件、BOM、
- 5.67 MB | 136次下載 | 1 積分
- 3基于STM32單片機智能手環心率計步器體溫顯示設計
- 0.10 MB | 123次下載 | 免費
- 4550W充電機原理圖
- 0.13 MB | 2次下載 | 6 積分
- 5USB的PD快充協議電壓誘騙控制器FS312A中文手冊
- 1.51 MB | 2次下載 | 免費
- 6USB的PD和OC快充協議電壓誘騙控制器FS312B中文手冊
- 1.35 MB | 2次下載 | 免費
- 7USB Type_C PD快充協議智能觸發芯片FS8025B應用手冊
- 1.48 MB | 1次下載 | 免費
- 8基于三相二電平PFC和隔離DC-DC轉換器的11kW雙向電池充電器
- 618.10 KB | 1次下載 | 免費
本月
- 1ADI高性能電源管理解決方案
- 2.43 MB | 449次下載 | 免費
- 2免費開源CC3D飛控資料(電路圖&PCB源文件、BOM、
- 5.67 MB | 136次下載 | 1 積分
- 3基于STM32單片機智能手環心率計步器體溫顯示設計
- 0.10 MB | 123次下載 | 免費
- 4使用單片機實現七人表決器的程序和仿真資料免費下載
- 2.96 MB | 44次下載 | 免費
- 53314A函數發生器維修手冊
- 16.30 MB | 31次下載 | 免費
- 6美的電磁爐維修手冊大全
- 1.56 MB | 22次下載 | 5 積分
- 7使用TL431設計電源
- 0.67 MB | 10次下載 | 免費
- 8感應筆電路圖
- 0.06 MB | 10次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935119次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關降壓/升壓雙向直流/直流轉換器 PCB layout 設計
- 1.48MB | 420062次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233084次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費下載
- 340992 | 191367次下載 | 10 積分
- 5十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183335次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81581次下載 | 10 積分
- 7Keil工具MDK-Arm免費下載
- 0.02 MB | 73807次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65987次下載 | 10 積分
評論
查看更多