資料介紹
針對現有Eclat算法中普遍存在的候選集規模大、求交效率低的問題,提出了基于剪枝優化和索引求交的改進Eclat算法。首先根據頻繁集的性質采用預剪枝和后剪枝相結合的候選集優化策略,即利用預剪枝技術裁剪待連接的項集數量以減少項集連接操作,同時利用先驗性質對連接后的項集進行后剪枝處理;接著提出了一種基于事務索引的布爾數組求交方法,即通過將事務標識作為索引來設置并檢索布爾數組,以獲得項集支持度計數;最后通過設計對比實驗,在經典數據集上測試該方法的有效性。實驗表明,通過該方法能夠有效壓縮候選集規模,改善求交計算效率,特別是在支持度閾值小、事務數規模大的情況下,算法的運行效率得到了明顯的提升。
現如今,通過使用數據挖掘技術,我們可以從海量數據中挖掘有趣的信息。其中,關聯規則挖掘是數據挖掘技術中較為重要的一種手段。它一般分為兩個步驟:一是依據事先設定的支持度閾值找出所有符合條件的頻繁項集;二是依據頻繁項集及給定的置信度閾值產生關聯規則。其中,挖掘算法的性能主要取決于頻繁項集的生成,因此識別或發現所有頻繁項目集是關聯規則挖掘算法的核心。隨著數據挖掘技術理論研究的深入,各類關聯規則挖掘算法也在不斷地涌現。傳統的算法主要包括Apriori算法、FP-growth 算法以及Eclat 算法,后續的大部分算法都是在這三類算法的基礎上進行相應的優化和改進。
Apriori 算法使用一種稱為逐層搜索的迭代方法,通過項目集元素數目的不斷增長來逐步完成頻繁項集的發現,核心思想是通過候選集生成和情節的向下封閉檢測兩個階段來挖掘頻繁項集,該算法設計思想簡單,易于實現,但是產生了大量候選集,同時需要多次對事務庫進行掃描,計算耗時過長;FP-growth 算法使用一種稱為頻繁模式增長的方法,采取分治策略,將代表頻繁項集的數據庫壓縮到一棵頻繁模式樹(FP 樹)上,然后把這種壓縮后的數據庫劃分成條件數據庫,每個數據庫關聯一個頻繁項或“模式段”,并分別挖掘每個條件數據庫,這種方法可以顯著地壓縮被搜索的數據集的大小,該算法只掃描事務庫兩次,且無需產生候選集,相比Apriori 算法性能有顯著的提高,但由于所有項集都壓縮在一棵樹上,對內存要求較高,且遞歸算法設計復雜;Eclat 算法[4]的核心思想是將水平數據庫轉換成垂直數據庫,然后將項集的TID_set 進行交運算來得到項集的支持度,該算法由于只掃描一次事務庫,且項集支持度是通過交運算得到的,大大減少了計算時間,但Eclat 算法存在搜索空間大、連接操作頻繁、求交運算耗時的問題。
本文選取上述幾類算法中性能較好的Eclat 算法,結合近年來該算法的相關研究,針對其普遍存在的問題和不足,從候選集的生成和支持度的計算兩個方面對其加以優化和改進,提出了前后剪枝相結合的候選集優化策略以及利用數組索引取值計數的求交運算方法,以達到提高Eclat 算法效率的目的。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
- 基于改进郊狼优化算法的浅层神经网络进化15次下载
- 基于ReliefF剪枝的多标记分类算法综述12次下载
- 改进鲸鱼优化算法在路径规划的应用综述15次下载
- 改进胶囊网络优化分成卷积的亚健康识别7次下载
- 基于改进自适应权重的立体匹配优化算法3次下载
- 基于改进的蝗虫优化算法的LSTM预测方法7次下载
- 一种改进的聚类联合相似度推荐算法10次下载
- 一种改进的花朵授粉算法的WEB服务组合优化7次下载
- 一种改进的哈里斯鹰优化定位算法6次下载
- 嵌入式设备的YOLO网络剪枝算法4次下载
- 基于深度神经网络的结构化剪枝算法2次下载
- 关于蚁群算法的改进优化(源程序)资料下载5次下载
- 基于改进果蝇优化算法的雷电定位研究_郭小红0次下载
- 一种改进的神经网络相关性剪枝算法0次下载
- 基于平均单元格的三角网格曲面快速求交算法12次下载
- 基于DBFP与DB-Attn的算法硬件协同优化方案671次阅读
- 谷歌搜索引擎优化的各个方面和步骤1131次阅读
- Mysql索引是什么东西?索引有哪些特性?索引是如何工作的?1681次阅读
- 边缘计算计算卸载与资源分配联合优化算法1423次阅读
- 如何对spmv算法进行优化1411次阅读
- 用于实现并行处理加速硬件的H.264算法的改进和优化2376次阅读
- 大数据是如何优化企业搜索引擎2321次阅读
- 什么是决策树?决策树算法思考总结11647次阅读
- 基于动态矩阵方法改进了传统CACC模型预测控制算法6788次阅读
- 数据集,网络架构和剪枝方法6022次阅读
- 数据挖掘算法:决策树算法如何学习及分裂剪枝5931次阅读
- K-means的优缺点及改进32507次阅读
- 关联规则挖掘——Apriori算法的基本原理以及改进9524次阅读
- 配电网络重构的改进混合遗传算法1193次阅读
- 基于改进模拟退火算法的电网无功优化830次阅读
下載排行
本周
- 1STM32開發板教程之STM32開發指南免費下載
- 24.88 MB | 176次下載 | 3 積分
- 2EN60335-1安規標準 中文版本
- 1.86 MB | 52次下載 | 1 積分
- 3LT7406FJ N溝道增強型功率MOSFET規格書
- 1.38 MB | 2次下載 | 免費
- 4米爾-瑞芯微RK3562核心板開發板,4核CPU,ARM中量級多面手
- 3.45 MB | 2次下載 | 免費
- 5LTS6802FJCB N溝道增強型功率MOSFET規格書
- 1.00 MB | 1次下載 | 免費
- 6運算放大電路入門教程
- 0.70 MB | 1次下載 | 免費
- 7開源鴻蒙版真4K顯示器廣告機主板AIoT-6780SE彩頁
- 613.79 KB | 1次下載 | 免費
- 8LTS6804FJN溝道增強型功率MOSFET規格書
- 0.99 MB | 次下載 | 免費
本月
- 1STM32CubeMX用于STM32配置和初始化C代碼生成
- 21.90 MB | 619次下載 | 免費
- 2STM32開發板教程之STM32開發指南免費下載
- 24.88 MB | 176次下載 | 3 積分
- 3DeepSeek:從入門到精通
- 5.36 MB | 95次下載 | 1 積分
- 4EN60335-1安規標準 中文版本
- 1.86 MB | 52次下載 | 1 積分
- 5OAH0428最新規格書(中文)
- 2.52 MB | 27次下載 | 10 積分
- 6UHV系列雷電沖擊電壓發生器試驗裝置詳細說明使用
- 1.07 MB | 17次下載 | 免費
- 7Altium-常用3D封裝庫(Step)接插件篇
- 4.95 MB | 14次下載 | 免費
- 8介紹一些常用的電子元器件
- 3.20 MB | 8次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935124次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關降壓/升壓雙向直流/直流轉換器 PCB layout 設計
- 1.48MB | 420063次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233088次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費下載
- 340992 | 191371次下載 | 10 積分
- 5十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183336次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81583次下載 | 10 積分
- 7Keil工具MDK-Arm免費下載
- 0.02 MB | 73814次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65988次下載 | 10 積分
評論