資料介紹
提出了一種多密度網格聚類算法GDD。該算法主要采用密度閾值遞減的多階段聚類技術提取不同密
度的聚類,使用邊界點處理技術提高聚類精度,同時對聚類結果進行了人工干預。GDD 算法只要求
對數(shù)據集進行一遍掃描。實驗表明,該算法可擴展性好,能處理任意形狀和大小的聚類,能夠很好
的識別出孤立點或噪聲,在處理多密度聚類方面有很好的精度。
關鍵詞:密度閾值遞減;多階段聚類;邊界點提取
聚類是數(shù)據挖掘中的一種重要技術,它的目標是將數(shù)據集分成若干個子集,同一個子集
中的對象是相似的,不同子集中的對象不相似。在幾何方面,聚類是在整個數(shù)據集中確定由
稀疏區(qū)域分開的密集區(qū)域。由于其無指導學習能力,聚類算法能在數(shù)據集中發(fā)現(xiàn)隱藏的數(shù)據模式,所以對聚類算法的研究一直很活躍。基于相似性已經有很多聚類算法,這些聚類算法大體上可分為基于劃分的聚類算法、基于密度的聚類算法、基于層次的聚類算法和基于網格的聚類算法等。其中基于網格的聚類算法由于只考慮網格單元而不是考慮每個點,它的計算效率比較高。基于網格的聚類算法認為:當網格劃分的比較細時,每個網格內的點可看作是相似的。但是對多密度的數(shù)據集,這些算法很難得到滿意的聚類結果。本文的主要目的就是利用網格技術解決對多密度數(shù)據集的聚類。
聚類分析所使用的數(shù)據集中,各個類的密集往往不盡相同,甚至差別很大。大多數(shù)現(xiàn)有
的聚類算法都是致力于如何發(fā)現(xiàn)任意形狀和大小的類,但很難有效的處理密度差別較大的數(shù)據集。能夠處理多密度數(shù)據集的聚類算法有Chameleon[1]、共享近鄰SNN 算法[2]、多階段等密度線算法[3]等。
Chameleon 算法可以用來處理多密度的數(shù)據集,但當數(shù)據集較大時其算法的時間復雜度
太高。共享近鄰SNN 算法的主要思想是:對于數(shù)據集中每個點,找出距離其最近的K 個鄰近點,形成一個集合。然后考慮數(shù)據集中的任意兩個點,若對應于這兩個點的K 個鄰近點集合交集部分的點數(shù)超過一個閾值,則將這兩個點歸于一類。SNN 算法的優(yōu)點是可以對不同密度和形狀的數(shù)據集進行聚類,缺點是在多密度聚類和處理孤立點或噪聲方面精度都不高(見圖1(a)和圖2(a))。多階段等密度線算法采用多階段的方式,利用等密度線的思想對數(shù)據集進行聚類,它的缺點是不能有效地分離出多個類。文獻[2]給出了SNN 算法和一些現(xiàn)有的聚類算法的比較結果,結果表明SNN 算法表現(xiàn)出了較好的性能。本文只給出GDD 算法和SNN 算法聚類結果的比較,從比較結果可以看出GDD 算法在多密度聚類、孤立點或噪聲處理方面顯示出了很高的精度。
現(xiàn)有的聚類算法大都忽視了聚類過程中的人工參與,很難在聚類過程中充分利用專家
關于領域的知識指導聚類過程,所以得不到滿意的聚類結果。在GDD 算法中,對聚類結果就進行了人工干預。
度的聚類,使用邊界點處理技術提高聚類精度,同時對聚類結果進行了人工干預。GDD 算法只要求
對數(shù)據集進行一遍掃描。實驗表明,該算法可擴展性好,能處理任意形狀和大小的聚類,能夠很好
的識別出孤立點或噪聲,在處理多密度聚類方面有很好的精度。
關鍵詞:密度閾值遞減;多階段聚類;邊界點提取
聚類是數(shù)據挖掘中的一種重要技術,它的目標是將數(shù)據集分成若干個子集,同一個子集
中的對象是相似的,不同子集中的對象不相似。在幾何方面,聚類是在整個數(shù)據集中確定由
稀疏區(qū)域分開的密集區(qū)域。由于其無指導學習能力,聚類算法能在數(shù)據集中發(fā)現(xiàn)隱藏的數(shù)據模式,所以對聚類算法的研究一直很活躍。基于相似性已經有很多聚類算法,這些聚類算法大體上可分為基于劃分的聚類算法、基于密度的聚類算法、基于層次的聚類算法和基于網格的聚類算法等。其中基于網格的聚類算法由于只考慮網格單元而不是考慮每個點,它的計算效率比較高。基于網格的聚類算法認為:當網格劃分的比較細時,每個網格內的點可看作是相似的。但是對多密度的數(shù)據集,這些算法很難得到滿意的聚類結果。本文的主要目的就是利用網格技術解決對多密度數(shù)據集的聚類。
聚類分析所使用的數(shù)據集中,各個類的密集往往不盡相同,甚至差別很大。大多數(shù)現(xiàn)有
的聚類算法都是致力于如何發(fā)現(xiàn)任意形狀和大小的類,但很難有效的處理密度差別較大的數(shù)據集。能夠處理多密度數(shù)據集的聚類算法有Chameleon[1]、共享近鄰SNN 算法[2]、多階段等密度線算法[3]等。
Chameleon 算法可以用來處理多密度的數(shù)據集,但當數(shù)據集較大時其算法的時間復雜度
太高。共享近鄰SNN 算法的主要思想是:對于數(shù)據集中每個點,找出距離其最近的K 個鄰近點,形成一個集合。然后考慮數(shù)據集中的任意兩個點,若對應于這兩個點的K 個鄰近點集合交集部分的點數(shù)超過一個閾值,則將這兩個點歸于一類。SNN 算法的優(yōu)點是可以對不同密度和形狀的數(shù)據集進行聚類,缺點是在多密度聚類和處理孤立點或噪聲方面精度都不高(見圖1(a)和圖2(a))。多階段等密度線算法采用多階段的方式,利用等密度線的思想對數(shù)據集進行聚類,它的缺點是不能有效地分離出多個類。文獻[2]給出了SNN 算法和一些現(xiàn)有的聚類算法的比較結果,結果表明SNN 算法表現(xiàn)出了較好的性能。本文只給出GDD 算法和SNN 算法聚類結果的比較,從比較結果可以看出GDD 算法在多密度聚類、孤立點或噪聲處理方面顯示出了很高的精度。
現(xiàn)有的聚類算法大都忽視了聚類過程中的人工參與,很難在聚類過程中充分利用專家
關于領域的知識指導聚類過程,所以得不到滿意的聚類結果。在GDD 算法中,對聚類結果就進行了人工干預。
下載該資料的人也在下載
下載該資料的人還在閱讀
更多 >
- 基于群組和密度的大規(guī)模軌跡聚類算法 2次下載
- 基于網格多密度聚類的古建筑圖像特征匹配方法 3次下載
- 一種基于自然最近鄰的密度峰值聚類算法 12次下載
- 基于MapReduce和加權網絡信息熵的DBWGIE-MR算法 11次下載
- 一種自適應的關聯(lián)融合聚類算法 13次下載
- 基于核誘導的不完整多視覺聚類算法KIMV 5次下載
- 可檢測出租車載客的軌跡聚類算法 13次下載
- 如何使用拉普拉斯中心性和密度峰值進行無參數(shù)聚類算法的研究 12次下載
- 如何融合密度峰值進行高斯混合模型聚類算法概述 2次下載
- 如何使用多維網格空間進行改進K-means聚類算法資料概述 1次下載
- 聚類算法及聚類融合算法研究 33次下載
- 基于網格的帶有參考參數(shù)的聚類算法
- 基于搜索機制密度聚類的支持向量預選取算法
- 基于模糊聚類思想的網格獨立任務調度算法
- 基于不均勻密度的自動聚類算法
- 使用輪廓分數(shù)提升時間序列聚類的表現(xiàn) 587次閱讀
- 一文弄懂數(shù)據挖掘的十大算法,數(shù)據挖掘算法原理講解 1138次閱讀
- 如何在 Python 中安裝和使用頂級聚類算法 613次閱讀
- 代碼實現(xiàn)密度聚類DBSCAN 718次閱讀
- 10種頂流聚類算法Python實現(xiàn)(附完整代碼) 1617次閱讀
- 10種聚類介紹和Python代碼 3156次閱讀
- 基于距離的聚類算法K-means的設計實現(xiàn) 2348次閱讀
- 淺析四類機器學習在自動駕駛中的應用 5605次閱讀
- 關于TD Learning算法的分析 1920次閱讀
- Python無監(jiān)督學習的幾種聚類算法包括K-Means聚類,分層聚類等詳細概述 3w次閱讀
- 機器學習中五種常用的聚類算法 3.8w次閱讀
- 淺談Matlab中的聚類分析 Matlab聚類程序的設計 7382次閱讀
- 一種基于MapReduce模型的并行化k-medoids聚類算法 5377次閱讀
- 基于密度DBSCAN的聚類算法 2.1w次閱讀
- k means聚類算法實例 1.5w次閱讀
下載排行
本周
- 1DC電源插座圖紙
- 0.67 MB | 2次下載 | 免費
- 2AN158 GD32VW553 Wi-Fi開發(fā)指南
- 1.51MB | 2次下載 | 免費
- 3AN148 GD32VW553射頻硬件開發(fā)指南
- 2.07MB | 1次下載 | 免費
- 4AN111-LTC3219用戶指南
- 84.32KB | 次下載 | 免費
- 5AN153-用于電源系統(tǒng)管理的Linduino
- 1.38MB | 次下載 | 免費
- 6AN-283: Σ-Δ型ADC和DAC[中文版]
- 677.86KB | 次下載 | 免費
- 7SM2018E 支持可控硅調光線性恒流控制芯片
- 402.24 KB | 次下載 | 免費
- 8AN-1308: 電流檢測放大器共模階躍響應
- 545.42KB | 次下載 | 免費
本月
- 1ADI高性能電源管理解決方案
- 2.43 MB | 450次下載 | 免費
- 2免費開源CC3D飛控資料(電路圖&PCB源文件、BOM、
- 5.67 MB | 138次下載 | 1 積分
- 3基于STM32單片機智能手環(huán)心率計步器體溫顯示設計
- 0.10 MB | 130次下載 | 免費
- 4使用單片機實現(xiàn)七人表決器的程序和仿真資料免費下載
- 2.96 MB | 44次下載 | 免費
- 53314A函數(shù)發(fā)生器維修手冊
- 16.30 MB | 31次下載 | 免費
- 6美的電磁爐維修手冊大全
- 1.56 MB | 24次下載 | 5 積分
- 7如何正確測試電源的紋波
- 0.36 MB | 17次下載 | 免費
- 8感應筆電路圖
- 0.06 MB | 10次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935121次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關降壓/升壓雙向直流/直流轉換器 PCB layout 設計
- 1.48MB | 420062次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233088次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費下載
- 340992 | 191367次下載 | 10 積分
- 5十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183335次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81581次下載 | 10 積分
- 7Keil工具MDK-Arm免費下載
- 0.02 MB | 73810次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65988次下載 | 10 積分
評論
查看更多