數據挖掘的功能
1、數據分類
數據分類為數據挖掘中常見的功能之一,顧名思義即是將分析對象依不同的屬性分類加以定義,建立不同的類組。數據挖掘中的分類是指針對未發生的結果進行預測分類,主要包括歸納和推論兩步驟,其主要目的在于提高分類的準確度,建立分類規則,再評估準則的優劣。常用“判定樹”算法。
2、數據估計
根據不同相關屬性數據的連續性數值,找出各屬性間的關聯性,以了解并獲得某一特定屬性未知的連續性數值,常用“回歸分析”及“類神經網絡算法”。
3、數據預測
預測工作的目的在于以其他屬性的值為基礎來預測特定屬性的值。而這個被預測屬性的值通常稱為目標變量或是因變量;而其他屬性則稱為解釋變量或自變量,預測的主要方法在于建立數據當中因變量與自變量間的關系。常用“回歸分析”“時間序列分析”及“類神經網絡”算法。
4、數據關聯分組
數據關聯分組主要用來發現數據中特征屬性間具有高度關聯性的一種模式,其所發現的模式通常是用規則來表現。常用“關聯規則(又稱購物藍分析)”算法。
5、數據聚類
數據聚類主要是利用數據中類似或相同的項目,將同構型較高的數據區隔為不同的聚類,聚類內數據相似度越高越好,聚類間差異度越大越好。在一大群的研究對象中,根據不同的研究目的必定會有異質化的現象,但異質化的現象可能是幾個同質化的群組所造成,數據聚類的主要目的便是將不同的同質化的組別差異找出來,常用“判別分析”與聚類分析“算法。
-
數據挖掘
+關注
關注
1文章
406瀏覽量
24287
發布評論請先 登錄
相關推薦
評論