色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

聚類分析基本概念梳理

倩倩 ? 來源:網絡整理 ? 2018-02-24 08:43 ? 次閱讀

聚類分析:簡稱聚類(clustering),是一個把數據對象劃分成子集的過程,每個子集是一個簇(cluster),使得簇中的對象彼此相似,但與 其他簇中的對象不相似。聚類成為自動分類,聚類可以自動的發現這些分組,這是突出的優點。

聚類分析是沒有給定劃分類別的情況下,根據樣本相似度進行樣本分組的一種方法,是一種非監督的學習算法。聚類的輸入是一組未被標記的樣本,聚類根據數據自身的距離或相似度劃分為若干組,劃分的原則是組內距離最小化而組間距離最大化,如下圖所示:

聚類分析基本概念梳理

常見的聚類分析算法如下:

K-Means: K-均值聚類也稱為快速聚類法,在最小化誤差函數的基礎上將數據劃分為預定的類數K。該算法原理簡單并便于處理大量數據。

K-中心點:K-均值算法對孤立點的敏感性,K-中心點算法不采用簇中對象的平均值作為簇中心,而選用簇中離平均值最近的對象作為簇中心。

系統聚類:也稱為層次聚類,分類的單位由高到低呈樹形結構,且所處的位置越低,其所包含的對象就越少,但這些對象間的共同特征越多。該聚類方法只適合在小數據量的時候使用,數據量大的時候速度會非常慢。

基本概念梳理

監督學習:分類成為監督學習(supervised learning),因為給定了類標號的信息,即學習算法是監督的,因為它被告知每個訓練元素的 類隸屬關系。

無監督學習(unsupervised learning):因為沒有提供類標號信息。

數據挖掘對聚類的典型要求如下:可伸縮性、處理不同屬性類的能力、發現任意形狀的簇、處理噪聲數據的能力、簇的分離性

基本聚類方法描述:

1.劃分方法:(這是聚類分析最簡單最基本的方法)采取互斥簇的劃分,即每個對象必須恰好屬于一個組。劃分方法是基于距離的,給定要構建的分區數k,劃分方法首先創建一個初始劃分,然后它采用一種迭代的重定位技術,通過把對象從一個組移動到另一個組來改進劃分。一個好的劃分準則是:同一個簇中的相關對象盡可能相互“接近”或相關,而不同簇中的對象盡可能地“遠離”或不同。(什么是啟發式方法?啟發式方法指人在解決問題時所采取的一種根據經驗規則進行發現的方法。其特點是在解決問題時,利用過去的經驗,選擇已經行之有效的方法,而不是系統地、以確定的步驟去尋求答案。 如k-均值(k-means)和k-中心點(k-mediods)方法)。

2.層次方法:層次方法創建給定數據對象集的層次分解。層次方法可以分為凝聚和分裂的方法。凝聚的方法,也稱自底向上的方法,開始將每個對象作為單獨的一組,然后逐次合并相近的對象或組,直到所有的組合并成為一個組。分裂的方法,也成為自頂向下的方法,開始將所有的對象置于一個簇中,在每次的迭代中,一個簇被劃分為更小的簇,直到每個最終每個對象在單獨的一個簇中。

3.基于密度的方法:大部分劃分方法基于對象之間的距離進行聚類,這樣的方法只能發現球狀簇,而在發現任意形狀簇時遇到了困難。已經開發的基于密度的聚類方法,其主要思想是:只要“鄰域”中的密度(對象或數據點的數目)超過了某個閾值(用戶自定義),就繼續增長給定的簇。

4.基于網格的方法:把對象空間量化為有限個單元,形成一個網格結構。所有的聚類操作都在這個網格上進行。這種方法的主要優點是處理速度快。

劃分方法:

k-均值方法是怎樣工作的:k-均值方法把簇的形心定義為簇內點的均值。流程如下:在D中隨機的選擇k個對象,每個對象代表一個簇的初始均值或中心。對剩下的每個對象,根據其各個簇中心的歐氏距離,將它分配到最相似的簇。然后該算法迭代的改善簇內變差。對于每個簇,它使用上次迭代分配到該簇的對象,計算新的均值。然后使用更新后的均值作為新的簇中心,重新分配所有對象。這個過程被稱為迭代的重定位(iterative relocation)。 缺點:對利群點比較敏感。

k-均值算法流程:

1.從數據集D中選擇k個對象作為初始簇的中心

2.根據簇中對象的均值,將每個對象分配到最相似的簇。然后更新簇的均值,也就是重新計算每個簇的對象的均值。直到簇中的均值不再發生變化時算法結束

k-中心點算法對k-均值方法的優化:為了降低k-均值算法對離群點的敏感性,研究了k-中心點方法。我們可以不采用簇中對象的均值作為參考點,而是使用實際對象來代表簇,每個簇使用一個代表對象。其余每個對象被分配到與其最為相似的代表性對象所在的簇中。

k-中心點算法:從數據集D中隨機選擇k個對象作為初始的代表對象或種子 2.將每個剩余的對象分配到最近的代表對象所代表的簇,并隨機的選擇一個非代表對象o并計算用o代替代表對象oj的總代價S,如果S《0,則o替換oj,形成新的k個代表對象的集合 3.當簇內的成員不再發生變化時則結束算法。

k-means VS k-mediods:當存在噪聲利群點時,k-中心點方法比k-均值方法更棒,這是因為中心點不像均值那樣容易受到利群點或其他極端值的影響。然而k-中心點每次迭代的復雜度是O(k(n-k)^2) 。當n合k比較大時,這種計算開銷變得相當大,遠高于k-均值方法。

基于密度的方法:

DBSCAN(一重基于高密度連通區域的基于密度的聚類):該算法找出核心對象,也就是其鄰域稠密的對象。它連接核心對象和它們的鄰域,形成稠密區域作為簇。

DBSCAN如何確定對象的鄰域?:用戶先指定一個參數e》0用來指定每個對象的鄰域半徑。對象o的e-鄰域是以o為中心、以e為半徑的空間。

DBSCAN算法流程:

1.首先標記所有的對象為“未探索”

2.然后隨機選擇一個為探索的對象p并標記為“已探索”

3.如果p的e-鄰域至少有MinPts(鄰域密度閾值)個對象,則創建一個新的簇C,并把p添加到C中,并把它們記作N,遍歷N中的每個成員p‘,如果p’的鄰域也至少有MinPts個對象則保留,否則把p‘從N中刪除。

4.否則標記p為噪聲 5.直到把所有的對象都遍歷完為止

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 聚類分析
    +關注

    關注

    0

    文章

    16

    瀏覽量

    7424
收藏 人收藏

    評論

    相關推薦

    開關電源的基本概念分析方法

    開關電源的基本概念分析方法
    發表于 08-05 21:27

    Fpga Cpld的基本概念

    Fpga Cpld的基本概念
    發表于 08-20 17:14

    C語言基本概念

    C語言基本概念
    發表于 08-01 02:00

    Matlab提供的兩種聚類分析

    Matlab提供的兩種聚類分析提供源程序代碼
    發表于 04-29 11:21

    RAM技術的基本概念

    目前的鐵路和電力及航空航天等多個行業已紛紛推行系統可靠性分析RAM技術,研發最佳的設備運行維護方案,從而消除設備隱患,避免設備事故發生,降低裝置非計劃停工次數和設備運行維護費用,促進裝置安全長周期運行,具有重要的現實意義。本文主要概括介紹RAM技術的基本概念
    發表于 12-16 07:04

    STM32的中斷系統基本概念

    STM32 中斷系統概述筆記(一)中斷概述中斷相關的基本概念STM32的中斷系統基本概念:NVIC 嵌套向量中斷控制器中斷通道中斷優先級優先級分組EXTI 外部中斷控制器三種外部中斷觸發方式引腳分組
    發表于 01-07 07:32

    無線定位基本概念與原理

    無線定位基本概念簡介,以及其原理分析
    發表于 11-11 18:01 ?147次下載

    電路的基本概念和基本定理

    一、電路的基本概念和基本定理 二、電阻電路的分析方法 三、動態電路 四、正弦穩態電路
    發表于 07-03 08:59 ?0次下載

    詳細介紹時序基本概念Timing arc

    時序分析基本概念介紹——Timing Arc
    的頭像 發表于 01-02 09:29 ?2.4w次閱讀
    詳細介紹時序<b class='flag-5'>基本概念</b>Timing arc

    spss聚類分析樹狀圖

    借助主成分得分對河南省各市進行聚類分析。在進行聚類分析時,指標越多就會使樣品間的共性顯示得越少,太多的指標會使計算出的樣品間的距離偏大,從而不利于樣品間相似性的綜合和聚類分析的進行,往往達不到所想
    的頭像 發表于 02-12 15:59 ?4.8w次閱讀

    基于Python的聚類分析及其應用簡介

    基于Python的聚類分析及其應用簡介。
    發表于 05-28 10:54 ?8次下載

    FPGA設計中時序分析基本概念

    時序分析時FPGA設計中永恒的話題,也是FPGA開發人員設計進階的必由之路。慢慢來,先介紹時序分析中的一些基本概念
    的頭像 發表于 03-18 11:07 ?2765次閱讀

    介紹時序分析基本概念lookup table

    今天要介紹的時序分析基本概念是lookup table。中文全稱時序查找表。
    的頭像 發表于 07-03 14:30 ?1613次閱讀
    介紹時序<b class='flag-5'>分析</b>的<b class='flag-5'>基本概念</b>lookup table

    介紹時序分析基本概念MMMC

    今天我們要介紹的時序分析基本概念是MMMC分析(MCMM)。全稱是multi-mode, multi-corner, 多模式多端角分析模式。這是在先進工藝下必須要使用的一種時序
    的頭像 發表于 07-04 15:40 ?2754次閱讀
    介紹時序<b class='flag-5'>分析</b><b class='flag-5'>基本概念</b>MMMC

    時序分析Slew/Transition基本概念介紹

    今天要介紹的時序分析基本概念是Slew,信號轉換時間,也被稱為transition time。
    的頭像 發表于 07-05 14:50 ?3472次閱讀
    時序<b class='flag-5'>分析</b>Slew/Transition<b class='flag-5'>基本概念</b>介紹
    主站蜘蛛池模板: 亚洲m男在线中文字幕 | 久久精品动漫99精品动漫 | 学生无码AV一区二区三区 | 国产成人精品午夜福麻豆报告 | 俄罗斯另类Z0Z0ZOZO | 99无码熟妇丰满人妻啪啪 | 灌饱娇嫩H将军公主最新章节 | 天美传媒MV高清免费看 | 扒开她的黑森林让我添动态图 | 久久亚洲人成网站 | 成人免费视频网站www | 古代又黄又肉到湿的爽文 | 国产色婷亚洲99精品AV | 日本福利片午夜免费观着 | 中字幕视频在线永久在线 | 久热这里只有精品99国产6 | 一二三四在线观看韩国 | 日本人添下面的全过程 | 最近更新2019中文字幕免费 | 5G年龄确认我已满18免费 | 蜜柚在线观看免费高清官网视频 | 男人被绑着强行摸j | 扒开她的黑森林让我添动态图 | 乌克兰美女x?x?y?y | 用快播看黄的网站 | 久久伊人在 | 国产成人AV永久免费观看 | 国产精品久久久久永久免费看 | 亚洲国产欧美日韩在线一区 | 日本片bbbxxx| 99热这里只有是精品 | 精品国产乱码久久久久久软件 | 波多野结衣的AV一区二区三区 | 亚洲国产欧美日韩在线一区 | 男同志video最新猛男 | 久久精品亚洲国产AV涩情 | 年轻的朋友4在线看中文字幕 | 最新精品学生国产自在现拍 | 亚洲AV无码国产精品色午夜情 | 伊人久久大香线蕉资源 | 亚洲国产精品日本无码网站 |