聚類(lèi)分析是多元統(tǒng)計(jì)分析的一種,也是無(wú)監(jiān)督模式識(shí)別的一個(gè)重要分支,在模式分類(lèi) 圖像處理和模糊規(guī)則處理等眾多領(lǐng)域中獲得最廣泛的應(yīng)用。它把一個(gè)沒(méi)有類(lèi)別標(biāo)記的樣本按照某種準(zhǔn)則劃分為若干子集,使相似的樣本盡可能歸于一類(lèi),而把不相似的樣本劃分到不同的類(lèi)中。硬聚類(lèi)把每個(gè)待識(shí)別的對(duì)象嚴(yán)格的劃分某類(lèi)中,具有非此即彼的性質(zhì),而模糊聚類(lèi)建立了樣本對(duì)類(lèi)別的不確定描述,更能客觀的反應(yīng)客觀世界,從而成為聚類(lèi)分析的主流。
模糊聚類(lèi)算法是一種基于函數(shù)最優(yōu)方法的聚類(lèi)算法,使用微積分計(jì)算技術(shù)求最優(yōu)代價(jià)函數(shù),在基于概率算法的聚類(lèi)方法中將使用概率密度函數(shù),為此要假定合適的模型,模糊聚類(lèi)算法的向量可以同時(shí)屬于多個(gè)聚類(lèi),從而擺脫上述問(wèn)題。
模糊聚類(lèi)分析算法大致可分為三類(lèi)
1)分類(lèi)數(shù)不定,根據(jù)不同要求對(duì)事物進(jìn)行動(dòng)態(tài)聚類(lèi),此類(lèi)方法是基于模糊等價(jià)矩陣聚類(lèi)的,稱(chēng)為模糊等價(jià)矩陣動(dòng)態(tài)聚類(lèi)分析法。
2)分類(lèi)數(shù)給定,尋找出對(duì)事物的最佳分析方案,此類(lèi)方法是基于目標(biāo)函數(shù)聚類(lèi)的,稱(chēng)為模糊C均值聚類(lèi)。
3)在攝動(dòng)有意義的情況下,根據(jù)模糊相似矩陣聚類(lèi),此類(lèi)方法稱(chēng)為基于攝動(dòng)的模糊聚類(lèi)分析法
模糊的c均值聚類(lèi)算法:-------- 一種模糊聚類(lèi)算法,是k均值聚類(lèi)算法的推廣形式,隸屬度取值為[0 1]區(qū)間內(nèi)的任何一個(gè)數(shù),提出的基本根據(jù)是“類(lèi)內(nèi)加權(quán)誤差平方和最小化”準(zhǔn)則;
模糊C 均值聚類(lèi)算法(FCM,F(xiàn)uzzy c-means) 是從硬C 均值聚類(lèi)算法發(fā)展而來(lái)(HCM,Hardc-means )。
硬C劃分和模糊C 劃分
FCM算法原理
FCM 算法步驟
給定聚類(lèi)類(lèi)別數(shù)C,設(shè)定迭代收斂條件,初始化各個(gè)聚類(lèi)中心;
(1)重復(fù)下面的運(yùn)算,直到各個(gè)樣本的隸屬度值穩(wěn)定:
(2)用當(dāng)前的聚類(lèi)中心根據(jù)公式(6) 計(jì)算隸屬度函數(shù);
A.用當(dāng)前的隸屬度函數(shù)根據(jù)公式(5) 重新計(jì)算各個(gè)聚類(lèi)的中心。
B.當(dāng)算法收斂時(shí),就得到了各類(lèi)的聚類(lèi)中心和各個(gè)樣本對(duì)于各類(lèi)的隸屬度值,從而完成了模糊聚類(lèi)劃分。
算法實(shí)現(xiàn)
·采用VC++進(jìn)行編寫(xiě)
文檔的讀取
#include “data.h”
//函數(shù)定義
double **DataRead(char*name,int row,intcol)
{
double**p=new double* [row];
ifstreaminfile;
infile.open(name,ios::in);
for(inti=0;i《row;i++)
{
p[i]=newdouble[col];
for(intj=0;j《col;j++)
{
infile》》p[i][j];
}
}
infile.close();
cout《《“成功讀取數(shù)據(jù)文件:”《《name《《“!\n”;
returnp;
//釋放內(nèi)存
for(i=0;i《row;i++)
{
delete[]p[i];
}
delete[]p;
}
文檔的保存
#include “data.h”
void DataSave(double**data,int row,intcol,char*name)
{
inti,j;
ofstreamoutfile;
//打開(kāi)文件,輸出數(shù)據(jù)
outfile.open(name,ios::out);
outfile.setf(ios::fixed);
outfile.precision(4);
for(i=0;i《row;i++)
{
for(j=0;j《col;j++)
{
outfile《《data[i][j]《《“”;
}
outfile《《endl;
}
outfile《《endl《《endl;
outfile.close();
}
數(shù)據(jù)標(biāo)準(zhǔn)化處理
#include “data.h”
double **Standardize(double **data,introw,int col)
{
inti,j;
double*a=new double[col]; //矩陣每列的最大值
double*b=new double[col]; //矩陣每列的最小值
double*c=new double[row]; //矩陣列元素
for(i=0;i《col;i++)
{
//取出數(shù)據(jù)矩陣的各列元素
for(j=0;j《row;j++)
{
c[j]=Data[j][i];
}
a[i]=c[0],b[i]=c[0];
for(j=0;j《row;j++)
{
//取出該列的最大值
if(c[j]》a[i])
{
a[i]=c[j];
}
//取出該列的最小值
if(c[j]《b[i])
{
b[i]=c[j];
}
}
}
//數(shù)據(jù)標(biāo)準(zhǔn)化
for(i=0;i《row;i++)
{
for(j=0;j《col;j++)
{
data[i][j]=(data[i][j]-b[j])/(a[j]-b[j]);
}
}
cout《《“完成數(shù)據(jù)極差標(biāo)準(zhǔn)化處理!\n”;
delete[]a;
delete[]b;
delete[]c;
returndata;
}
生成樣本慮屬矩陣
#include “data.h”
void Initialize(double **u, int k, introw)
{
inti,j;
//初始化樣本隸屬度矩陣
srand(time(0));
for(i=0;i《k;i++)
{
for(j=0;j《row;j++)
{
u[i][j]=(double)rand()/RAND_MAX;//得到一個(gè)小于1的小數(shù)隸屬度
}//rand()函數(shù)返回0和RAND_MAX之間的一個(gè)偽隨機(jī)數(shù)
}
}
數(shù)據(jù)歸一化處理
#include “data.h”
void Normalize(double **u,int k,intcol)
{
inti,j;
double*sum=new double[col];
//矩陣U的各列元素之和
for(j=0;j《col;j++)
{
doubledj=0;
for(i=0;i《k;i++)
{
dj=dj+U[i][j];
sum[j]=dj;//隸屬度各列之和
}
}
for(i=0;i《k;i++)
{
for(j=0;j《col;j++)
{
u[i][j]=U[i][j]/sum[j];
}//規(guī)一化處理(每列隸屬度之和為1)
}
}
迭代過(guò)程
#include “data.h”
#include “func.h”//對(duì)模糊C均值進(jìn)行迭代運(yùn)算,并返回有效性評(píng)價(jià)函數(shù)的值
doubleUpdate(double**u,double**data,double**center,int row,int col, int k)
{
inti,j,t;
double**p=NULL;
for(i=0;i《k;i++)
{
for(j=0;j《row;j++)
{
//模糊指數(shù)取2
u[i][j]=pow(u[i][j],2);
}
}
//根據(jù)隸屬度矩陣計(jì)算聚類(lèi)中心
p=MatrixMul(u,k,row,data,row,col);
for(i=0;i《k;i++)
{
//計(jì)算隸屬度矩陣每行之和
doublesi=0;
for(j=0;j《row;j++)
{
si+=u[i][j];
}
for(t=0;t《col;t++)
{
center[i][t]=p[i][t]/si; //類(lèi)中心
}
}
//計(jì)算各個(gè)聚類(lèi)中心i分別到所有點(diǎn)j的距離矩陣dis(i,j)
double*a=new double[col]; //第一個(gè)樣本點(diǎn)
double*b=new double[col]; //第二個(gè)樣本點(diǎn)
double**dis=newdouble*[k]; //中心與樣本之間距離矩陣
for(i=0;i《k;i++)
{
dis[i]=newdouble[row];
}
for(i=0;i《k; i++)
{
//聚類(lèi)中心
for(t=0;t《col; t++)
{
a[t]=center[i][t]; //暫存類(lèi)中心
}
//數(shù)據(jù)樣本
for(j=0;j《row; j++)
{
for(t=0;t《col; t++)
{
b[t]=data[j][t];//暫存一樣本
}
doubled=0;
//中心與樣本之間距離的計(jì)算
for(t=0;t《col; t++)
{
d+=(a[t]-b[t])*(a[t]-b[t]); //d為一中心與所有樣本的距離的平方和
}
dis[i][j]=sqrt(d); //距離
}
}
//根據(jù)距離矩陣計(jì)算隸屬度矩陣
for(i=0;i《k;i++)
{
for(j=0;j《row;j++)
{
doubletemp=0;
for(t=0;t《k;t++)
{
//dis[i][j]依次除以所在列的各元素,加和;
//模糊指數(shù)為2.0
temp+=pow(dis[i][j]/dis[t][j],2/(2.0-1));//一個(gè)類(lèi)中心和一個(gè)元素的距離平方與
}
u[i][j]=1/temp;//所有類(lèi)與該元素距離平方的和的商
}
}
//計(jì)算聚類(lèi)有效性評(píng)價(jià)函數(shù)
doublefunc1=0;
for(i=0;i《k;i++)
{
doublefunc2=0;
for(j=0;j《row;j++)
{
func2+=pow(u[i][j],2.0)*pow(dis[i][j],2);
}
func1+=func2;
}
doubleobj_fcn=1/(1+func1);
returnobj_fcn;
//內(nèi)存釋放
delete[]a;
delete[]b;
for(i=0;i《k;i++)
{
delete[]dis[i];
}
delete[]dis;
}
詳細(xì)過(guò)程
#include “data.h”
#include “func.h”
#include “max.h”
//全局變量定義
double **Data; //數(shù)據(jù)矩陣
double **Center; //聚類(lèi)中心矩陣
double **U; //樣本隸屬度矩陣
int m; //樣本總數(shù)
int n; //樣本屬性數(shù)
int k; //設(shè)定的劃分類(lèi)別數(shù)
int main()
{
intLab; //數(shù)據(jù)文件標(biāo)號(hào)
intnum; //算法運(yùn)行次數(shù)
///////////////////////////////////////////////////////////////
cout《《“模糊C均值聚類(lèi)算法:”《《endl;
cout《《“1-iris.txt; 2-wine.txt; 3-ASD_12_2.txt; 4-ASD_14_2.txt”《《endl;
cout《《“請(qǐng)選擇數(shù)據(jù)集: Lab=”;
cin》》Lab;
cout《《“設(shè)定運(yùn)行次數(shù): mum=”;
cin》》num;
//各次運(yùn)行結(jié)束后的目標(biāo)函數(shù)
double*Index=new double[num];
//各次運(yùn)行結(jié)束后的聚類(lèi)正確率
double*R=new double [num];
//num次運(yùn)行的平均目標(biāo)函數(shù)及平均正確率
doubleM_Index=0;
doubleM_R=0;
//FCM聚類(lèi)算法運(yùn)行num次,并保存記錄與結(jié)果
for(inti=0;i《num;i++)
{
intj;
doubleepsilon=1e-4;
inte=0;
intnx=0;
//記錄連續(xù)無(wú)改進(jìn)次數(shù)
intE[200]={0};
if(i》0)
{
cout《《endl《《endl;
cout《《setfill(‘#’)《《setw(10)《《endl;
}
cout《《“第”《《i+1《《“次運(yùn)行記錄:”《《endl;
//讀取數(shù)據(jù)文件
if(Lab==1)
{
m=150;
n=4;
k=3;
Data=DataRead(“dataset\\iris.txt”,m,n);
}
elseif(Lab==2)
{
m=178;
n=13;
k=3;
Data=DataRead(“dataset\\wine.txt”,m,n);
}
elseif(Lab==3)
{
m=535;
n=2;
k=12;
Data=DataRead(“dataset\\ASD_12_2.txt”,m,n);
}
elseif(Lab==4)
{
m=685;
n=2;
k=14;
Data=DataRead(“dataset\\ASD_14_2.txt”,m,n);
}
//數(shù)據(jù)極差標(biāo)準(zhǔn)化處理
Data=Standardize(Data,m,n);
//聚類(lèi)中心及隸屬度矩陣,內(nèi)存分配
Center=newdouble*[k];
U=newdouble *[k];
for(j=0;j《k;j++)
{
Center[j]=newdouble[n];
U[j]=newdouble[m];
}
//隸屬度矩陣的初始化
Initialize(U,k, m);
//對(duì)隸屬度矩陣進(jìn)行歸一化
Normalize(U,k,m);
//歷次迭代過(guò)程中的目標(biāo)函數(shù)
doubleObjfcn[100]={0};
cout《《“第”《《i+1《《“次運(yùn)行記錄:”《《endl;
cout《《“開(kāi)始迭代過(guò)程!”《《endl;
cout《《“*******************************”《《endl;
//輸出精度為小數(shù)點(diǎn)后5位
cout.precision(5);
//固定格式
cout.setf(ios::fixed);
//目標(biāo)函數(shù)連續(xù)20代無(wú)改進(jìn),停止該次聚類(lèi)迭代過(guò)程
while(e《20)
{
nx++;
//聚類(lèi)迭代過(guò)程
Objfcn[nx]=Update(U,Data,Center,m,n,k);
//統(tǒng)計(jì)目標(biāo)函數(shù)連續(xù)無(wú)改進(jìn)次數(shù)e
if(nx》0&& Objfcn[nx]-Objfcn[nx-1]《epsilon )
{
e++;
}
else
{
e=0;
}
E[nx]=e;
}
//輸出結(jié)果到文件,保存
ofstreamoutfile(“運(yùn)行記錄.txt”,ios::app);
outfile《《“第”《《i+1《《“次運(yùn)行記錄:”《《endl;
outfile《《“開(kāi)始迭代過(guò)程!”《《endl;
outfile《《“*******************************”《《endl;
outfile.precision(5);
outfile.setf(ios::fixed);
for(intn1=1;n1《=nx;n1++)
{
cout《《“e[”《《setw(2)《《n1《《“]=”《《setw(2)《《E[n1]《《“ Objfcn[”
《《setw(2)《《n1《《“]=”《《Objfcn[n1]《《“\n”;
//保存數(shù)據(jù)文件
outfile《《“e[”《《setw(2)《《n1《《“]=”《《setw(2)《《E[n1]《《“ Objfcn[”
《《setw(2)《《n1《《“]=”《《Objfcn[n1]《《“\n”;
}
cout《《endl;
outfile《《endl;
outfile.close();
//本次運(yùn)行的最大目標(biāo)函數(shù)
Index[i]=Objfcn[nx];
//保存聚類(lèi)正確率,輸出聚類(lèi)結(jié)果:
R[i]=Result(Lab,U, k, m, i);
//內(nèi)存釋放
for(j=0;j《k;j++)
{
delete[]Center[j];
delete[]U[j];
}
delete[]Center;
delete[]U;
}
//////////////////////////統(tǒng)計(jì)平均///////////////////////////////////
doubletemp1=0, temp2=0;
for(i=0;i《num;i++)
{
temp1+=Index[i];
temp2+=R[i];
}
//計(jì)算各次結(jié)果的統(tǒng)計(jì)平均
M_Index=(double)temp1/num;
M_R=(double)temp2/num;
cout《《“//////////////////////////////////////////////////////////////”《《endl;
cout《《num《《“次運(yùn)行,平均聚類(lèi)正確率: ”《《100*M_R《《“%”《《endl;
//輸出精度為小數(shù)點(diǎn)后6位
cout.precision(6);
//固定格式
cout.setf(ios::fixed);
cout《《“平均目標(biāo)函數(shù):”《《M_Index《《endl;
//統(tǒng)計(jì)結(jié)果文件保存
ofstreamresultfile(“聚類(lèi)結(jié)果.txt”,ios::app);
resultfile《《“//////////////////////////////////////////////////////////////”《《endl;
resultfile《《num《《“次運(yùn)行,平均聚類(lèi)正確率: ”《《100*M_R《《“%”《《endl;
//輸出精度為小數(shù)點(diǎn)后6位
resultfile.precision(6);
//固定格式
resultfile.setf(ios::fixed);
resultfile《《“平均目標(biāo)函數(shù):”《《M_Index《《endl;
return0;
}
評(píng)論
查看更多