本文介紹了廣義線(xiàn)性模型,其中線(xiàn)性回歸、logistic回歸,softmax回歸同屬于廣義線(xiàn)性模型。從指數(shù)分布家族推導(dǎo)出高斯分布、伯努利分布對(duì)應(yīng)的指數(shù)分布家族形式,以最大化期望為目標(biāo)推導(dǎo)出線(xiàn)性回歸、logistic回歸,softmax回歸的目標(biāo)函數(shù),進(jìn)一步強(qiáng)調(diào)模型的概率解釋性。
廣義線(xiàn)性模型
從線(xiàn)性回歸,logistic回歸,softmax回歸,最大熵的概率解釋來(lái)看,我們會(huì)發(fā)現(xiàn)線(xiàn)性回歸是基于高斯分布+最大似然估計(jì)的結(jié)果,logistic回歸是伯努利分布+對(duì)數(shù)最大似然估計(jì)的結(jié)果,softmax回歸是多項(xiàng)分布+對(duì)數(shù)最大似然估計(jì)的結(jié)果,最大熵是基于期望+對(duì)數(shù)似然估計(jì)的結(jié)果。前三者可以從廣義線(xiàn)性模型角度來(lái)看。
A、指數(shù)分布家族
指數(shù)分布家族是指可以表示為指數(shù)形式的概率分布,指數(shù)分布的形式如下:
其中是分布的自然參數(shù),是充分統(tǒng)計(jì)量,通常. 當(dāng)參數(shù)都固定的時(shí)候,就定義了一個(gè)以為參數(shù)的函數(shù)族。
實(shí)際上大多數(shù)的概率分布都屬于指數(shù)分布家族,比如:
1)伯努利分布 0-1問(wèn)題
2)二項(xiàng)分布,多項(xiàng)分布 多取值 多次試驗(yàn)
3)泊松分布 計(jì)數(shù)過(guò)程
4)伽馬分布與指數(shù)分布
5)分布
6)Dirichlet分布
7)高斯分布
現(xiàn)在我們將高斯分布和伯努利分布用指數(shù)分布家族的形式表示:
高斯分布:
對(duì)應(yīng)到指數(shù)分布家族有:
伯努利分布:
對(duì)應(yīng)到指數(shù)分布家族有:
B、廣義線(xiàn)性模型
在了解指數(shù)分布家族之后,我們?cè)賮?lái)看廣義線(xiàn)性模型的形式定義與假設(shè):
1)給定樣本x與參數(shù),樣本分類(lèi)y服從指數(shù)分布家族的某個(gè)分布。
2)給定一個(gè)x,我們目標(biāo)函數(shù)為:
3)
三條假設(shè),第一條是為了能在指數(shù)分布范圍內(nèi)討論y的概率,第二條假設(shè)是為了使得預(yù)測(cè)值服從均值為實(shí)際值得一個(gè)分布,第三條假設(shè)是為了設(shè)計(jì)的決策函數(shù)(模型)是線(xiàn)性的。
由高斯分布的指數(shù)家族分布形式與廣義線(xiàn)性模型的定義有線(xiàn)性回歸的模型為:
同樣由伯努利分布的指數(shù)家族分布形式與廣義線(xiàn)性模型的定義有l(wèi)ogistic回歸的模型為(解釋了為什么是sigmoid函數(shù)):
所以,在廣義線(xiàn)性模型中,決策函數(shù)為線(xiàn)性函數(shù)是基于廣義線(xiàn)性模型的第三條假設(shè),而最終的模型是依賴(lài)于模型服從什么樣的分布,比如 高斯分布,伯努利分布。
同樣,我們應(yīng)用logistic回歸到softmax回歸的一套定義,下面再來(lái)看多項(xiàng)分布對(duì)應(yīng)的softmax回歸:
其中是表示的概率,是一個(gè)指示函數(shù),為真是取值為,否則為,采用softmax中向量化的定義。
對(duì)應(yīng)到指數(shù)分布家族有:
由推出:
為了方便定義,由于多項(xiàng)分布所有值取值概率加和為1有:
所以有:
再由廣義線(xiàn)性模型的第二條假設(shè),同時(shí)將第三條線(xiàn)性假設(shè)帶入有:
最后由最大似然估計(jì)有softmax的目標(biāo)函數(shù)如下:
到此,廣義線(xiàn)性模型解釋線(xiàn)性回歸,logistic回歸,softmax回歸基本算完,可以看出線(xiàn)性函數(shù)是基于廣義線(xiàn)性模型的第三條假設(shè),采用sigmoid函數(shù)是因?yàn)椴植迹鴖oftmax回歸是logistic回歸高維推廣。
-
函數(shù)
+關(guān)注
關(guān)注
3文章
4345瀏覽量
62884 -
線(xiàn)性
+關(guān)注
關(guān)注
0文章
199瀏覽量
25182 -
模型
+關(guān)注
關(guān)注
1文章
3298瀏覽量
49075
原文標(biāo)題:【機(jī)器學(xué)習(xí)】知否?知否?廣義線(xiàn)性模型
文章出處:【微信號(hào):AI_Thinker,微信公眾號(hào):人工智能頭條】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論