色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

機器學習實戰之logistic回歸

454398 ? 來源:itpub技術棧 ? 作者:itpub技術棧 ? 2020-09-29 15:17 ? 次閱讀

logistic回歸是一種廣義的線性回歸,通過構造回歸函數,利用機器學習來實現分類或者預測。

原理

上一文簡單介紹了線性回歸,與邏輯回歸的原理是類似的。

預測函數(h)。該函數就是分類函數,用來預測輸入數據的判斷結果。過程非常關鍵,需要預測函數的“大概形式”, 比如是線性還是非線性的。 本文參考機器學習實戰的相應部分,看一下數據集。

// 兩個特征

-0.017612 14.053064 0

-1.395634 4.662541 1

-0.752157 6.538620 0

-1.322371 7.152853 0

0.423363 11.054677 0

0.406704 7.067335 1

如上圖,紅綠代表兩種不同的分類。可以預測分類函數大概是一條直線。Cost函數(損失函數):該函數預測的輸出h和訓練數據類別y之間的偏差,(h-y)或者其他形式。綜合考慮所有訓練數據的cost, 將其求和或者求平均,極為J函數, 表示所有訓練數據預測值和實際值的偏差。

顯然,J函數的值越小,表示預測的函數越準確(即h函數越準確),因此需要找到J函數的最小值。有時需要用到梯度下降。

具體過程

構造預測函數

邏輯回歸名為回歸,實際為分類,用于兩分類問題。 這里直接給出sigmoid函數。

接下來確定分類的邊界,上面有提到,該數據集需要一個線性的邊界。 不同數據需要不同的邊界。

確定了分類函數,將其輸入記做z ,那么

向量x是特征變量, 是輸入數據。此數據有兩個特征,可以表示為z = w0x0 + w1x1 + w2x2。w0是常數項,需要構造x0等于1(見后面代碼)。 向量W是回歸系數特征,T表示為列向量。 之后就是確定最佳回歸系數w(w0, w1, w2)。cost函數

綜合以上,預測函數為:

這里不做推導,可以參考文章 Logistic回歸總結

有了上述的cost函數,可以使用梯度上升法求函數J的最小值。推導見上述鏈接。

綜上:梯度更新公式如下:

接下來是python代碼實現:

# sigmoid函數和初始化數據

def sigmoid(z):

return 1 / (1 + np.exp(-z))

def init_data():

data = np.loadtxt(‘data.csv’)

dataMatIn = data[:, 0:-1]

classLabels = data[:, -1]

dataMatIn = np.insert(dataMatIn, 0, 1, axis=1) #特征數據集,添加1是構造常數項x0

return dataMatIn, classLabels

復制代碼

// 梯度上升

def grad_descent(dataMatIn, classLabels):

dataMatrix = np.mat(dataMatIn) #(m,n)

labelMat = np.mat(classLabels).transpose()

m, n = np.shape(dataMatrix)

weights = np.ones((n, 1)) #初始化回歸系數(n, 1)

alpha = 0.001 #步長

maxCycle = 500 #最大循環次數

for i in range(maxCycle):

h = sigmoid(dataMatrix * weights) #sigmoid 函數

weights = weights + alpha * dataMatrix.transpose() * (labelMat - h) #梯度

return weights

// 計算結果

if __name__ == ‘__main__’:

dataMatIn, classLabels = init_data()

r = grad_descent(dataMatIn, classLabels)

print(r)

輸入如下:

[[ 4.12414349]

[ 0.48007329]

[-0.6168482 ]]

上述w就是所求的回歸系數。w0 = 4.12414349, w1 = 0.4800, w2=-0.6168 之前預測的直線方程0 = w0x0 + w1x1 + w2x2, 帶入回歸系數,可以確定邊界。 x2 = (-w0 - w1*x1) / w2

畫出函數圖像:

def plotBestFIt(weights):

dataMatIn, classLabels = init_data()

n = np.shape(dataMatIn)[0]

xcord1 = []

ycord1 = []

xcord2 = []

ycord2 = []

for i in range(n):

if classLabels[i] == 1:

xcord1.append(dataMatIn[i][1])

ycord1.append(dataMatIn[i][2])

else:

xcord2.append(dataMatIn[i][1])

ycord2.append(dataMatIn[i][2])

fig = plt.figure()

ax = fig.add_subplot(111)

ax.scatter(xcord1, ycord1,s=30, c=‘red’, marker=‘s’)

ax.scatter(xcord2, ycord2, s=30, c=‘green’)

x = np.arange(-3, 3, 0.1)

y = (-weights[0, 0] - weights[1, 0] * x) / weights[2, 0] #matix

ax.plot(x, y)

plt.xlabel(‘X1’)

plt.ylabel(‘X2’)

plt.show()

如下:

算法改進

隨機梯度上升

上述算法中,每次循環矩陣都會進行m * n次乘法計算,時間復雜度是maxCycles* m * n。當數據量很大時, 時間復雜度是很大。 這里嘗試使用隨機梯度上升法來進行改進。 隨機梯度上升法的思想是,每次只使用一個數據樣本點來更新回歸系數。這樣就大大減小計算開銷。 算法如下:

def stoc_grad_ascent(dataMatIn, classLabels):

m, n = np.shape(dataMatIn)

alpha = 0.01

weights = np.ones(n)

for i in range(m):

h = sigmoid(sum(dataMatIn[i] * weights)) #數值計算

error = classLabels[i] - h

weights = weights + alpha * error * dataMatIn[i]

return weights

進行測試:

隨機梯度上升的改進

def stoc_grad_ascent_one(dataMatIn, classLabels, numIter=150):

m, n = np.shape(dataMatIn)

weights = np.ones(n)

for j in range(numIter):

dataIndex = list(range(m))

for i in range(m):

alpha = 4 / (1 + i + j) + 0.01 #保證多次迭代后新數據仍然有影響力

randIndex = int(np.random.uniform(0, len(dataIndex)))

h = sigmoid(sum(dataMatIn[i] * weights)) # 數值計算

error = classLabels[i] - h

weights = weights + alpha * error * dataMatIn[i]

del(dataIndex[randIndex])

return weights

可以對上述三種情況的回歸系數做個波動圖。 可以發現第三種方法收斂更快。 評價算法優劣勢看它是或否收斂,是否達到穩定值,收斂越快,算法越優。

總結

這里用到的梯度上升和梯度下降是一樣的,都是求函數的最值, 符號需要變一下。 梯度意味著分別沿著x, y的方向移動一段距離。(cost分別對x, y)的導數。

完整代碼請查看: github: logistic regression

參考文章: 機器學習之Logistic回歸與Python實現

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8438

    瀏覽量

    132928
  • Logistic
    +關注

    關注

    0

    文章

    11

    瀏覽量

    8858
  • 線性回歸
    +關注

    關注

    0

    文章

    41

    瀏覽量

    4315
收藏 人收藏

    評論

    相關推薦

    傳統機器學習方法和應用指導

    在上一篇文章中,我們介紹了機器學習的關鍵概念術語。在本文中,我們會介紹傳統機器學習的基礎知識和多種算法特征,供各位老師選擇。 01 傳統機器
    的頭像 發表于 12-30 09:16 ?344次閱讀
    傳統<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法和應用指導

    如何選擇云原生機器學習平臺

    當今,云原生機器學習平臺因其彈性擴展、高效部署、低成本運營等優勢,逐漸成為企業構建和部署機器學習應用的首選。然而,市場上的云原生機器
    的頭像 發表于 12-25 11:54 ?143次閱讀

    LuatOS開發4G模組隨機數(random)|實戰指南

    本次學習實戰是關于4G模組LuatOS開發的隨機數示例指南,希望大家有所收獲。
    的頭像 發表于 11-30 09:51 ?277次閱讀
    LuatOS開發<b class='flag-5'>之</b>4G模組隨機數(random)|<b class='flag-5'>實戰</b>指南

    什么是機器學習?通過機器學習方法能解決哪些問題?

    來源:Master編程樹“機器學習”最初的研究動機是讓計算機系統具有人的學習能力以便實現人工智能。因為沒有學習能力的系統很難被認為是具有智能的。目前被廣泛采用的
    的頭像 發表于 11-16 01:07 ?485次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?通過<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法能解決哪些問題?

    NPU與機器學習算法的關系

    在人工智能領域,機器學習算法是實現智能系統的核心。隨著數據量的激增和算法復雜度的提升,對計算資源的需求也在不斷增長。NPU作為一種專門為深度學習機器
    的頭像 發表于 11-15 09:19 ?569次閱讀

    什么是回歸測試_回歸測試的測試策略

    ? 1、什么是回歸測試 回歸測試(Regression testing) 指在發生修改之后重新測試先前的測試以保證修改的正確性。理論上,軟件產生新版本,都需要進行回歸測試,驗證以前發現和修復的錯誤
    的頭像 發表于 11-14 16:44 ?341次閱讀

    【「時間序列與機器學習」閱讀體驗】時間序列的信息提取

    個重要環節,目標是從給定的時間序列數據中提取出有用的信息和特征,以支持后續的分析和預測任務。 特征工程(Feature Engineering)是將數據轉換為更好地表示潛在問題的特征,從而提高機器學習
    發表于 08-17 21:12

    【「時間序列與機器學習」閱讀體驗】+ 鳥瞰這本書

    的交織中不斷成長。 讀者對這本書的評價普遍很高。他們稱贊作者用通俗易懂的語言將復雜的概念解釋得透徹清晰,即使是初學者也能輕松入門。同時,書中豐富的案例和詳細的步驟指導也讓讀者快速積累經驗,提高實戰技能。甚至有讀者表示,這本書已經成為時間序列分析、機器
    發表于 08-12 11:28

    【「時間序列與機器學習」閱讀體驗】+ 簡單建議

    這本書以其系統性的框架和深入淺出的講解,為讀者繪制了一幅時間序列分析與機器學習融合應用的宏偉藍圖。作者不僅扎實地構建了時間序列分析的基礎知識,更巧妙地展示了機器學習如何在這一領域發揮巨
    發表于 08-12 11:21

    不同類型神經網絡在回歸任務中的應用

    神經網絡是一種強大的機器學習模型,可以用于各種任務,包括回歸。在本文中,我們將討論不同類型的神經網絡,以及它們在回歸任務中的應用。 基本的神經網絡 基本的神經網絡,也稱為多層感知器(M
    的頭像 發表于 07-11 10:27 ?1410次閱讀

    機器學習算法原理詳解

    機器學習作為人工智能的一個重要分支,其目標是通過讓計算機自動從數據中學習并改進其性能,而無需進行明確的編程。本文將深入解讀幾種常見的機器學習
    的頭像 發表于 07-02 11:25 ?1285次閱讀

    深度學習與傳統機器學習的對比

    在人工智能的浪潮中,機器學習和深度學習無疑是兩大核心驅動力。它們各自以其獨特的方式推動著技術的進步,為眾多領域帶來了革命性的變化。然而,盡管它們都屬于機器
    的頭像 發表于 07-01 11:40 ?1509次閱讀

    機器學習的經典算法與應用

    關于數據機器學習就是喂入算法和數據,讓算法從數據中尋找一種相應的關系。Iris鳶尾花數據集是一個經典數據集,在統計學習機器學習領域都經常被
    的頭像 發表于 06-27 08:27 ?1707次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>的經典算法與應用

    機器學習8大調參技巧

    今天給大家一篇關于機器學習調參技巧的文章。超參數調優是機器學習例程中的基本步驟之一。該方法也稱為超參數優化,需要搜索超參數的最佳配置以實現最佳性能。
    的頭像 發表于 03-23 08:26 ?671次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>8大調參技巧

    深入探討線性回歸與柏松回歸

    或許我們所有人都會學習的第一個機器學習算法就是線性回歸算法,它無疑是最基本且被廣泛使用的技術之一——尤其是在預測分析方面。
    的頭像 發表于 03-18 14:06 ?733次閱讀
    深入探討線性<b class='flag-5'>回歸</b>與柏松<b class='flag-5'>回歸</b>
    主站蜘蛛池模板: 富婆夜店找黑人猛男BD在线 | 动漫美女被羞羞动漫怪物 | 亚洲欧美一级久久精品 | 精品亚洲永久免费精品 | xxnx日本| 男女疯狂一边摸一边做羞羞视频 | 思思久久99热只有频精品66 | 日韩成人性视频 | 高清mv视频免费观看 | 边做边爱播放3免费观看 | 国产成人免费手机在线观看视频 | 超碰视频在线观看 | 99精品电影一区二区免费看 | 捏揉舔水插按摩师 | 秋霞午夜鲁丝片午夜精品久 | 多人乱肉高hnp | 国产精品久久一区二区三区蜜桃 | 狼群资源网中文字幕 | 嫩草影院在线观看精品视频 | 99国产这里只有精品视频 | 扒开黑女人p大荫蒂老女人 扒开粉嫩的小缝末成年小美女 | 116美女写真午夜电影z | 国产AV99激情久久无码天堂 | 国产电影无码午夜在线播放 | 91久久偷偷看嫩草影院无费 | 久久综合电影 | 天堂tv免费tv在线tv香蕉 | 嘟嘟嘟WWW免费高清在线中文 | 校园男男高h小黄文 | 青青国产在线观看视频 | 国产亚洲精品欧洲在线视频 | 九九精品视频一区二区三区 | thermo脱色摇床安卓下载 | 老熟人老女人国产老太 | 欧美午夜免费观看福利片 | 夜夜精品视频一区二区 | 亚洲免费无码中文在线 | 男人边吃奶边挵进去呻吟漫画 | 巨胸美乳中文在线观看 | 亚洲欧美日韩综合影院 | 国产成人久久精品激情 |