色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

詳談機器學習的決策樹模型

如意 ? 來源:逍遙埠 ? 作者:逍遙埠 ? 2020-07-06 09:49 ? 次閱讀

決策樹模型是白盒模型的一種,其預測結(jié)果可以由人來解釋。我們把機器學習模型的這一特性稱為可解釋性,但并不是所有的機器學習模型都具有可解釋性。

作為可解釋性屬性的一部分,特征重要性是一個衡量每個輸入特征對模型預測結(jié)果貢獻的指標,即某個特征上的微小變化如何改變預測結(jié)果。

直覺

不同于基尼不純度或熵,沒有一個通用的數(shù)學公式來定義特征的重要性,而特征的重要性在不同的模型中是不同的。

例如,對于線性回歸模型,假設(shè)所有輸入特征具有相同的尺度(如[0,1],那么每個特征的特征重要性就是與該特征相關(guān)的權(quán)值的絕對值。從這個公式可以看出線性回歸模型的f (X) =∑i = 1 n (wixi),模型的結(jié)果是線性正比于每個組件(wixi)這是由重量決定的(wi)的組件。

對于決策樹,為了度量特征的重要性,我們需要研究模型,看看每個特征是如何在模型的最終“決策”中發(fā)揮作用的。從前面的文章中我們了解到,在決策樹模型中,在每個決策節(jié)點上,我們選擇最佳的特征進行分割,以便進一步區(qū)分到達該決策節(jié)點的樣本。在每一次分割中,我們都更接近最終的決定(即葉節(jié)點)。因此,我們可以說,在每個決策節(jié)點上,所選擇的分割特征決定了最終的預測結(jié)果。直觀地說,我們也可以說,那些被選擇的特征比那些實際上在決策過程中沒有作用的非被選擇的特征更重要。現(xiàn)在,剩下的問題是我們?nèi)绾瘟炕睾饬窟@種重要性。

有人可能還記得,我們使用信息增益或基尼系數(shù)來衡量分割的質(zhì)量。當然,還可以將增益與所選擇的特性關(guān)聯(lián)起來,并使用增益來量化該特性在這個特定的分裂發(fā)生時的貢獻。此外,我們可以累積決策樹中出現(xiàn)的每個特征的增益。

最后,每個特征的累積增益可以作為決策樹模型的特征重要性。

另一方面,作為一個可能會注意到,這一決定節(jié)點不是同樣重要的是,自從決定節(jié)點樹的根可以幫助過濾所有的輸入樣本,而決定節(jié)點樹的底部有助于區(qū)分總樣本的只有少數(shù)。因此,一個特征在每個決策節(jié)點獲得的增益的權(quán)重并不相同,即一個特征在一個決策節(jié)點獲得的增益應(yīng)按該決策節(jié)點幫助區(qū)分的樣本比例進行加權(quán)。

基于上述直覺,我們可以推導出以下公式來計算決策樹中每個特征的重要性I:

詳談機器學習的決策樹模型

注:我們可以用上述公式中的信息增益來代替基尼系數(shù)增益度量,只要我們對所有特征都使用相同的度量。

通過上面的公式,我們可以得到一個值來衡量決策樹中每個特征的重要性。有時,可能需要對值進行規(guī)范化,以便更直觀地比較這些值,即將所有值縮放到(0,1)的范圍內(nèi)。例如,如果有兩個特征經(jīng)過歸一化后得分相同(即0.5),我們可以說它們在決策樹中同等重要。

舉個例子

讓我們看一個具體的例子,看看我們?nèi)绾螒?yīng)用上面的公式來計算決策樹中的特征重要性。首先,我們在下圖中展示了一個實例決策樹。

詳談機器學習的決策樹模型

從圖中可以看出,該樹中共有3個決策節(jié)點。在每個決策節(jié)點中,我們指出了三條信息:

1、選擇要分割的特性。

2、特征獲得的基尼系數(shù)

3、分別分配給左子節(jié)點和右子節(jié)點的樣本數(shù)量。

此外,我們可以看出決策樹總共訓練了100個樣本。

因此,我們可以計算出樹中涉及的兩個特征的特征重要性如下:

詳談機器學習的決策樹模型

進一步,我們可以得到歸一化特征重要性如下:

詳談機器學習的決策樹模型

后記:路漫漫其修遠兮,吾將上下而求索!

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器學習
    +關(guān)注

    關(guān)注

    66

    文章

    8438

    瀏覽量

    132928
  • 決策樹
    +關(guān)注

    關(guān)注

    3

    文章

    96

    瀏覽量

    13573
  • 白盒測試
    +關(guān)注

    關(guān)注

    1

    文章

    14

    瀏覽量

    10631
收藏 人收藏

    評論

    相關(guān)推薦

    xgboost與LightGBM的優(yōu)勢對比

    Gradient Boosting) 是一種基于梯度提升決策樹(GBDT)的優(yōu)化分布式梯度提升庫,由陳天奇等人于2014年提出。它通過優(yōu)化目標函數(shù)的負梯度來構(gòu)建樹模型,并支持并行和GPU加速。 LightGBM
    的頭像 發(fā)表于 01-19 11:18 ?356次閱讀

    xgboost的并行計算原理

    之一。 XGBoost簡介 XGBoost是一種基于梯度提升框架的集成學習算法,它通過構(gòu)建多個決策樹來提高模型的預測性能。與傳統(tǒng)的梯度提升相比,XGBoost在算法上進行了優(yōu)化,包括
    的頭像 發(fā)表于 01-19 11:17 ?333次閱讀

    xgboost在圖像分類中的應(yīng)用

    XGBoost(eXtreme Gradient Boosting)是一種高效的機器學習算法,它基于梯度提升框架,通過構(gòu)建多個弱學習器(通常是決策樹)來提高
    的頭像 發(fā)表于 01-19 11:16 ?352次閱讀

    什么是機器學習?通過機器學習方法能解決哪些問題?

    來源:Master編程機器學習”最初的研究動機是讓計算機系統(tǒng)具有人的學習能力以便實現(xiàn)人工智能。因為沒有學習能力的系統(tǒng)很難被認為是具有智能
    的頭像 發(fā)表于 11-16 01:07 ?485次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?通過<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法能解決哪些問題?

    AI大模型與深度學習的關(guān)系

    AI大模型與深度學習之間存在著密不可分的關(guān)系,它們互為促進,相輔相成。以下是對兩者關(guān)系的介紹: 一、深度學習是AI大模型的基礎(chǔ) 技術(shù)支撐 :深度學習
    的頭像 發(fā)表于 10-23 15:25 ?1098次閱讀

    AI大模型與傳統(tǒng)機器學習的區(qū)別

    AI大模型與傳統(tǒng)機器學習在多個方面存在顯著的區(qū)別。以下是對這些區(qū)別的介紹: 一、模型規(guī)模與復雜度 AI大模型 :通常包含數(shù)十億甚至數(shù)萬億的參
    的頭像 發(fā)表于 10-23 15:01 ?932次閱讀

    【《大語言模型應(yīng)用指南》閱讀體驗】+ 基礎(chǔ)知識學習

    今天來學習大語言模型在自然語言理解方面的原理以及問答回復實現(xiàn)。 主要是基于深度學習和自然語言處理技術(shù)。 大語言模型涉及以下幾個過程: 數(shù)據(jù)收集:大語言
    發(fā)表于 08-02 11:03

    pycharm如何訓練機器學習模型

    PyCharm是一個流行的Python集成開發(fā)環(huán)境(IDE),它提供了豐富的功能,包括代碼編輯、調(diào)試、測試等。在本文中,我們將介紹如何在PyCharm中訓練機器學習模型。 一、安裝PyCharm
    的頭像 發(fā)表于 07-11 10:14 ?910次閱讀

    Al大模型機器

    豐富的知識儲備。它們可以涵蓋各種領(lǐng)域的知識,并能夠回答相關(guān)問題。靈活性與通用性: AI大模型機器人具有很強的靈活性和通用性,能夠處理各種類型的任務(wù)和問題。持續(xù)學習和改進: 這些模型可以
    發(fā)表于 07-05 08:52

    人工神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)機器學習模型的區(qū)別

    人工神經(jīng)網(wǎng)絡(luò)(ANN)與傳統(tǒng)機器學習模型之間的不同,包括其原理、數(shù)據(jù)處理能力、學習方法、適用場景及未來發(fā)展趨勢等方面,以期為讀者提供一個全面的視角。
    的頭像 發(fā)表于 07-04 14:08 ?1508次閱讀

    機器學習算法原理詳解

    機器學習作為人工智能的一個重要分支,其目標是通過讓計算機自動從數(shù)據(jù)中學習并改進其性能,而無需進行明確的編程。本文將深入解讀幾種常見的機器學習
    的頭像 發(fā)表于 07-02 11:25 ?1284次閱讀

    名單公布!【書籍評測活動NO.35】如何用「時間序列與機器學習」解鎖未來?

    設(shè)備的運行狀況,生成各種維度的報告。 同時,通過大數(shù)據(jù)分析和機器學習技術(shù),可以對業(yè)務(wù)進行預測和預警,從而協(xié)助社會和企業(yè)進行科學決策、降低成本并創(chuàng)造新的價值。 當今時代,數(shù)據(jù)無處不在,而時間序列數(shù)據(jù)更是
    發(fā)表于 06-25 15:00

    【大語言模型:原理與工程實踐】大語言模型的應(yīng)用

    ,它通過抽象思考和邏輯推理,協(xié)助我們應(yīng)對復雜的決策。 相應(yīng)地,我們設(shè)計了兩類任務(wù)來檢驗大語言模型的能力。一類是感性的、無需理性能力的任務(wù),類似于人類的系統(tǒng)1,如情感分析和抽取式問答等。大語言模型在這
    發(fā)表于 05-07 17:21

    機器學習怎么進入人工智能

    ,人工智能已成為一個熱門領(lǐng)域,涉及到多個行業(yè)和領(lǐng)域,例如語音識別、機器翻譯、圖像識別等。 在編程中進行人工智能的關(guān)鍵是使用機器學習算法,這是一類基于樣本數(shù)據(jù)和模型訓練來進行預測和判斷的
    的頭像 發(fā)表于 04-04 08:41 ?372次閱讀

    什么是隨機森林?隨機森林的工作原理

    隨機森林使用名為“bagging”的技術(shù),通過數(shù)據(jù)集和特征的隨機自助抽樣樣本并行構(gòu)建完整的決策樹。雖然決策樹基于一組固定的特征,而且經(jīng)常過擬合,但隨機性對森林的成功至關(guān)重要。
    發(fā)表于 03-18 14:27 ?3711次閱讀
    什么是隨機森林?隨機森林的工作原理
    主站蜘蛛池模板: 在线 国产 欧美 亚洲 天堂 | 成 人 网 站毛片 | 操中国老太太 | 日日操夜夜操天天操 | 久久亚洲成a人片 | 91麻精品国产91久久久久 | 欧美亚洲国产手机在线有码 | 特污兔午夜影视院 | 伦理电影2499伦理片 | 色柚视频网站ww色 | 成人国产在线观看 | 久久电影精品久久99久久 | 97色伦亚洲自偷 | 国产午夜精品理论片 | 冠希和阿娇13分钟在线视频 | 久久精品视频15人人爱在线直播 | 最近中文字幕2019免费版 | 国产色精品久久人妻无码看片 | 国产在线高清视频无码不卡 | 精品午夜寂寞影院在线观看 | 国产午夜精品久久理论片 | 99久久免费只有精品 | 久久内在线视频精品mp4 | 午夜片无码区在线观看 | 好好的曰com久久 | 欧美亚洲国产手机在线有码 | 伦理片飘花免费影院 | 午夜成a人片在线观看 | 成人bt下载 | 日韩精品无码久久一区二区三 | 网红刘婷hd国产高清 | 甜性涩爱下载 | 欧美日韩国产高清综合二区 | 爆乳啪啪无码成人二区亚洲欧美 | 久久精品一本到99热 | 秋霞伦理电影在线看 | 日本高清不卡码无码v亚洲 日本福利片午夜免费观着 日本粉嫩学生毛绒绒 | 狠狠色香婷婷久久亚洲精品 | 簧片在线免费观看 | 亚洲偷自拍精品视频在线观看 | 亚洲中文字幕手机版 |