色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

機器學習算法基礎與流程

倩倩 ? 來源:人人都是產品經理 ? 2020-04-15 17:44 ? 次閱讀

一、什么是機器學習

1. 含義

機器學習machine learning,是人工智能的分支,專門研究計算機怎樣模擬或實現人類的學習行為,其通過各種算法訓練模型,并用這些模型對新問題進行識別與預測。

本質上機器學習是一種從數據或以往的經驗中提取模式,并以此優化計算機程序的性能標準。

2. 解決什么問題

解決復雜規則的問題。如果簡單規則可以實現,則沒必要借助機器學習算法實現。

2009年ACM世界冠軍戴文淵加入百度的時候,百度所有的搜索、廣告都是基于1萬條的專家規則。借助于機器算法,戴文淵把百度廣告的規則從1萬條提升到了1000億條。與此相對應的,百度的收入在四年內提升了八倍。

3. 三個名詞之間的關系

人工智能》機器學習》深度學習

以機器學習算法是否應用了神經網絡作為區分標準,應用了多隱含層神經網絡的機器學習就是深度學習。

4. 對AI產品經理的要求

熟悉機器學習流程(詳見文章第三部分);

了解機器學習可以解決的問題分類(詳見文章第四部分);

了解算法的基本原理;

了解工程實踐中算數據和計算資源三者間的依賴關系等。

二、機器學習的基礎

1. 機器學習的基礎——數據

人工智能產品由數據、算法、計算能力三部分組成,而數據,是其中的基礎。

全球頂尖人工智能科學家李飛飛的成功離不開ImageNet千萬級的數據集。

“ImageNet 讓 AI 領域發生的一個重大變化是,人們突然意識到構建數據集這個苦活累活是 AI 研究的核心,”李飛飛說: “人們真的明白了,數據集跟算法一樣,對研究都至關重要。”“如果你只看 5 張貓的照片,那么你只知道這 5 個攝像機角度、照明條件和最多 5 種不同種類的貓。但是,如果你看過 500 張貓的照片,你就能從更多的例子中發現共同點。”

數據量多大為好?

千級別:基本要求,可以解決簡單手寫體數字識別問題,例如MNIST;

萬級別:一般要求,可以解決圖片分類問題,例如cifar-100;

千萬級:比較好,例如ImageNet,準確率2%左右,超過了人類5.1%。

2. 數據的衡量

人工智能產品對數據除了有量的要求,還有質的要求,衡量數據質量的標準包括四個R:關聯度relevancy(首要因素)、可信性reliability(關鍵因素)、范圍range、時效性recency。

數據獲取地址:

ICPSR:www.icpsr.umich.edu

美國政府開放數據:www.data.gov

加州大學歐文分校:archive.ics.uci.edu/ml

數據堂:www.datatang.com

三、機器學習的流程

機器學習的流程可以劃分為以下幾個主要步驟:目標定義、數據收集、數據預處理、模型訓練、準確率測試、調參、模型輸出。

機器學習流程拆解

1. 目標定義

確認機器學習要解決的問題本質以及衡量的標準。

機器學習的目標可以被分為:分類、回歸、聚類、異常檢測等。

2. 數據采集

原始數據作為機器學習過程中的輸入來源是從各種渠道中被采集而來的。

3. 數據預處理

普通數據挖掘中的預處理包括數據清洗、數據集成、數據轉換、數據削減、數據離散化。

深度學習數據預處理包含數據歸一化(包含樣本尺度歸一化、逐樣本的均值相減、標準化)和數據白化。需要將數據分為三種數據集,包括用來訓練模型的訓練集(training set),開發過程中用于調參(parameter tuning)的驗證集(validation set)以及測試時所使用的測試集(test set)。

數據標注的質量對于算法的成功率至關重要。

4. 模型訓練

模型訓練流程:每當有數據輸入,模型都會輸出預測結果,而預測結果會用來調整和更新W和B的集合,接著訓練新的數據,直到訓練出可以預測出接近真實結果的模型。

5. 準確率測試

用第三步數據預處理中準備好的測試集對模型進行測試。

6. 調參

參數可以分為兩類,一類是需要在訓練(學習)之前手動設置的參數,即超參數(hypeparameter),另外一類是通常不需要手動設置、在訓練過程中可以被自動調整的參數(parameter)。

調參通常需要依賴經驗和靈感來探尋其最優值,本質上更接近藝術而非科學,是考察算法工程師能力高低的重點環節。

7. 模型輸出

模型最終輸出應用于實際應用場景的接口或數據集。

四、算法分類

機器學習囊括了多種算法,通常按照模型訓練方式和解決任務的不同進行分類。

1. 按照模型訓練方式不同,可以分為

(1)監督學習supervised learning

定義:監督學習指系統通過對帶有標記信息的訓練樣本進行學習,以盡可能準確地預測未知樣本的標記信息。

常見的監督學習類算法包括:人工神經網絡artificial neural network、貝葉斯bayesian、決策樹decision tree、線性分類器linear classifier(svm支持向量機)等。

(2)無監督學習unsupervised learning

定義:無監督學習指系統對沒有標記信息的訓練樣本進行學習,以發現數據中隱藏的結構性知識。

常見的無監督學習類算法包括:人工神經網絡artificial neural network、關聯規則學習association rule learning、分層聚類hierarchical clustering、聚類分析cluster analysis、異常檢測anomaly detection等。

(3)半監督學習semi-supervised learning

含義:半監督學習指系統在學習時不僅有帶有標記信息的訓練樣本,還有部分標記未知信息的訓練樣本。

常見的半監督學習算法包括:生成模型generative models、低密度分離low-density separation、基于圖形的方法graph-based methods、聯合訓練co-training等。

(4)強化學習reinforcement learning

定義:強化學習指系統從不標記信息,但是會在具有某種反饋信號(即瞬間獎賞)的樣本中進行學習,以學到一種從狀態到動作的映射來最大化累積獎賞,這里的瞬時獎賞可以看成對系統的某個狀態下執行某個動作的評價。

常見的強化學習算法包括:Q學習Q-learning、狀態-行動-獎勵-狀態-行動state-action-reward-state-action,SARSA、DQN deep Q network、策略梯度算法policy gradients、基于模型強化學習model based RL、時序差分學習temporal different learning等。

(5)遷移學習transfer learning

定義:遷移學習指通過從已學習的相關任務中轉移知識來改進學習的新任務,雖然大多數機器學習算法都是為了解決單個任務而設計的,但是促進遷移學習的算法的開發是機器學習社區持續關注的話題

遷移學習對人類來說很常見,例如,我們可能會發現學習識別蘋果可能有助于識別梨,或者學習彈奏電子琴可能有助于學習鋼琴。

常見的遷移學習算法包括:歸納式遷移學習inductive transfer learning、直推式遷移學習transductive transfer learning、無監督式遷移學習unsupervised transfer learning、傳遞式遷移學習transitive transfer learning等。

(6)深度學習deep learning

定義:深度學習是指多層的人工神經網絡和訓練它的方法。一層神經網絡會把大量矩陣數字作為輸入,通過非線性激活方法取權重,再產生另一個數據集合作為輸出。

這就像生物神經大腦的工作機理一樣,通過合適的矩陣數量,多層組織鏈接一起,形成神經網絡“大腦”進行精準復雜的處理,就像人們識別物體標注圖片一樣。

常見的深度學習算法包括:深度信念網絡deep belief machines、深度卷積神經網絡deep convolutional neural networks、深度遞歸神經網絡deep recurrent neural networks、深度波爾茲曼機deep boltzmann machine,DBM、棧式自動編碼器stacked autoencoder、生成對抗網絡generative adversarial networks等。

遷移學習與半監督學習的區別:遷移學習的初步模型是完整的,半監督學習的已標注部分無法形成完整的模型。

2. 按照解決任務的不同分類,可以分為

(1)二分類算法two-class classification,解決非黑即白的問題。

(2)多分類算法muti-class classification,解決不是非黑即白的多種分類問題。

(3)回歸算法regression,回歸問題通常被用來預測具體的數值而非分類。除了返回的結果不同,其他方法與分類問題類似。我們將定量輸出,或者連續變量預測稱為回歸;將定性輸出,或者離散變量預測稱為分類。

(4)聚類算法clustering,聚類的目標是發現數據的潛在規律和結構。聚類通常被用做描述和衡量不同數據源間的相似性,并把數據源分類到不同的簇中。

(5)異常檢測anomaly detection,異常檢測是指對數據中存在的不正常或非典型的分體進行檢測和標志,有時也稱為偏差檢測。異常檢測看起來和監督學習問題非常相似,都是分類問題。都是對樣本的標簽進行預測和判斷,但是實際上兩者的區別非常大,因為異常檢測中的正樣本(異常點)非常小。

3. 對AI產品經理的要求

產品經理應了解和掌握每種常見算法的基本邏輯、最佳使用場景以及每種算法對數據的需求。

這樣有助于:

建立必要的知識體系以與研發人員進行良好的交流;

在團隊需要的時候提供必要的幫助;

識別和評估產品迭代過程中的風險、成本、預期效果等。

五、各類算法的對比

1. 算法與學習過程的對比

監督學習——上課:有求知欲的學生從老師那里獲取知識、信息,老師提供對錯指示、告知最終答案的學習過程;

無監督學習——自習:沒有老師的情況下,學生自習的過程;

強化學習下——自測:沒有老師提示的情況下,自己對預測的結果進行評估的方法。

2. 算法適用場景的影響因素

業務核心問題;

數據大小、質量;

計算時間要求;

算法精度要求。

3. 算法優缺點及適用場景

注意:

(1)目前監督學習和強化學習是目前應用范圍最廣且效果最好的機器學習方式。

(2)深度學習將在后續的文章中單獨介紹。

(3)半監督學習依賴以下3個模型假設才能確保它良好的學習性能。

1)平滑假設(Smoothness Assumption)

位于稠密數據區域的兩個距離很近的樣例的類標簽相似,當兩個樣例北稀疏區域分開時,它們的類標簽趨于不同。

2)聚類假設(Cluster Assumption)

當兩個樣例位于同一聚類簇時,它們在很大的概率在有相同的類標簽。這個假設的等價定義為低密度分類假設(Low Density Separation Assumption),即分類決策邊界應該穿過稀疏數據區域,而避免將稠密數據區域的樣例劃分到決策邊界兩側。

3)流形假設(Manifold Assumption)

將高維數據嵌入到低維流形中,當兩個樣例位于低維流形中的一個小局部鄰域內時,它們具有相似的類標簽。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1796

    文章

    47643

    瀏覽量

    240082
  • 機器學習
    +關注

    關注

    66

    文章

    8438

    瀏覽量

    133024
收藏 人收藏

    評論

    相關推薦

    華為云 Flexus X 實例部署安裝 Jupyter Notebook,學習 AI,機器學習算法

    前言 由于本人最近在學習一些機器算法,AI 算法的知識,需要搭建一個學習環境,所以就在最近購買的華為云 Flexus X 實例上安裝了
    的頭像 發表于 01-02 13:43 ?140次閱讀
    華為云 Flexus X 實例部署安裝 Jupyter Notebook,<b class='flag-5'>學習</b> AI,<b class='flag-5'>機器</b><b class='flag-5'>學習</b><b class='flag-5'>算法</b>

    傳統機器學習方法和應用指導

    在上一篇文章中,我們介紹了機器學習的關鍵概念術語。在本文中,我們會介紹傳統機器學習的基礎知識和多種算法特征,供各位老師選擇。 01 傳統
    的頭像 發表于 12-30 09:16 ?375次閱讀
    傳統<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法和應用指導

    構建云原生機器學習平臺流程

    構建云原生機器學習平臺是一個復雜而系統的過程,涉及數據收集、處理、特征提取、模型訓練、評估、部署和監控等多個環節。
    的頭像 發表于 12-14 10:34 ?172次閱讀

    NPU與機器學習算法的關系

    在人工智能領域,機器學習算法是實現智能系統的核心。隨著數據量的激增和算法復雜度的提升,對計算資源的需求也在不斷增長。NPU作為一種專門為深度學習
    的頭像 發表于 11-15 09:19 ?593次閱讀

    人工智能、機器學習和深度學習存在什么區別

    人工智能指的是在某種程度上顯示出類似人類智能的設備。AI有很多技術,但其中一個很大的子集是機器學習——讓算法從數據中學習
    發表于 10-24 17:22 ?2531次閱讀
    人工智能、<b class='flag-5'>機器</b><b class='flag-5'>學習</b>和深度<b class='flag-5'>學習</b>存在什么區別

    LIBS結合機器學習算法的江西名優春茶采收期鑒別

    以廬山云霧茶和狗牯腦茶的明前茶、雨前茶為對象,研究激光誘導擊穿光譜結合機器學習的茶葉鑒別方法。將茶葉茶,水數據融合可有效鑒別春茶采收期,且數據融合后表現出更好的穩定性和魯棒性,LIBS結合機器
    的頭像 發表于 10-22 18:05 ?301次閱讀
    LIBS結合<b class='flag-5'>機器</b><b class='flag-5'>學習</b><b class='flag-5'>算法</b>的江西名優春茶采收期鑒別

    深度學習算法在嵌入式平臺上的部署

    隨著人工智能技術的飛速發展,深度學習算法在各個領域的應用日益廣泛。然而,將深度學習算法部署到資源受限的嵌入式平臺上,仍然是一個具有挑戰性的任務。本文將從嵌入式平臺的特點、深度
    的頭像 發表于 07-15 10:03 ?1673次閱讀

    利用Matlab函數實現深度學習算法

    在Matlab中實現深度學習算法是一個復雜但強大的過程,可以應用于各種領域,如圖像識別、自然語言處理、時間序列預測等。這里,我將概述一個基本的流程,包括環境設置、數據準備、模型設計、訓練過程、以及測試和評估,并提供一個基于Mat
    的頭像 發表于 07-14 14:21 ?2428次閱讀

    如何理解機器學習中的訓練集、驗證集和測試集

    理解機器學習中的訓練集、驗證集和測試集,是掌握機器學習核心概念和流程的重要一步。這三者不僅構成了模型學習
    的頭像 發表于 07-10 15:45 ?4636次閱讀

    機器學習算法原理詳解

    機器學習作為人工智能的一個重要分支,其目標是通過讓計算機自動從數據中學習并改進其性能,而無需進行明確的編程。本文將深入解讀幾種常見的機器學習
    的頭像 發表于 07-02 11:25 ?1325次閱讀

    機器學習在數據分析中的應用

    隨著大數據時代的到來,數據量的爆炸性增長對數據分析提出了更高的要求。機器學習作為一種強大的工具,通過訓練模型從數據中學習規律,為企業和組織提供了更高效、更準確的數據分析能力。本文將深入探討機器
    的頭像 發表于 07-02 11:22 ?781次閱讀

    機器學習的經典算法與應用

    關于數據機器學習就是喂入算法和數據,讓算法從數據中尋找一種相應的關系。Iris鳶尾花數據集是一個經典數據集,在統計學習
    的頭像 發表于 06-27 08:27 ?1720次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>的經典<b class='flag-5'>算法</b>與應用

    機器學習怎么進入人工智能

    ,人工智能已成為一個熱門領域,涉及到多個行業和領域,例如語音識別、機器翻譯、圖像識別等。 在編程中進行人工智能的關鍵是使用機器學習算法,這是一類基于樣本數據和模型訓練來進行預測和判斷的
    的頭像 發表于 04-04 08:41 ?383次閱讀

    機器學習8大調參技巧

    今天給大家一篇關于機器學習調參技巧的文章。超參數調優是機器學習例程中的基本步驟之一。該方法也稱為超參數優化,需要搜索超參數的最佳配置以實現最佳性能。
    的頭像 發表于 03-23 08:26 ?692次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>8大調參技巧

    AI算法的本質是模擬人類智能,讓機器實現智能化

    電子發燒友網報道(文/李彎彎)AI算法是人工智能領域中使用的算法,用于模擬、延伸和擴展人的智能。這些算法可以通過機器學習、深度
    的頭像 發表于 02-07 00:07 ?5971次閱讀
    主站蜘蛛池模板: 少妇精品久久久一区二区三区 | 亚洲伊人久久精品 | 草699一码二码三码四码 | 中国老太太xxx | 在线观看成人免费 | 亚洲国产精品一区二区三区在线观看 | 欧美亚洲另类图片 | 姑娘日本大全免费观看版中文翻译 | 午夜在线观看免费完整直播网页 | 偷拍自偷拍亚洲精品 | 晚夜免费禁用十大亏亏 | 亚洲另类中文字幕 | 中文无码热在线视频 | 海角社区在线视频播放观看 | 草莓西瓜樱桃香蕉直播视频 | 国产精品久久国产三级国不卡顿 | 疯狂做受XXXX高潮欧美日本 | 饥渴的护士自慰被发现 | 琪琪色原网20岁以下热热色原网站 | 国产特级毛片AAAAAAA高清 | 俄罗斯粗大猛烈18P 俄罗斯雏妓的BBB孩交 | 一本之道高清在线观看一区 | 国产浮力草草影院CCYY | 精品国产乱码久久久久久人妻 | 成人网络电视破解版 | 人妖欧美一区二区三区四区 | 白嫩美女直冒白浆 | 国产一卡 二卡三卡四卡无卡乱码视频 | 久久黄色录像 | GOGOGO高清免费播放 | 最美女人体内射精一区二区 | 肉奴隷 赤坂丽在线播放 | 亚洲最大成人 | 日本高清无人区影院 | writeas雷狮直播 | 51无码人妻精品1国产 | 绿巨人www在线观看 绿巨人www | 99re久久免费热在线视频手机 | 天堂so导航| 青青草原在线新免费 | 男男免费看 |