以前學過人工智能算法,但是只是做了比較簡單的項目像手寫識別和貓狗識別等等,對算法掌握的比較淺顯,一直以來特別想做一個能夠做一個能夠識別自己的小程序,感覺很酷,小牛希望通過這個項目繼續深入學習研究相關算法,本系列文章僅記錄筆者從小白開始的學習歷程。
人臉識別是什么?
人臉識別,特指利用分析比較人臉視覺特征信息進行身份鑒別的計算機技術。用攝像機或攝像頭采集含有人臉的圖像或視頻流,并自動在圖像中檢測和跟蹤人臉,進而對檢測到的人臉進行臉部識別的一系列相關技術,通常也叫做人像識別、面部識別。
查閱相關資料發現,人臉識別的關鍵點是:目標檢測,關鍵點定位,活體檢測,相識度度量,人臉屬性回歸
什么是深度學習?
關于深度學習的前世今生,深度學習屬于機器學習的一個分支,機器學習是實現人工智能的一個途徑,即以機器學習為手段解決人工智能中的問題。機器學習在近30多年已發展為一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、計算復雜性理論等多門學科。
目前我們人類所講的人工智能,其實是弱人工智能,其不是能夠能真正地推理和解決問題的智能機器,其實是只不過“看起來”像是智能的,也不會有自主意識。我們通過給它大量的訓練數據,讓它去學習其這些數據內在的特征和關系,使其能夠處理類似訓練數據的實際問題。
機器學習中有許多經典的算法,其中有一個叫 人工神經網絡 的算法,隱藏層比較多(大于2)的神經網絡叫做深度神經網絡。而深度學習,就是使用深層架構(比如,深度神經網絡)的機器學習方法。深度學習通俗點講就是神經網絡的升級版。
這里簡單介紹一下相關概念,大家感興趣,可以去看一下斯坦福大學公開課:機器學習課程 或者這篇文章 (小牛感覺寫的太牛了,有種通透的趕腳~~)
什么是感知器?
感知器(英語:Perceptron)是Frank Rosenblatt在1957年就職于康奈爾航空實驗室(Cornell Aeronautical Laboratory)時所發明的一種人工神經網絡。它可以被視為一種最簡單形式的前饋神經網絡,是一種二元線性分類器。
神經網絡的組成單元——神經元。神經元也叫做感知器。
感知器有如下部分:輸入權值,激活函數,輸出
- 輸出權值:一個感知器可以接收多個輸入 ,... ,一個輸入上有一個權值 ,此外還有一個偏置項b。
- 激活函數:感知器的激活函數可以有很多選擇,我們選擇這個經典的階躍函數來作為激活函數:
- 輸出:
任何線性分類或線性回歸問題,都可以用感知器來解決
多層感知器(MLP)也稱人工神經網絡(ANN)
深度學習中的概念變遷:神經元->感知器->神經網絡->深度學習
前向運算
神經網絡的前向運算,就是給定一組輸入,計算輸出的過程。
對于前向傳播來說,不管維度多高,其過程都可以用如下公式表示:
假設上一層結點輸入1,輸入2,輸入3,…等一些結點與本層的結點有連接,那么本層結點的值就是通過上一層的輸入1,輸入2,輸入3結點以及對應的連接權值進行加權和運算,最終結果再加上一個偏置項(圖中為了簡單省略了),最后在通過一個非線性函數(即激活函數),如ReLu,sigmoid等函數,最后得到的結果就是本層結點的輸出。最終不斷的通過這種方法一層層的運算,得到輸出層結果。
σ() = σ(* +)
其中,上標代表層數,星號表示卷積,b表示偏置項bias,σ 表示激活函數。
假設我們構造了一個神經網絡如下圖:
公式如下:
其中f函數是本圖規定的算法,Wij就是相鄰兩層神經元之間的權值, 是對x1,x2,x3進行線性組合, 是都 ,, 的線性組合
如何計算每層權值與偏值,f函數該如何定義,已知具體哪層,求其層的參數是多少?后面文章會一一道來。
明天再繼續,概念還是挺抽象的,把概念寫明白還是挺累的,腦袋要炸了。
參考:https://www.jiqizhixin.com/graph/technologies/f9849d6c-6262-4c1f-8f42-6d976be17161
https://www.zybuluo.com/hanbingtao/note/433855
https://cloud.tencent.com/developer/news/390591
-
人工智能
+關注
關注
1794文章
47642瀏覽量
239650 -
深度學習
+關注
關注
73文章
5512瀏覽量
121410
發布評論請先 登錄
相關推薦
評論