色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

圖像識(shí)別的技術(shù)原理,會(huì)看沒那么簡單

電子設(shè)計(jì) ? 來源:互聯(lián)網(wǎng) ? 作者:佚名 ? 2017-12-04 10:46 ? 次閱讀

對(duì)人類來說,描述我們眼睛所看到的事物,即“視覺世界”,看起來太微不足道了,以至于我們根本沒有意識(shí)到那正是我們時(shí)時(shí)刻刻在做的事情。在看到某件事物時(shí),不管是汽車、大樹,還是一個(gè)人,我們通常都不需要過多的思考就能立刻叫出名字。然而對(duì)于一臺(tái)計(jì)算機(jī)來說,區(qū)分識(shí)別“人類對(duì)象”(比如:在小狗、椅子或是鬧鐘這些“非人類對(duì)象”中識(shí)別出奶奶這一“人類對(duì)象”)卻是相當(dāng)困難的。

能解決這一問題可以帶來非常高的收益。“圖像識(shí)別”技術(shù),更寬泛地說是“計(jì)算機(jī)視覺”技術(shù),是許多新興技術(shù)的基礎(chǔ)。從無人駕駛汽車和面部識(shí)別軟件到那些看似簡單但十分重要的發(fā)展成果——能夠監(jiān)測流水線缺陷和違規(guī)的“智能工廠”,以及保險(xiǎn)公司用來處理和分類索賠照片的自動(dòng)化軟件。這些新興科技是離不開“圖像識(shí)別”的。

在接下來的內(nèi)容里,我們將要探究“圖像識(shí)別”所面臨的問題和挑戰(zhàn),并分析科學(xué)家是如何用一種特殊的神經(jīng)網(wǎng)絡(luò)來解決這一挑戰(zhàn)的。

學(xué)會(huì)“看”是一項(xiàng)高難度、高成本的任務(wù)

著手解決這個(gè)難題,我們可以首先將元數(shù)據(jù)應(yīng)用于非結(jié)構(gòu)化數(shù)據(jù)。在之前的文章里,我們?cè)枋鲞^在元數(shù)據(jù)稀缺或元數(shù)據(jù)不存在的情況下,進(jìn)行文本內(nèi)容分類和搜索遇到的一些問題和挑戰(zhàn)。讓專人來對(duì)電影和音樂進(jìn)行人工分類和標(biāo)記,確實(shí)是一項(xiàng)艱巨的任務(wù)。但有些任務(wù)不僅艱巨,甚至是幾乎不可能完成的。比如訓(xùn)練無人駕駛汽車?yán)锏膶?dǎo)航系統(tǒng),讓其能夠?qū)⑵渌囕v與正在過馬路的行人區(qū)分開來;或者是每天對(duì)社交網(wǎng)站上用戶上傳的千千萬萬張的照片和視頻進(jìn)行標(biāo)記、分類和篩查。

唯一能夠解決這一難題的方法就是神經(jīng)網(wǎng)絡(luò)。理論上我們可以用常規(guī)的神經(jīng)網(wǎng)絡(luò)來進(jìn)行圖像分析,但在實(shí)際操作中,從計(jì)算角度看,使用這種方法的成本非常高。舉例來說,一個(gè)常規(guī)的神經(jīng)網(wǎng)絡(luò),就算是處理一個(gè)非常小的圖像,假設(shè)是30*30像素圖像,仍需要900個(gè)數(shù)據(jù)輸入和五十多萬個(gè)參數(shù)。這樣的處理加工對(duì)一個(gè)相對(duì)強(qiáng)大的機(jī)器來說還是可行的;但是,如果需要處理更大的圖像,假設(shè)是500*500像素的圖像,那么機(jī)器所需的數(shù)據(jù)輸入和參數(shù)數(shù)量就會(huì)大大增加,增加到難以想象的地步。

除此之外,將神經(jīng)網(wǎng)絡(luò)用于“圖像識(shí)別”還可能會(huì)導(dǎo)致另一個(gè)問題——過度擬合。簡單來說,過度擬合指的是系統(tǒng)訓(xùn)練的數(shù)據(jù)過于接近定制的數(shù)據(jù)模型的現(xiàn)象。這不僅會(huì)在大體上導(dǎo)致參數(shù)數(shù)量的增加(也就是進(jìn)一步計(jì)算支出的增加),還將削弱“圖像識(shí)別”在面臨新數(shù)據(jù)時(shí)其他常規(guī)功能的正常發(fā)揮。

真正的解決方案——卷積

幸運(yùn)的是,我們發(fā)現(xiàn),只要在神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)方式上做一個(gè)小小的改變,就能使大圖像的處理更具可操作性。改造后的神經(jīng)網(wǎng)絡(luò)被稱作“卷積神經(jīng)網(wǎng)絡(luò)”,也叫CNNs或ConvNets。

神經(jīng)網(wǎng)絡(luò)的優(yōu)勢之一在于它的普遍適應(yīng)性。但是,就像我們剛剛看到的,神經(jīng)網(wǎng)絡(luò)的這一優(yōu)勢在圖像處理上實(shí)際上是一種不利因素。而“卷積神經(jīng)網(wǎng)絡(luò)”能夠?qū)Υ俗鞒鲆环N有意識(shí)的權(quán)衡——為了得到一個(gè)更可行的解決方案,我們犧牲了神經(jīng)網(wǎng)絡(luò)的其他普遍性功能,設(shè)計(jì)出了一個(gè)專門用于圖像處理的網(wǎng)絡(luò)。

在任何一張圖像中,接近度與相似度的關(guān)聯(lián)性都是非常強(qiáng)的。準(zhǔn)確地說,“卷積神經(jīng)網(wǎng)絡(luò)”就是利用了這一原理。具體而言就是,在一張圖像中的兩個(gè)相鄰像素,比圖像中兩個(gè)分開的像素更具有關(guān)聯(lián)性。但是,在一個(gè)常規(guī)的神經(jīng)網(wǎng)絡(luò)中,每個(gè)像素都被連接到了單獨(dú)的神經(jīng)元。這樣一來,計(jì)算負(fù)擔(dān)自然加重了,而加重的計(jì)算負(fù)擔(dān)實(shí)際上是在削弱網(wǎng)絡(luò)的準(zhǔn)確程度。

卷積網(wǎng)絡(luò)通過削減許多不必要的連接來解決這一問題。運(yùn)用科技術(shù)語來說就是,“卷積網(wǎng)絡(luò)”按照關(guān)聯(lián)程度篩選不必要的連接,進(jìn)而使圖像處理過程在計(jì)算上更具有可操作性。“卷積網(wǎng)絡(luò)”有意地限制了連接,讓一個(gè)神經(jīng)元只接受來自之前圖層的小分段的輸入(假設(shè)是3×3或5×5像素),避免了過重的計(jì)算負(fù)擔(dān)。因此,每一個(gè)神經(jīng)元只需要負(fù)責(zé)處理圖像的一小部分(這與我們?nèi)祟惔竽X皮質(zhì)層的工作原理十分相似——大腦中的每一個(gè)神經(jīng)元只需要回應(yīng)整體視覺領(lǐng)域中的一小部分)。

“卷積神經(jīng)網(wǎng)絡(luò)”的內(nèi)在秘密

“卷積神經(jīng)網(wǎng)絡(luò)”究竟是如何篩選出不必要的連接的呢?秘密就在于兩個(gè)新添的新型圖層——卷積層和匯聚層。我們接下來將會(huì)通過一個(gè)實(shí)操案例:讓網(wǎng)絡(luò)判斷照片中是否有“奶奶”這一對(duì)象,把“卷積神經(jīng)網(wǎng)絡(luò)”的操作進(jìn)行分解,逐一描述。

第一步,“卷積層”。“卷積層”本身實(shí)際上也包含了幾個(gè)步驟:

1.首先,我們會(huì)將奶奶的照片分解成一些3×3像素的、重疊著的拼接圖塊。

2.然后,我們把每一個(gè)圖塊運(yùn)行于一個(gè)簡單的、單層的神經(jīng)網(wǎng)絡(luò),保持權(quán)衡不變。這一操作會(huì)使我們的拼接圖塊變成一個(gè)圖組。由于我們一開始就將原始圖像分解成了小的圖像(在這個(gè)案例中,我們是將其分解成了3×3像素的圖像),所以,用于圖像處理的神經(jīng)網(wǎng)絡(luò)也是比較好操作的。

3.接下來,我們將會(huì)把這些輸出值排列在圖組中,用數(shù)字表示照片中各個(gè)區(qū)域的內(nèi)容,數(shù)軸分別代表高度、寬度和顏色。那么,我們就得到了每一個(gè)圖塊的三維數(shù)值表達(dá)。(如果我們討論的不是奶奶的照片,而是視頻,那么我們就會(huì)得到一個(gè)四維的數(shù)值表達(dá)了。)

說完“卷積層”,下一步是“匯聚層”。

“匯聚層”是將這個(gè)三維(或是四維)圖組的空間維度與采樣函數(shù)結(jié)合起來,輸出一個(gè)僅包含了圖像中相對(duì)重要的部分的聯(lián)合數(shù)組。這一聯(lián)合數(shù)組不僅能使計(jì)算負(fù)擔(dān)最小化,還能有效避免過度擬合的問題。

最后,我們會(huì)把從“匯聚層”中得出的采樣數(shù)組作為常規(guī)的、全方位連接的神經(jīng)網(wǎng)絡(luò)來使用。通過卷積和匯聚,我們大幅度地縮減了輸入的數(shù)量,因此,我們這時(shí)候得到的數(shù)組大小是一個(gè)正常普通網(wǎng)絡(luò)完全能夠處理的,不僅如此,這一數(shù)組還能保留原始數(shù)據(jù)中最重要的部分。這最后一步的輸出結(jié)果將最終顯示出系統(tǒng)有多少把握作出“照片中有奶奶”的判斷。

以上只是對(duì)“卷積神經(jīng)網(wǎng)絡(luò)”工作過程的簡單描述,現(xiàn)實(shí)中,其工作過程是更加復(fù)雜的。另外,跟我們這里的案例不同,現(xiàn)實(shí)中的“卷積神經(jīng)網(wǎng)絡(luò)”處理的內(nèi)容一般包含了上百個(gè),甚至上千個(gè)標(biāo)簽

“卷積神經(jīng)網(wǎng)絡(luò)”的實(shí)施

重新開始建立一個(gè)“卷積神經(jīng)網(wǎng)絡(luò)”是一項(xiàng)非常耗時(shí)且昂貴的工作。不過,許多API最近已經(jīng)實(shí)現(xiàn)了——讓組織在沒有內(nèi)部計(jì)算機(jī)視覺或機(jī)器學(xué)習(xí)專家的幫助下,完成圖像分析的收集工作。

“谷歌云視覺”是谷歌的視覺識(shí)別API,它是以開源式TensorFlow框架為基礎(chǔ)的,采用了一個(gè)REST API。“谷歌云視覺”包含了一組相當(dāng)全面的標(biāo)簽,能夠檢測單個(gè)的對(duì)象和人臉。除此之外,它還具備一些附加功能,包括OCR和“谷歌圖像搜索”。

“IBM沃森視覺識(shí)別”技術(shù)是“沃森云開發(fā)者”的重要組成部分。它雖然涵蓋了大量的內(nèi)置類集,但實(shí)際上,它是根據(jù)你所提供的圖像來進(jìn)行定制類集的訓(xùn)練的。與“谷歌云視覺”一樣,“IBM沃森視覺識(shí)別”也具備許多極好的功能,比如OCR和NSFW檢測功能。

Clarif.ai是圖像識(shí)別服務(wù)的“后起之秀”,它采用了一個(gè)REST API。值得一提的是,Clarif.ai包含了大量的單元,能夠根據(jù)特定的情境定制不同的算法。像婚禮、旅游甚至食物。

上面的這些API更適用于一些普通的程序,但對(duì)于一些特殊的任務(wù),可能還是需要“對(duì)癥下藥”,制定專門的解決方案。不過值得慶幸的是,許多數(shù)據(jù)庫可以處理計(jì)算和優(yōu)化方面的工作,這或多或少地減輕了數(shù)據(jù)科學(xué)家和開發(fā)人員的壓力,讓他們有更多精力關(guān)注于模型訓(xùn)練。其中,大部分的數(shù)據(jù)庫,包括TensorFlow,深度學(xué)習(xí)4J和Theano,都已經(jīng)得到了廣泛、成功的應(yīng)用。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 圖像識(shí)別
    +關(guān)注

    關(guān)注

    9

    文章

    520

    瀏覽量

    38291
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    基于DSP的快速紙幣圖像識(shí)別技術(shù)研究

    本課題通過對(duì)現(xiàn)有圖像識(shí)別技術(shù)進(jìn)行研究和分析,針對(duì)當(dāng)前DSP(數(shù)字信號(hào)處理)技術(shù)的新發(fā)展,提出了基于DSP的快速圖像識(shí)別概念。快速圖像識(shí)別
    發(fā)表于 11-05 14:43

    如何構(gòu)建基于圖像識(shí)別的印制線路板精密測試系統(tǒng)?

    如何構(gòu)建基于圖像識(shí)別的印制線路板精密測試系統(tǒng)?圖像識(shí)別技術(shù)在印刷線路板精密測試中的應(yīng)用
    發(fā)表于 04-27 06:25

    對(duì)于圖像識(shí)別的引入、原理、過程、應(yīng)用前景的深度剖析

    抽取和選擇、分類器設(shè)計(jì)和分類決策。簡單分析了圖像識(shí)別技術(shù)的引入、其技術(shù)原理以及模式識(shí)別等,之后介紹了神經(jīng)網(wǎng)絡(luò)的
    的頭像 發(fā)表于 12-21 15:01 ?6493次閱讀

    簡單介紹圖像識(shí)別技術(shù)在各類行業(yè)的應(yīng)用

    其實(shí)對(duì)于圖像識(shí)別技術(shù),大家已經(jīng)不陌生,人臉識(shí)別、虹膜識(shí)別、指紋識(shí)別等都屬于這個(gè)范疇,但是圖像識(shí)別
    的頭像 發(fā)表于 01-23 11:26 ?3.5w次閱讀

    圖像識(shí)別技術(shù) 推動(dòng)智能科技時(shí)代發(fā)展

    隨著圖像識(shí)別技術(shù)的不斷發(fā)展和應(yīng)用,圖像識(shí)別概念,我相信大家都有所了解,知道它是什么,簡單來件,就是對(duì)圖像進(jìn)行
    的頭像 發(fā)表于 06-18 10:22 ?3613次閱讀

    使用FPGA平臺(tái)實(shí)現(xiàn)遺傳算法的圖像識(shí)別的研究設(shè)計(jì)說明

    利用模板匹配方法,采用基于遺傳算法的圖像識(shí)別技術(shù),完成了對(duì)圖像目標(biāo)識(shí)別的算法驗(yàn)證。在此基礎(chǔ)上進(jìn)行了基于該算法的圖像識(shí)別系統(tǒng)的FPGA實(shí)現(xiàn),并
    發(fā)表于 01-26 15:02 ?13次下載
    使用FPGA平臺(tái)實(shí)現(xiàn)遺傳算法的<b class='flag-5'>圖像識(shí)別的</b>研究設(shè)計(jì)說明

    卷積神經(jīng)網(wǎng)絡(luò)用于圖像識(shí)別的原理

    在機(jī)器視覺領(lǐng)域,圖像識(shí)別是指軟件識(shí)別人物、場景、物體、動(dòng)作和圖像寫入的能力。為了實(shí)現(xiàn)圖像識(shí)別,計(jì)算機(jī)可以結(jié)合人工智能軟件和攝像機(jī)使用機(jī)器視覺技術(shù)
    發(fā)表于 08-20 09:56 ?1289次閱讀
    卷積神經(jīng)網(wǎng)絡(luò)用于<b class='flag-5'>圖像識(shí)別的</b>原理

    編程語言那么多,最適合圖像識(shí)別的是哪種呢?

    這段時(shí)間垃圾分類相關(guān)小程序、APP的上線,讓圖像識(shí)別又一次進(jìn)入人們的視線,我國圖像識(shí)別技術(shù)在全世界都排在前列。
    的頭像 發(fā)表于 01-09 09:14 ?930次閱讀

    如何使用Python進(jìn)行圖像識(shí)別的自動(dòng)學(xué)習(xí)自動(dòng)訓(xùn)練?

    如何使用Python進(jìn)行圖像識(shí)別的自動(dòng)學(xué)習(xí)自動(dòng)訓(xùn)練? 使用Python進(jìn)行圖像識(shí)別的自動(dòng)學(xué)習(xí)和自動(dòng)訓(xùn)練需要掌握一些重要的概念和技術(shù)。在本文中,我們將介紹如何使用Python中的一些常用庫和算法來實(shí)現(xiàn)
    的頭像 發(fā)表于 01-12 16:06 ?610次閱讀

    圖像識(shí)別技術(shù)原理 圖像識(shí)別技術(shù)的應(yīng)用領(lǐng)域

    圖像識(shí)別技術(shù)是一種通過計(jì)算機(jī)對(duì)圖像進(jìn)行分析和理解的技術(shù)。它借助計(jì)算機(jī)視覺、模式識(shí)別、人工智能等相關(guān)技術(shù)
    的頭像 發(fā)表于 02-02 11:01 ?2562次閱讀

    圖像檢測和圖像識(shí)別的區(qū)別是什么

    詳細(xì)的比較和分析。 定義和概念 圖像檢測(Image Detection)是指利用計(jì)算機(jī)視覺技術(shù)對(duì)圖像中的特定目標(biāo)進(jìn)行定位和識(shí)別的過程。它通常包括目標(biāo)的檢測、分類和定位三個(gè)步驟。
    的頭像 發(fā)表于 07-03 14:41 ?1075次閱讀

    圖像識(shí)別屬于人工智能嗎

    屬于。圖像識(shí)別是人工智能(Artificial Intelligence, AI)領(lǐng)域的一個(gè)重要分支。 一、圖像識(shí)別概述 1.1 定義 圖像識(shí)別是指利用計(jì)算機(jī)技術(shù)對(duì)
    的頭像 發(fā)表于 07-16 10:44 ?1190次閱讀

    圖像識(shí)別技術(shù)的原理是什么

    圖像識(shí)別技術(shù)是一種利用計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)技術(shù)對(duì)圖像進(jìn)行分析和理解的技術(shù)。它可以幫助計(jì)算機(jī)識(shí)別
    的頭像 發(fā)表于 07-16 10:46 ?1152次閱讀

    圖像識(shí)別算法都有哪些方法

    圖像識(shí)別算法是計(jì)算機(jī)視覺領(lǐng)域的核心任務(wù)之一,它涉及到從圖像中提取特征并進(jìn)行分類、識(shí)別和分析的過程。隨著深度學(xué)習(xí)技術(shù)的不斷發(fā)展,圖像識(shí)別算法已
    的頭像 發(fā)表于 07-16 11:14 ?5708次閱讀

    圖像檢測和圖像識(shí)別的原理、方法及應(yīng)用場景

    圖像檢測和圖像識(shí)別是計(jì)算機(jī)視覺領(lǐng)域的兩個(gè)重要概念,它們?cè)谠S多應(yīng)用場景中發(fā)揮著關(guān)鍵作用。 1. 定義 1.1 圖像檢測 圖像檢測(Object Detection)是指在
    的頭像 發(fā)表于 07-16 11:19 ?4505次閱讀
    主站蜘蛛池模板: 怡春院国产精品视频| WRITEAS塞红酒瓶| 亚洲国产精品无码中文字幕| 亚洲大爷操| 一个吃奶两个添下面H| 曰本熟妇乱妇色A片在线| 中文字幕亚洲乱码熟女在线萌芽| 99久久精品国产自免费| 成人中文字幕在线观看| 国产人妻人伦精品无码.麻豆| 精品一卡2卡三卡4卡乱码精品视频 | 好男人免费观看在线高清WWW| 久久www成人看片| 欧美内射深插日本少妇| 少妇久久久久久被弄高潮| 亚洲人精品午夜射精日韩| 97精品视频在线观看| 国产爱豆果冻传媒在线观看视频 | 被两根巨大同时进去高H| 国产69精品久久久久APP下载| 国产在线播放精品视频| 美国z0069| 午夜向日葵高清在线观看| 永久免费的污视频网站| 成人女人A级毛片免费软件| 含羞草免费完整视频在线观看 | 国产女合集第六部| 久久亚洲国产成人影院| 日本视频久久| 野花高清在线观看免费3中文| 波多野结衣 无码片| 花蝴蝶免费观看影视| 欧美一区二区三区免费播放| 亚洲成色WWW久久网站夜月| 97色伦图片97色伦图影院久久| 国产盗摄TP摄像头偷窥| 美丽的姑娘BD在线观看| 小小水蜜桃视频高清在线播放| 97影院理论午夜伦不卡偷| 国产亚洲精品精华液| 欧美性猛交AAA片|