尤物国产在线精品福利一区,中文字幕在线观看,亚洲精品在线免费观看视频

在訓練神經網絡的時候，經常會出現「缺數據」的情況。

這時候，就需要「數據增強」來獲取更多數據。而近幾年，鏡像反轉成了最為常用的方法之一。

轉一次，獲得2倍數據，真香！

然而，事情卻沒有想像中的那么簡單——當翻轉了數據集里所有的圖片時，神經網絡所擬合的函數，還能代表原先的圖像分布么？

針對這一問題，來自康奈爾大學的研究員，首次挑戰了常規神經網絡訓練中，圖片「翻轉不變性」（flip-invariant）的這一假設。

研究的題目叫做視覺手性（Visual Chirality），并在CVPR 2020中獲得了最佳論文提名。

注：手性的定義為「一個物體無法與其鏡像相重合」。「視覺手性」一詞啟發自手性，意指「計算機視覺領域中圖像分布與其鏡像分布的區別」。

而該研究的一作，是此屆CVPR大會上年紀最小的獲獎者，年僅21歲的華人科研新秀——林之秋。

這項研究在多種領域（人臉，互聯網圖片，數字處理圖像）上利用卷積神經網絡，發現了許多常人難以捕捉的「視覺手性」線索。

通過自監督訓練，在多項數據集上達到了60%，甚至到90%的精度。

鏡像翻轉的圖像，能不變？

為了理解這一鏡像翻轉話題，我們先來看下這樣的一個例子：

在上面這張圖中，你能判斷出哪些圖像被翻轉了嗎？答案如下：

圖一：鏡像翻轉（線索：文字）。我們可以很容易看出來文字被翻轉過了。

圖二：沒有翻轉（線索：紐扣）。男士襯衫的紐扣一般位于身體右側。

圖三：鏡像翻轉（線索：吉他）。吉他手的主手應當在吉他右側。

鏡像翻轉對于人類而言并沒有多少區別（如圖二和圖三），因而難以判斷。

然而，神經網絡卻可以通過自監督訓練的方法在這個任務上達到非常高的精度，并能指出圖片中哪些區域可以被用于識別鏡像翻轉。

手性代表著單個圖片的翻轉不對稱性，而視覺手性（Visual Chirality）則是針對圖像分布所定義的翻轉不對稱性。

當一個圖像分布具備視覺手性時，使用鏡像翻轉作為數據增強方法，將不可避免的改變一個數據集所代表的分布。

換句話說，只有當一個圖像分布不具備視覺手性的時候，才能在不改變原先圖像分布的前提下，使用鏡像翻轉來增強數據集。

然而，視覺手性是大部分視覺領域都擁有的屬性。正如此篇文章作者，谷歌AI科學家Noah Snavely教授所說：

在計算機視覺的研究中，我們常把這個世界視為”翻轉不變“的，鏡像翻轉因而是一個常規的數據增強方法。

然而，當你翻轉圖片后，文字將被顛倒，左手變為右手，而螺旋意大利面也將朝相反方向旋轉。

那么，這項研究又是如何挑戰了，人們先前在計算機視覺中，對于「翻轉不變性」假設的呢？

實驗過程

這項研究利用了自監督學習方法來訓練卷積神經網絡。

對于任何一個數據集，只需要將其原有的圖片標記為「無翻轉」，并將鏡像翻轉過的圖片標記為「有翻轉」，即可訓練神經網絡識別鏡像翻轉這個二分類任務（binary classification）。

同時，可以根據神經網絡在驗證集的表現，來評估這一圖像分布是否具備視覺手性：

如果驗證集上的精度要顯著大于50%，便有充足的證據來證明視覺手性的存在。

這項研究利用了ResNet-50作為基本的網絡結構，并使用SGD方法來訓練網絡。

為了了解神經網絡學到了哪些視覺手性線索，研究人員利用了類激活映射（CAM：Class Ac tivation Map）方法，在原有圖片上對于視覺手性敏感的區域進行了高亮。

同時因為能造成視覺手性的現象有很多，研究人員還推出了一個簡單的基于類激活映射的聚類方法——手性特征聚類（Chiral Feature Clustering）。

在互聯網圖片集上，神經網絡在鏡像翻轉識別上取得了高達60%-80%的精度。

研究人員在Instagram圖片集上進行了手性特征聚類，并挑選了一系列與人們生活相關的典型視覺手性現象進行討論。

手機：對著鏡子自拍是人們最愛做的事。此類照片具有視覺手性，因為手機的攝像頭一般固定在手機背面的一側（因品牌而異），同時由于多數人是右撇子，一般都以右手持手機進行自拍。

吉他：幾乎大多數的吉他手都以右手撥弦，左手持把。

手表：手表一般都被帶在人們的右手側。

為了深入了解人臉的視覺手性現象，研究人員在人臉數據集上進行了孤立訓練。

在Flickr-Faces-HQ （FFHQ）人臉數據集上進行了訓練，并在測試集上取得了高達81%的精度，還利用手性特征聚類對人臉中的視覺手性現象進行了初步的探討：

劉海分界處：人們一般用右手來分理劉海，這會導致劉海的朝向向一側偏移，并出現視覺手性現象。

眼睛：人們在看向物體時傾向于用一只主視眼進行瞄準，這樣會導致人們的目光在進行拍攝時出現偏移。多數人的主視眼為右眼，而這一現象可能是導致視覺手性現象的成因。

胡子：與頭發一樣，可能與人們習慣于用右手理胡子有關。

文中對以上的視覺手性現象的討論均為初步的分析，而人臉中任有大量的視覺手性線索值得被發掘。

除此之外，研究人員還對數字圖像處理過程（例如去馬賽克和圖片壓縮）中產生的視覺手性現象進行了分析。

舉個例子，當研究人員首次利用神經網絡，在Instagram數據集上進行自監督訓練時，發現沒有使用隨機剪裁（random cropping）的神經網絡。

但在部分圖片上，類激活映射所得到的熱圖更著重關注圖片的邊緣部分，如下圖所示：

而在使用隨機剪裁之后，研究人員得到的新的熱圖，則更關注來自于圖片中物體本身的線索。

研究人員提出：當數字圖像處理過程和鏡像翻轉不具備「交換律」時，視覺手性將會憑空產生在一個圖像分布上。

作者通過概率論與群論（group theory），對此假設進行了嚴謹的數學論證，并通過神經網絡實驗驗證了這一現象在互聯網圖片中廣泛存在。

而此類的線索往往不能被肉眼可見，卻在圖片中存在固定的模式，因而為圖像識偽的應用創造了可能性。

98年華人科學新秀

這項研究的第一作者，是98年生的華人科學新秀——林之秋。

林之秋17歲便考入美國“常春藤”盟校——康奈爾大學，而這也是他「開掛人生」的開始。

林之秋僅用兩年時間就全部修完計算機和數學兩個專業的本科課程，并從大二開始選修博士課程，同時跟隨計算機系的教授從事科研工作。

他在多項專業課上，例如多元微積分、線性代數、高等抽象代數、人工智能、計算機操作系統等都取得過第一名。

由于成績極為優異，自大二起林之秋就接受計算機系里邀請，以助教身份給高年級同學講課，為康奈爾科技學院編寫碩士生的預修課程，甚至在高階機器學習課上給博士生的試卷打分。

而這篇「CVPR 2020最佳論文提名」的研究，是林之秋從大二就開始著手準備的項目，這也顯示了他「超級大學霸」的真實實力。

如今，本科畢業的林之秋，總成績在學院數千名學生中名列前三，并受院長邀請在畢業典禮上代表學院舉旗。之后，他即將前往卡內基梅隆機器人學院，攻讀計算機視覺博士學位。

在此，也預祝林之秋同學，能夠在科研的道路上，繼續乘風破浪！

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

神經網絡

神經網絡

+關注

關注
42

文章
4779

瀏覽量
101054
函數

函數

+關注

關注
3

文章
4345

瀏覽量
62885
計算機視覺

計算機視覺

+關注

關注
8

文章
1700

瀏覽量
46082

原文標題：21歲華人本科生，憑什么拿下CVPR 2020最佳論文提名？

文章出處：【微信號：TheAlgorithm，微信公眾號：算法與數據結構】歡迎添加關注！文章轉載請注明出處。

Docker-鏡像的分層-busybox鏡像制作

目錄知識點1：鏡像的分層示例：進入 docker hub查看Jenkins的Dockerfile 知識點2：base鏡像知識點3：scratch鏡像 scratch 鏡像是什么？

發表于 01-15 10:44 ?101次閱讀

Docker-<b class='flag-5'>鏡像</b>的分層-busybox<b class='flag-5'>鏡像</b>制作

華為云 X 實例的鏡像管理詳解

前言隨著云計算的不斷普及，云服務器成為企業和開發者日常工作中的重要工具。為了提升工作效率和降低運維成本，云服務器鏡像的管理尤為重要。鏡像作為服務器或磁盤的模板，預裝了操作系統、軟件及配置，是快速

發表于 01-07 17:01 ?130次閱讀

Dockerfile鏡像制作與Docker-Compose容器編排

Dockerfile鏡像制作 docker/podman中，鏡像是容器的基礎，每次執行docker run的時候都會指定哪個基本鏡像作為容器運行的基礎。我們之前的docker的操作都是使用來

發表于 01-07 11:01 ?131次閱讀

Dockerfile<b class='flag-5'>鏡像</b>制作與Docker-Compose容器編排

OpenHarmony通過掛載鏡像來修改鏡像內容，RK3566鴻蒙開發板演示

OpenHarmony通過掛載鏡像來修改鏡像內容的教程，提高修改鏡像內容效率！

發表于 01-03 14:21 ?162次閱讀

OpenHarmony通過掛載<b class='flag-5'>鏡像</b>來修改<b class='flag-5'>鏡像</b>內容，RK3566鴻蒙開發板演示

先進封裝中的翻轉芯片技術概述

引言翻轉芯片技術已成為半導體行業中不可或缺的封裝方法，在性能、尺寸減小和功能增加方面具有優勢。本文概述翻轉芯片技術，包括晶圓凸塊制作工藝、組裝方法和進展。翻轉芯片技術簡介翻轉芯片

發表于 11-27 10:58 ?586次閱讀

詳解寄存器模型鏡像值

DUT的配置寄存器的值是實際值，reg_model有鏡像值、期望值的概念。

發表于 10-23 09:43 ?362次閱讀

手動構建Docker鏡像的方法

不推薦使用docker commit命令，而應該使用更靈活、更強大的dockerfile來構建docker鏡像。

發表于 08-05 15:30 ?579次閱讀

圖像識別算法的提升有哪些

方法。數據增強數據增強是提高圖像識別算法性能的一種有效方法。通過對訓練數據進行變換和擴展，可以增加數據的多樣性，提高模型的泛化能力。常見的數據增強方法包括： 2.1 旋轉、縮放、平移和翻轉通過對圖像進行旋轉、縮放

發表于 07-16 11:12 ?724次閱讀

esp32能不能直接跑opencv？有沒有在板子上面做圖像處理的庫？

esp32能不能直接跑opencv,有沒有在板子上面做圖像處理的庫

發表于 06-13 06:59

adxl367在進行參考活動檢測時，能不能讓參考值不變？

adxl367在進行參考活動檢測時，參考值是實時一直變化的，能不能讓參考值不變

發表于 06-03 08:41

華中科技大學開源鏡像站上線44個軟件鏡像，歡迎下載

此站早在去年11月即在學校內部試運行，正式開放之前，已積累大量開放資源，包括44款開源軟件的最新版本。截至目前，該鏡像庫已有超40TB的有效鏡像數據。

發表于 05-09 15:53 ?637次閱讀

國產芯片POL8903圖像處理芯片-LVDS轉MIPI帶旋轉

處理引擎支持圖像鏡像翻轉處理;支持圖像 90°/270°旋轉處理; 封裝形式 LFBGA196(10mm*10mm) 系統高性能

發表于 04-09 15:16 ?1200次閱讀

國產芯片POL8903<b class='flag-5'>圖像</b>處理芯片-LVDS轉MIPI帶旋轉

AD軟件原理圖中怎么鏡像元器件呢？

原理圖中只是電氣性能在圖紙上的表示我，可以對繪制圖形進行水平或者垂直翻轉而不影響電氣屬性。

發表于 03-18 09:06 ?1746次閱讀

求助，關于STM32F103翻轉使用的疑問求解

通用定時器輸出比較TIM2，F103.根據參考手冊輸出比較是CNT與CRR比較。CNT=CRR翻轉。程序設置：定時器時鐘72M，預分頻系數71，ARR=999.CRR為499.實際仿真波形和示波器輸出波形1ms翻轉一次。為什么不是0.5ms

發表于 03-11 07:47

谷歌模型怎么PS打開文件格式不變

要將谷歌模型與Photoshop結合使用，并保持文件格式不變，這通常涉及將谷歌模型生成的圖像或圖形導入到Photoshop中進行進一步編輯或處理。

發表于 02-29 18:09 ?922次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史