一篇來自谷歌和斯坦福2017年的研究今天在twitter和reddit上被熱議。
在這個(gè)讓人啼笑皆非的研究里,為了完成圖像轉(zhuǎn)換的任務(wù),CycleGAN在訓(xùn)練過程中通過人類無法察覺的某種“隱寫術(shù)”,騙過了它的創(chuàng)造者,給自己留下了隱秘的“小抄”,然后順利完成了任務(wù)。
這個(gè)小插曲催生的論文也因此被命名為“CycleGAN, a Master of Steganography”(CycleGAN,一個(gè)隱寫術(shù)大師),被當(dāng)年的NeurIPs收錄。
聽到“騙過人類”覺得有點(diǎn)可怕是不是,先別慌,一起來看看這個(gè)“小把戲”。
為了加快將衛(wèi)星圖像轉(zhuǎn)換為谷歌精確的街道地圖,谷歌團(tuán)隊(duì)使用CycleGAN神經(jīng)網(wǎng)絡(luò)系統(tǒng),希望通過大量的訓(xùn)練,從而使得這個(gè)模型能夠盡可能精確、高效的轉(zhuǎn)換X、Y類型圖片獲得相應(yīng)結(jié)果。
簡單來說,研究者希望通過訓(xùn)練這個(gè)CycleGAN模型,可以實(shí)現(xiàn)兩類圖片的轉(zhuǎn)換:把航拍照變成街道地圖,再把街道地圖變回航拍照。
早期的實(shí)驗(yàn)結(jié)果中,這個(gè)模型做的還不錯(cuò)。
雖然很難深入了解神經(jīng)網(wǎng)絡(luò)流程的內(nèi)部工作原理,但團(tuán)隊(duì)可以輕松審核其生成的數(shù)據(jù)。通過一些實(shí)驗(yàn),他們發(fā)現(xiàn)CycleGAN確實(shí)大幅提升了轉(zhuǎn)化速度。
直到有一天,研究者發(fā)現(xiàn)了奇怪的事情:這個(gè)模型自作主張的根據(jù)航拍衛(wèi)星圖片重建了街道地圖。
比如,在創(chuàng)建街道地圖時(shí),屋頂上的天窗被研究者通過某種設(shè)置被抹掉了,但通過街道圖轉(zhuǎn)化為航拍照后,這些天窗又神奇地出現(xiàn)了。
心存疑惑的研究者開始著手檢查這個(gè)CycleGAN學(xué)到的mapping到底是什么,接著發(fā)現(xiàn)了更多“憑空”出現(xiàn)、根本不可能產(chǎn)生的航拍照。
經(jīng)過一系列檢查,研究者發(fā)現(xiàn)原來是CycleGAN在把航拍照變成地圖的時(shí)候,加入了一些人類肉眼不可見的噪音(或者其實(shí)可以說是信息),然后從地圖reconstruct航拍照的時(shí)候,就通過這些噪音來讀取信息。
就好比,為了應(yīng)付人類任務(wù),AI在地圖照上面偷偷寫了一點(diǎn)小抄/水印,而為了躲過人類的檢查,只有它自己訓(xùn)練出來的模型才讀得懂這些小抄/水印。
這和人類研究者想象的任務(wù)完成途徑完全不一樣。
可能有人會(huì)覺得,只要工作能完成,那么這個(gè)辦法也非常聰明。
但值得一提的是,如果一些細(xì)節(jié)被巧妙插入視覺數(shù)據(jù)中,人眼不會(huì)注意到的數(shù)千個(gè)微小顏色變化,但計(jì)算機(jī)卻可以輕松檢測到。
也就是說,這種方法盡管可以實(shí)現(xiàn)目的,但是非常容易被攻擊。一旦有“攻擊者”在一張地圖照里面加一些肉眼不可見的“小抄”,就會(huì)“重構(gòu)”出來一張牛頭不對馬嘴的照片。
通過這種方式,可以將航空地圖編碼成任何街道地圖!計(jì)算機(jī)在編碼的過程機(jī)中不需要關(guān)注“真實(shí)”的街道地圖,所有重構(gòu)的航空照片所需的數(shù)據(jù)都可以“人畜無害”地疊加在完全不同的街道地圖上。
研究人員也通過實(shí)驗(yàn)證實(shí)了這一點(diǎn):
上圖(c)中的彩色地圖是計(jì)算機(jī)系統(tǒng)引入具有細(xì)微差別的可視化圖片。 圖片形成了和航空地圖差不多的形狀。如果你不把他放大,并且仔細(xì)的觀察,你可能很難發(fā)現(xiàn)這些差別。
這種將數(shù)據(jù)編碼成圖像的做法并不新鮮,這是一門被稱為“隱寫術(shù)”的技術(shù),值得一提的是,它已經(jīng)非常成熟、現(xiàn)在被廣泛應(yīng)用。
現(xiàn)在,似乎計(jì)算機(jī)也學(xué)會(huì)了這種隱寫方法,運(yùn)用此方法機(jī)器可以“偷懶”,從而逃避學(xué)習(xí)、逃避們手頭的任務(wù)。
了解一下Cycle GANs所采用的學(xué)習(xí)方法,出現(xiàn)這一“偷懶”結(jié)果似乎也不意外。
Cycle GANs從X到Y(jié)的G映射的過程中,生成器不是選取一些隱向量來映射,而是使用圖像的直接轉(zhuǎn)換量。使用普通的對抗損失函數(shù)來構(gòu)建一個(gè)映射G。利用G,可以從生成的圖像X映射到真實(shí)圖像Y。
類似地, 我們也有一個(gè)反向的映射, 但這有一定的可能會(huì)使我們丟失原始圖像的一些特性。
所以約束性在Cycle GAN的使用中非常重要。
一旦約束條件不完備,模型很容易出現(xiàn)鉆空子的“偷懶”情況。
今天的熱議中,很多人就此得出了“人工智能正越來越聰明”論斷,從而心生恐懼。
大可不必慌張,這一結(jié)果正說明機(jī)器還不夠聰明,到目前為止,它還不能完成復(fù)雜的圖像類型相互轉(zhuǎn)換等工作。但是,它可以利用人類不善于檢測的弱點(diǎn)欺騙人類。
對計(jì)算結(jié)果的更嚴(yán)格評估可以避免這種情況。
計(jì)算機(jī)所做的事情,全部來自程序命令,所以你的要求也必須明確具體。不過這個(gè)案例給了我們關(guān)于解決神經(jīng)網(wǎng)絡(luò)的弱點(diǎn)的新的思路,對于計(jì)算機(jī)來說如果沒有明確禁止它做什么事,它可以自行找到一個(gè)從細(xì)節(jié)出發(fā),回饋?zhàn)晕业降囊粋€(gè)高效解決既定問題的方式。
這也為提高CycleGAN生成圖像的質(zhì)量提供了有一種可能的途徑,盡管循環(huán)一致性損失能夠讓神經(jīng)網(wǎng)絡(luò)將原圖像的信息編碼映射到生成的圖像中,但是,模型也可以偷偷的通過對抗性學(xué)習(xí)提高欺騙能力。如果能夠找到阻止算機(jī)“打小抄”的方式,這會(huì)使圖圖轉(zhuǎn)換工作得到突破。
-
谷歌
+關(guān)注
關(guān)注
27文章
6211瀏覽量
106516 -
AI
+關(guān)注
關(guān)注
87文章
32487瀏覽量
271697 -
人工智能
+關(guān)注
關(guān)注
1800文章
48094瀏覽量
242228
原文標(biāo)題:谷歌的這只AI學(xué)會(huì)了“打小抄”,還騙過了它的創(chuàng)造者
文章出處:【微信號:robot-1hjqr,微信公眾號:1號機(jī)器人網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
AI賦能邊緣網(wǎng)關(guān):開啟智能時(shí)代的新藍(lán)海
谷歌Gemini AI目標(biāo)年底用戶達(dá)5億
谷歌加速AI部門整合:AI Studio團(tuán)隊(duì)并入DeepMind
谷歌發(fā)布Gemini 2.0 AI模型
云端AI開發(fā)者工具怎么用
微軟GitHub與Anthropic和谷歌合作
谷歌Pixel 9系列AI功能搶眼,蘋果被指AI領(lǐng)域落后
谷歌:聚焦AI與技術(shù)創(chuàng)新,攜手中國開發(fā)者共筑未來
四維圖新出席AutoCC汽車創(chuàng)造者大會(huì)

榮耀新品將搭載谷歌AI功能,提升生成式AI體驗(yàn)
兩小時(shí)“吼出”121次AI,谷歌背后埋伏著Open AI的幽靈

谷歌發(fā)布多模態(tài)AI新品,加劇AI巨頭競爭
Create 2024百度AI開發(fā)者大會(huì) 帶來了哪些新技術(shù)?

評論