通過識別手寫數(shù)字構(gòu)建的人工神經(jīng)網(wǎng)絡一直以來都是重要的研究課題,手寫數(shù)字往往因書寫風格差異、上下文無關及識別準確度高等要求導致識別難度大,因此針對手寫數(shù)字的研究有重大意義。
前段時間,我們報道了錢璐璐團隊通過生物化學實驗,利用 DNA 開發(fā)人工智能神經(jīng)網(wǎng)絡識別手寫數(shù)字。此次,來自加州大學洛杉磯分校的研究團隊Xing Lin 、Yair Rivenson 等人,又從機械層面模擬神經(jīng)元過程,以識別手寫數(shù)字。
要知道,我們通常所見的神經(jīng)網(wǎng)絡學習模型只是對一組數(shù)據(jù)進行一系列計算。最終,這些簡單的數(shù)學計算會得出一個概率值,即輸入的數(shù)據(jù)與機器“學會”識別的各種模式的匹配程度。但事實是,一旦機器訓練后得到最終數(shù)值,那么它將很大程度上一遍又一遍地執(zhí)行相同運算。這通常表明它可以被優(yōu)化,且不會占用太多的空間或 CPU 功耗。
但研究表明,這一過程實際上也可以被固化。
據(jù)了解,該團隊人員發(fā)明了一種由 3D 打印機制造的機械神經(jīng)元,該神經(jīng)元由印有復雜衍射圖案的 3D 打印透明材料層構(gòu)成,其采用的算法可通過分析透過衍射圖案的光線對數(shù)字進行數(shù)學運算。
如上圖所示,更形象點理解的話,就是機械式計算器。過去,計算器使用的是實際的機械部件,也就是某位數(shù)計算到 10 時就會向前挪一位,現(xiàn)在這些運算都是以計算機邏輯完成數(shù)字化運行。因此從某種程度上講,實驗中的“衍射深度神經(jīng)網(wǎng)絡”類似于這種狀況,這是說它使用和操縱數(shù)字的過程是以物理過程而非數(shù)字化進行的。
研究人員表示,“每一層上的任何一點可投射或反射入射波,這相當于利用光學散射相互連接了每個人造神經(jīng)元。通過改變光線間的相位和振幅,每個‘神經(jīng)元’是可調(diào)整的。”
“我們的全光衍射深度神經(jīng)網(wǎng)絡(Diffractive Deep Neural Network (D2NN))能夠以光速執(zhí)行計算機神經(jīng)網(wǎng)絡可實現(xiàn)的各種復雜功能。相比之前幾種光學信號處理技巧,這是最簡單的。
它可以實現(xiàn)手寫數(shù)字和時尚產(chǎn)品的圖像識別,以及太赫茲光譜成像鏡頭的功能。
它也可以在光速環(huán)境下執(zhí)行計算機神經(jīng)網(wǎng)絡可實現(xiàn)的各種復雜功能,并且可以在全光學圖片分析、特征檢測和對象分類中找到應用,同時還可以實現(xiàn)新的拍照設計和光學組件使用 D2NN 完成特殊的任務。”
研究人員在《科學》雜志上發(fā)表的論文中寫道。
為了證明這一點,他們訓練了一個深度神經(jīng)網(wǎng)絡模型來識別手寫數(shù)字。如果運算結(jié)束,他們會采用矩陣數(shù)學層并將其轉(zhuǎn)換成一系列光學轉(zhuǎn)化。例如,一個圖層可以通過將來自另外兩層的光重新聚焦到下一圖層的某個區(qū)域完成數(shù)值加減。不過,真正的計算要比這個復雜得多。
通過在 3D 印刷版上布置數(shù)百萬個微小的轉(zhuǎn)換器,光線從一端到另一端出來的過程,系統(tǒng)可以判斷這個數(shù)字是否為1、2、3,結(jié)果最終識別準確率高達90%以上。
-
神經(jīng)網(wǎng)絡
+關注
關注
42文章
4778瀏覽量
101018 -
3D打印
+關注
關注
26文章
3559瀏覽量
109394
原文標題:利用3D打印構(gòu)建衍射深度神經(jīng)網(wǎng)絡,可光速執(zhí)行數(shù)字運算
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論