人眼是工程學上的一個奇跡。人體所有感官的受體有70%位于眼睛。40%的大腦皮層被認為與視覺信息處理的某些方面有關聯。
1.視覺通路光是人類視覺刺激的關鍵。光是一種電磁輻射,可以刺激視網膜從而產生視覺。在科學上電磁輻射按波長(即相鄰兩個波峰之間的距離)分類。電磁波譜的整個范圍包括無線電波、紅外線、可見光、紫外線、X光和伽馬射線。如圖1所示,人眼僅能感覺電磁波譜中很窄的一段,即大致為波長380nm至740nm的區間。
圖1:電磁波譜 在現實世界中,物體的可見顏色取決于其吸收或反射的光的波長。只有反射光才能到達人眼,被感覺為某種顏色,即所謂的光譜反射。舉個簡單的例子,一般植物的葉子反射綠色波段,吸收紅色、橙色、藍色和紫色。1.1進入眼睛人眼是一個復雜的光學感應器,人眼與照相機在功能上比較類似。 光通過照相機中的一系列光學元件,然后完成折射和聚焦。通過光圈控制光通量。穿過光圈孔的光最終達到成像平面(膠片/CCD/CMOS)。
圖2:人眼的縱剖面圖 如圖2所示,人眼執行相同的基本功能:角膜和眼球晶狀體執行聚焦功能,而虹膜則相當于相機的光圈控制裝置。與相機不同的是,反向的光場不是落在膠片/CCD/CMOS上,而是落在極其敏感的視網膜上。1.1.1角膜來自視野內各個方向的光最先進入人眼的角膜。角膜是一個透明的球面結構,其表面由組織良好的細胞和蛋白質組成。人眼對光的折射大多數(約80%)在空氣與角膜的界面處完成,這是因為角膜弧面各個點的折射率差別很大。角膜后面是另外一個透明結構,稱為眼球晶狀體。眼球晶狀體是一個精確的聚集結構,因為其形狀可以改變,可以實現光學系統所需的不同有效焦距。這兩個光學結構之間的空間稱為前房。前房充滿了由睫狀體產生的透明水狀液體,稱為房水。房水為中間角膜和眼球晶狀體提供營養(主要是氨基酸和葡萄糖),因為這兩個光學結構自身沒有血液供應。角膜的前側通過眼淚獲取相同的營養——人在眨眼時眼淚就分布在角膜的表面。1.1.2瞳孔光穿過角膜和充滿水狀物的前房后,其中的一部分穿過虹膜中間的孔——虹膜是一個彩色結構。這個孔稱為瞳孔。光通過瞳孔后便刺激視網膜。瞳孔看起來是黑色,這是因為穿過瞳孔的光大多數被眼睛的內側吸收,幾乎沒有反射光。
圖3:瞳孔反射 瞳孔與相機的光圈孔類似,其尺寸可以按視覺刺激的變化而變化。虹膜擴張后的形態如圖3所示。在光比較少的情況下,瞳孔擴大以讓更多的光進入。在明亮的環境下,瞳孔則收縮,尺寸變小。這個不由自主的反應稱為瞳孔反射。1.1.3眼球晶狀體光穿過瞳孔后立即進入一個稱為眼球晶狀體的光學結構。眼球晶狀體是一個幾乎完全透明、柔性的結構,由同心的纖維細胞結構組成。大多數表層纖維代謝活躍,而且與角膜類似,眼球晶狀體從環繞其周圍的液體獲取營養。(1)適應性調節
圖4:眼球晶狀體適應性調節的過程 眼球晶狀體由環繞其外圍的睫狀肌和懸韌帶固定位置。如圖4所示,當眼睛處于松弛的狀態,比如當你隨意眺望遠方時,眼球晶狀體呈平直狀態,這樣就可以實現遠距離視覺所需的最大焦距。為實現這個形狀,環繞眼球晶狀體的睫狀肌(像所有的輻狀肌一樣)由收縮狀態變為擴大、開放的狀態。此時,在連接睫狀肌和眼球晶狀體的懸韌帶上形成向外的張力,從而使眼球晶狀體呈平直狀態。當眼睛關注的是近距離的物體時,則以上過程相反。環繞眼球晶狀體的睫狀肌收縮,這樣便釋放懸韌帶的張力,使眼球晶狀體處于自然的雙面外凸的更接近球狀的形狀,從而增加其關注近距離物體所需的折光力。這個變化過程稱為適應性調節。眼睛正是通過適應性調節來改變其光學能力,使得觀察者可以根據視野中物體的遠近快速變換焦距。 普遍認為視網膜模糊是適應性調節的刺激源,但這個過程與輻輳也有很大的關系。 眼球晶狀體在大約40歲以前都非常具有彈性,40歲以后便逐漸喪失其彈性。因外圍結構的代謝活動而變得越來越僵硬,到55歲左右,睫狀肌的收縮不再能改變眼球晶狀體的形狀。(2)映像反向人眼擁有一個復合的鏡片系統。光進入眼睛時穿過一系列介質,先是穿過空氣,然后進入密度更高的介質(角膜)。大約80%的折射和聚集由角膜實現,剩余的20%由眼球晶狀體實現。角膜是結實的固定鏡片結構,而眼球晶狀體則是可變的、雙面凸起的鏡片結構。按凸透鏡的折射原理,光束會穿過位于另一側的焦點。如圖5所示,進入眼睛的光場在到達視網膜之前在光學上是反向的。
圖5:映像反向1.1.4玻璃體光在穿過眼球晶狀體后進入眼睛的玻璃體,玻璃體充滿透明的膠狀物質,稱為房水。光可以很容易地穿過房水,因為房水在這方面有完美的特性。房水由98%的水、透明質酸(增加黏稠度)、網狀的纖細膠原纖維(房水由此而呈膠狀)以及各種鹽和糖組成。房水基本靜止,不能進行主動性再生,也不能通過血管補給。1.2映像的形成與探測1.2.1視網膜視覺過程始于眼睛的光學結構把光聚集在視網膜(英文“retina”,源于拉丁語“rete”,意思是網絡)上。視網膜是一個多層的感官組織,覆蓋眼睛大約65%的內表面,其功能類似于照相機的膠片/CCD/CMOS。視網膜的厚度為0.15毫米至0.320毫米。
圖6:視網膜形態 如圖6所示,靠近視網膜中間的結構稱為斑,斑的中間稱為中央凹。當我們注視一個物體時,中央凹便自然地將該物體置于中心位置。中央凹是視網膜上靈敏度最高的點。眼睛的整個復雜的上層結構就是為實現視網膜的功能而存在的。
圖7:人眼視網膜的橫截面圖 視網膜幾乎是完全透明的。光落在視網膜上,或者說直接穿過視網膜,直至其最深的一層,這一層稱為色素上皮層,如圖7所示。此時圖像反射回至直接相鄰的一層,這一層上有感光神經元。1.2.2視桿和視錐眼睛感光細胞,因其形狀而稱為視桿和視錐,實際上是背朝光的方向。視桿的數量較多,負責在低光能級時的視覺,是非常靈敏的運動探測器。視桿主要存在于視網膜的外圍區域,負責邊界視覺。視錐在高光能級時處于活躍狀態,空間靈敏度很高,負責感知顏色。 從色素上皮層反射的光與兩種光色素發生化學反應:視錐中的視紫藍質(在明亮的環境下反應)和視桿中的視紫紅質(在昏暗的環境下反應)。這個化學反應稱為異構化,其結果是改變了感光細胞的電性能并釋放神經傳送體(化學傳送體/傳送體物質)。這些神經傳送體刺激相鄰的神經元,從而使神經脈沖在細胞間以接力的方式傳遞。
圖8:不同的視錐和視桿的反應曲線 如圖8所示,按實際測量的反應曲線,單個視錐能感知以下三種光照環境之一:紅色(數量最多),在波長為564nm時最靈敏;綠色,在波長為533nm時最靈敏;藍色,在波長為437納米最靈敏。視桿在波長為498nm時最靈敏(綠色-藍色)。 來自于視桿和視錐的脈沖刺激雙極細胞,后者又相應刺激神經節細胞。這些脈沖傳至神經節細胞的軸突,通過視神經和視覺盲點傳至大腦的視覺中心。1.2.3視桿和視錐的密度每個視網膜內有大約1億至1.2億個視桿感光細胞、7千萬至8千萬個視錐感光細胞。
圖9:視桿和視錐的密度 如圖9所示,大多數視錐集聚于中央凹,而視桿密集于其他區域(不存在于中央凹)。雖然一般白天的光照水平下視覺以視錐的作用為主導,但人眼視網膜中的視桿數量要遠遠多于視錐。 有必要指出的是,視覺盲點區域(更準確地說是視神經頭)沒有感光細胞。沒有感光細胞意味著在這個區域感受不到光,從而使每只眼睛有一個盲點。左眼的視覺盲點位于視覺中心的左方,而右眼的情況則相反。雙眼同時睜開時,我們感覺不到視覺盲點,因為兩個眼睛的視野部分重疊,
圖10:視覺盲點測試圖片 按圖10所示的圖片,可以找到你的視覺盲點。 可以按下述方法找到每只眼睛的視覺盲點:先遮住你的右眼,然后注視圖10中左邊的點。同時保持對圖10中右邊十字形的視覺,但不要直視。然后將臉慢慢靠近圖片。當臉與圖片的距離達到某個點,十字形消失了。按相反的方式重復上述步驟即可找到右眼的盲點。2.空間視覺和深度感知線索每一秒鐘都有幾十億個信息片段傳送到大腦皮層。信息流傳送的過程是信息得以不斷提煉的過程,也是信息的組織復雜性不斷提高的過程。在這個過程的每個階段,神經元按非常具體的刺激模式組織起來,脈沖在大腦皮層的目標區域不同,則其內容和刺激源也不同。理論上,信息表現的性質(神經脈沖的模式)被認為是從模擬性向象征性轉變。2.1非來自于視網膜的信息線索非來自于視網膜的深度信息線索是那些不是由進入眼睛并彌漫在視網膜上的光圖案形成的刺激源或信息片段,而是來自于其他生理過程。2.1.1適應性調節當人眼處于放松的狀態,比如當你隨意眺望遠方時,眼球晶狀體呈平直狀態,這樣就可以實現遠距離視覺所需的最大焦距。
圖11:適應性調節 如圖11所示,當眼睛關注的是近距離的物體時,則以上過程相反。環繞眼球晶狀體的睫狀肌收縮,這樣便釋放懸韌帶的張力,使眼球晶狀體處于自然的雙面外凸的更接近球狀的形狀,從而增加其關注近距離物體所需的折光力。 適應性調節是一個不自覺的生理過程,這樣眼睛的鏡片結構的視覺能力可以變化以聚焦進入眼睛、落在視網膜上的光。普遍認為視網膜模糊是適應性調節的刺激源,但這個過程與輻輳也有很大的關系。也有理論研究認為是睫狀肌本身的運動形成了這種信息線索。2.1.2輻輳最強大的深度信息線索是眼睛的輻輳運動,即雙眼的中央凹同時指向近距離視野中的物體。這個眼球運動功能也是雙眼視覺的基礎。
圖12:輻輳反射 如圖12所示,這個過程意味著雙眼同時繞其縱軸轉動,但方向相反。轉動的角度足以使注視近距離的物體時所投射的圖像與雙眼視網膜的中心對準。當注視近視野中的一個物體時,雙眼以相互趨近的方向轉動,或聚攏。當注視遠視野中的一個物體時,雙眼以相互偏離的方向轉動,或分開。 雙眼以相反的方向轉動,稱為非結合性動作。實際上眼睛的所有其他動作都是一起的,或結合性的。 調節和輻輳通常是相互聯系的生理過程。比如,將眼睛聚焦在遠處的某個東西,然后將你的注意力轉移到近處的某個物體,這個過程的一開始你的雙眼相互靠近以注視近視野中的物體。此時在視網膜上形成的圖像看起來更大,并且模糊(焦距還沒調整好)。這個模糊的圖像于是觸發適應性調節的生理反射,從而使得眼球晶狀體的光能量改變,并將視網膜上的圖像的焦距調整精確。 另外,輻輳和調節提供給大腦的視覺線索并不相互匹配,或者說沒有耦合關系。 上述輻輳線索還有一個方面,就是在六塊眼外肌內形成張力(見圖13),眼外肌控制眼睛的動作。
圖13:六塊眼狀肌2.2雙眼視覺信息線索雙眼視覺深度信息線索是那些雙眼同時觀看一個場景時所探測到的信息源或信息片段,兩只眼睛是從各自稍微不同的有利位置提供這些信息線索。兩只眼睛所看到的場景由大腦進行三維整合,這樣便可以理解現實或虛擬環境。 雙眼視覺是兩只眼睛的視覺。雙眼視覺的主要深度信息線索稱為立體視覺,是視網膜或水平差異性的結果。我們有兩只眼睛,其橫向的平均距離為約2.5英寸(63毫米)。兩只眼睛從各自稍微不同的角度捕捉場景。如圖14所示,立體視覺是通過大腦對兩只眼睛所看到的不同場景根據視網膜影像的不同進行補償、建構而獲得的深度感覺。
圖14:立體視覺 據研究稱,在雙眼視野中,一側視網膜上的點在另一側的視網膜上也有一個對應的點。兩個視網膜上的點相互對應,與觀察者眼前一個稱為雙眼視界的區域有關,如圖15所示。術語“horopter”(雙眼視界)的意思為視覺的范圍,由Fran?oisd'Aguilon(比利時數學家、物理學家和建筑設計師)于1613年首創。這個術語指的是某特定固定距離上物體的點在相應的視網膜結構上所形成影像的軌跡。因此,可以通過物體畫一條線,而這條線上所有的點在兩個視網膜上都有相同的對應點。這樣我們看到的物體就是一個單一的點。理論上,雙眼視界是這樣一個軌跡空間:其中每一個點的成像都對應于雙眼注視的一個點。
圖15:雙眼視界的概念 圖15中,雙眼視界是與注視的差異性對應的點在空間中的軌跡。從理論角度來說,這是在兩個視網膜上投射出在解剖學上相同或對應點的空間中的所有點。注意點R、P和Q如何在兩個視網膜上形成相同的影像 按照這個模型,如果對應的點至視網膜的水平距離正常,則雙眼視界是分別經過兩只眼睛的轉動中心和注視點的圓。因此,當注視點變近,則這個圓變小。2.3單眼視覺信息線索2.3.1運動視差運動視差即觀察者移動時會發現近處的物體看起來比遠處的物體移動得更快,這是一種強大的、相對運動的信息線索。
圖16:運動視差 圖16示意的就是這種現象。從物理學的角度,形成這種視覺現象的原因是圖像在眼睛視網膜上移動的速度。近處的物體相對于遠處的物體進入、穿過和退出你視野的速度快很多。 這種視覺信息線索提供有關相對深度差異的重要信息,可以可靠地建構三維場景,幫助我們在環境中航行。圖像在視網膜上的運動形成兩類運動邊界:與觀察者運動方向平行則提供穿越性的信息;與觀察者的運動方向垂直則提供有關動態遮蔽的信息,即近視野中的物體動態地遮蔽或顯露遠視野中的物體。2.3.2遮擋當一個物體阻擋了觀察者對另一個物體的視線時,便形成遮蔽(又稱為干涉)信息線索。此時觀察者會感覺到處于阻擋位置的物體比被阻擋的物體更近。從圖17可以很清楚地看到一點。
圖17:遮蔽(或干涉) 圖中的汽車一輛一輛地被遮蔽,由此我們可以很明確地感覺到深度。遮蔽所顯示的是相對距離(而不是絕對距離)。 有研究進一步證明了這種信息線索在立體深度感官方面可能很重要。有些研究指出遮蔽信息線索在立體深度感官方面的主要功能是確定深度的非連續性以及阻擋物的邊界。2.3.3刪除和增強遮蔽現象有兩個組成部分:刪除(隱藏)和增強(顯露),指的是當你的觀察點移動時,近視野中的物體或表面顯露或遮蔽遠視野中的物體或表面。 在現實和虛擬的環境中,如果近視野中的物體或表面比遠視野中的物體或表面相對于觀察者的距離要小很多,則當你移動時遠處物體的刪除或增強的速度會更快,如圖18所示。相反,如果兩個物體都在遠視野中且相互之間的距離很小,則刪除或增強的速度要慢一些。
圖18:刪除(隱藏)和增強(顯露) 即使不明顯,無論觀察者往任何方向移動,刪除和增強現象都會發生。2.3.4線性透視線性透視線條會聚集在遠處的某個單一的點,是一種單眼視覺信息線索。如圖19所示,當注視某處走廊的照片時,我們知道圖中的墻壁間的距離并不會越來越小,而是始終保持平行的。
圖19:線性透視2.3.5動態深度效應(源于運動的視覺結構)動態深度效應是由物體的運動形成的對物體的復雜三維結構的感知。沒有移動介質很難解釋或展示,但你可以想象一個懸空在光和墻壁之間的立方體。如果靜止不動,那么這個立方體的輪廓看起來可能像是圖20中的任何一個。即使是圖左上方的四方形從感官上來看也只是一個四方形。但當逐個觀察其余的圖形,大多數觀察者很快就會感覺到這些輪廓圖是源于一個立方體,即使沒有其他深度信息或表面細節。
圖20:動態深度效應 有關如何感知三維形狀主要有兩個理論。第一個理論認為三維形狀感知是因為物體移動時視網膜上所模擬生成的圖像會變化,第二個理論認為是與之前的經驗有關。在大多數情況下,動態深度效應是與其他深度信息線索一同感知,比如上述運動視差。2.3.6尺寸經驗如果知道遠處某個物體的大小,我們的大腦能根據這方面的理解估測絕對距離。有些研究認為,這一點可以重新定性為我們對身體的尺寸和物體的尺寸的相對關系的意識,因為理解一個物體的尺寸必須以某個相對尺寸為基礎,那么身體是我們所擁有的、可以用來作為比較的相對尺寸2.3.7相對尺寸如果兩個物體的尺寸相仿,但因為相對于觀察者的距離不同而看起來尺寸不一樣,我們便能感知在視網膜上成像比較小的距離較遠,而成像較大的則距離較近。這種深度信息線索主要是基于個人經驗。
圖21:相對尺寸 如圖11所示,如果兩個物體的尺寸相同,但與觀察者的距離不一樣,則較遠者在視網膜上所占據的面積要小。如果視網膜上的成像較大,則看起來更近2.3.8立體透視立體透視(又稱為空氣透視)指光因遠處物體或場景與觀察者之間的空氣中有顆粒物(比如水蒸氣和煙塵)而發生散射的效應。如圖22所示,距離越遠,則物體或場景與其背景之間的對比度越小。物體上的標識和細節也是如此。遠處的山變得越來越不飽和,并逐漸過渡到背景顏色。列奧納多·達·芬奇將這種信息線索稱為“消失之透視”。
圖22:立體透視2.3.9紋理遞變紋理遞變是指物體的紋理和圖案隨著相對于觀察者的距離增加看起來發生逐漸變化,即從粗大變得細小(或變得越來越不清楚)。如圖23所示,凸凹有致的鵝卵石隨著相對于觀察者的距離增加變得越來越不清晰,直至變得看起來像是一個連續的平面。
圖23:紋理漸變效應 這種信息線索有以下三個特點: ?透視逐漸過渡——隨著距離增加,與傾面或觀察角度垂直的單個紋理圖案間的分割度變得越來越小。 ?壓縮逐漸過渡——隨著距離增加,紋理圖案的視覺高度變得越來越小。 ?密度逐漸過渡——隨著距離增加,視覺單位面積的紋理圖案數變得越來越大。2.3.10照明/影線/陰影照明、影線和陰影是感知場景深度和物體幾何尺寸的有力信息線索,其效果的變化范圍很大。陰影的角度和對比度影響所感知的深度。一個物體因另一個物體而形成的陰影和反射可提供關于距離和位置的信息。如果一個物體的陰影較小、較清晰,則一般表明該物體至陰影投影所在物體或平面的距離較小。類似地,如果增大陰影面積并使陰影的輪廓邊緣模糊,在視覺上會感覺深度更大。光與非平整表面的交互方式可在很大程度上顯示其幾何尺寸和紋理的信息。圖24顯示了這方面的幾種不同效果。
圖24:影線和陰影2.3.11視像擴大將你的手臂平直伸出,手掌向上,然后將你的手慢慢向臉移動。當你的手越來越靠近,投射于你的視網膜上的圖像相應變得越來越大、遮蔽的背景也越來越多。這種視覺信息線索稱為視像擴大,這不僅可以幫助觀察者感覺物體的移動,還有助于觀察者感覺距離。 人在很小的年紀便開始形成這種對動態刺激源的感知,比如,我們可以觀察到嬰兒在一個物體直接向其移動時會表現出協調一致的防御性反應。 圖25是用靜止畫面表示這種視覺信息線索的效果。不僅距離越小物體看起來越大,而且背景信息線索越來越少,直至消失。
圖25:視像擴大的視覺效果2.3.12相對高度在一般的視覺條件下,對于處在同一平面的不同物體,處于近視野者的視網膜成像位于視網膜的下部區域,而處于遠視野者的視網膜成像位于視網膜的上部區域。這種現象可以通過圖26所示的簡單例子來解釋。
圖26:相對高度的概念 其中的關鍵是你的高度相對于視野中的物體的高度。相反,如果是位于你的視點上方的同一平面上的不同被觀察物,比如天花板上的一排燈籠,近處的物體位于視網膜的下部區域,遠處的物體則處于上部區域。很多個世紀以前藝術家就開始采用這種技術在二維的圖紙和繪畫上描繪深度。
審核編輯 :李倩
-
電磁
+關注
關注
15文章
1138瀏覽量
51907 -
三維
+關注
關注
1文章
512瀏覽量
29023 -
無線電波
+關注
關注
2文章
257瀏覽量
25727 -
視覺
+關注
關注
1文章
147瀏覽量
23995
原文標題:視覺的機制
文章出處:【微信號:機器視覺沙龍,微信公眾號:機器視覺沙龍】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論