神經輻射場(NeRF)這一技術能夠創建人工智能生成的三維環境和三維物體。但這種新的圖像合成技術需要大量的訓練時間,并且缺乏實現實時、高度響應接口的實現。然而,企業和學術界之為這一挑戰提供了新的思路——新視圖合成 (NVS)。
近日,一篇題為Neural Lumigraph Rendering的研究論文聲稱,它對現有的2個數量級圖像進行了改進,展示了通過機器學習管道實現實時 CG 渲染的幾個步驟。與以前的方法相比,神經光圖渲染提供了更好的混合偽像分辨率,并改進了遮擋的處理。除了斯坦福大學(Stanford University)和全息顯示技術公司 Raxium 的研究人員,這篇論文的貢獻者還包括谷歌首席機器學習架構師、 Adobe 的計算機科學家,以及 StoryFile 的首席技術官。體積捕獲的原理是拍攝主題的靜態圖像或視頻,并使用機器學習來「填充」原始文檔未涵蓋的觀點的想法。
上圖取自 Facebook AI 的 2019 AI 研究 ,可以看出體積捕獲的四個階段:
多個攝像機獲取圖像/畫面;
編碼器/解碼器架構(或其他架構)計算并連接視圖的相關性;
射線行進算法計算空間中每個點的體素(或其他 XYZ 空間幾何單位) ;
訓練合成一個完整的實體,可以實時操作。
到目前為止,正是這種數據量大的訓練階段使得新視圖合成超出了實時或高響應捕獲的范疇。事實上,新視圖合成制作了一個完整3D地圖的體積空間,意味著它是把這些點縫合到一個傳統的計算機生成的網格,有效地捕捉和連接一個實時CGI 角色。使用 NeRF 的方法依靠點云和深度圖在捕獲設備的稀疏視點之間生成插值。盡管 NeRF 能夠計算網格,但大多數并不使用它來生成體積場景。相比之下,魏茨曼科學研究所(Weizmann Institute of Science)在2020年10月發布的隱式可區分渲染(IDR)方法,取決于利用從捕獲數組自動生成的3D網格信息。雖然 NeRF 缺乏 IDR 的形狀估計能力,IDR無法比擬的nerf的圖像質量,而且兩者都需要大量的資源來訓練和整理。NLR的Custom相機裝置具有16臺GoPro HERO7和6臺中央Back-Bone H7PRO相機。對于實時渲染,它們的最低運行速度為60fps。
相反,神經光圖渲染利用 SIREN (正弦表示網絡)將每種方法的優點整合到它自己的框架中,目的是生成直接可用于現有實時圖形管道的輸出。在過去一年中,SIREN 已被用于類似場景,現在是圖像合成社區中業余愛好者 Colabs 的一個流行的 API 調用。然而,NLR 的創新是將 SIREN 應用于二維多視圖圖像監控。從陣列圖像中提取 CG 網格后,通過 OpenGL 對網格進行柵格化,將網格的頂點位置映射到適當的像素點,然后計算各種貢獻圖的融合。結果得到的網格比 NeRF 的網格更加具有代表性,需要更少的計算,并且不會將過多的細節應用到不能從中受益的區域(如光滑的面部皮膚) 。
另一方面,NLR 還沒有任何動態照明或重點照明的能力,輸出僅限于陰影地圖和其他照明時獲得的信息。研究人員打算在未來的工作中解決這個問題。此外,論文承認由 NLR 生成的圖形并不像一些替代方法那樣精確,或者前面提到的魏茨曼科學研究。利用神經網絡從一系列有限的照片中創建3D實體的想法早于 NeRF,而相關研究可以追溯到2007年或更早。在2019年,Facebook 的人工智能研究部門發表了一篇開創性的研究論文Neural volume: Learning Dynamic Renderable volume from Images),該論文首次為基于機器學習的體積捕獲生成的合成人啟用了響應界面。
原文標題:做出電影級的 CG 渲染!斯坦福大學研究人員提出神經光圖渲染
文章出處:【微信公眾號:Imagination Tech】歡迎添加關注!文章轉載請注明出處。
責任編輯:haq
-
人工智能
+關注
關注
1794文章
47642瀏覽量
239671 -
機器學習
+關注
關注
66文章
8438瀏覽量
132929
原文標題:做出電影級的 CG 渲染!斯坦福大學研究人員提出神經光圖渲染
文章出處:【微信號:Imgtec,微信公眾號:Imagination Tech】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論