色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于姿態信息生成全身的高分辨率圖像的新框架

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-05-14 17:44 ? 次閱讀

近日,和任天堂關系密切的日本網絡服務公司DeNA發布了一篇頗為有趣的文章:Full-body High-resolution Anime Generation with Progressive Structure-conditional Generative Adversarial Networks,即用PSGAN生成高分辨率的全身動畫。據了解,DeNA的業務涵蓋社交游戲、電子商務等領域,此前公司推出的手游《忍者天下》也在中國市場取得了驕人的成績。昔日忍者化身換裝暖暖,DeNA想用GAN做些什么呢?

以下是論智對文章的編譯。

摘要

本文提出了一種漸進結構—條件生成對抗網絡(PSGAN),它是一個能基于姿態信息生成全身的高分辨率圖像的新框架。

近年來,許多人都研究過用深度生成模型自動生成圖像和視頻,這項技術對媒體創建工具來說很有幫助,它可以被用來進行圖片編輯、動畫制作甚至是電影制作。

就動漫產業角度看,一個能自動生成動畫角色的神經網絡不僅能為創作者帶來諸多靈感,它還能為整個產業節省作畫上巨額開支。現在我們已經有了能生成人物臉部圖像的GAN,但還沒有能生成角色全身圖的工具。而且就這些生成臉部圖像的神經網絡來說,它們的圖像質量還達不到工業級作畫標準。

因此,開發一個既能生成全身圖像,又能生成高質量姿態的GAN將對制作新角色、繪制新動漫大有裨益。但達成這個目標還有兩大難點:(1)生成高分辨率圖像;(2)用特定的姿態序列生成圖像。

為了解決上述問題,我們引入PSGAN,它能根據結構信息,在訓練過程中逐步提高生成圖像的分辨率,以此細化圖像在結構上的細節特征,如生成對象的全身圖。同時,我們也在網絡上添加了任意的潛在變量和結構條件,讓它能基于目標姿勢序列生成多樣化和可控制的動作視頻。

在這篇文章中,我們用實驗證明了PSGAN的有效性,如下文這個512x512的視頻所示,視頻中的動畫角色展示了PSGAN生成的人物服裝細節、身體姿態的整體調整。

生成結果預覽

視頻展示了由PSGAN生成的各種動漫角色和動畫。首先,我們用隨機潛在變量生成大量動畫角色;其次,我們再對具體的動漫角色進行潛在插值,以生成新的動畫角色;最后,我們用連續的姿勢序列制作出流暢的動畫。

換裝PLAY

PSGAN生成全新全身圖的主要方式是插入不同的服飾,這是利用改變潛在變量實現的。需要注意的一點是,換裝時人物的姿態是固定的。

舞動人“身”

下圖展示了指定動畫角色生成目標姿態的具體過程:

和生成服飾相反,這里我們固定潛在變量,并給PSGAN提供連續的姿勢序列。更具體地說,就是將指定動畫角色的表示映射到潛在變量內——它處于潛在空間誒,是PSGAN的輸入向量——然后用這個新的潛在變量做PSGAN的輸入,以此做到在不改變外觀的前提下改變姿態。

漸進結構的條件GAN

我們的主要想法是逐步學習具有結構條件的圖像表示。我們參考了Karras等人提出的GAN的結構,并在生成器和判別器上都添加上結構條件,這樣做之后,無論圖像分辨率是什么,它們都帶有相應縮放比例的姿態信息。

PSGAN的生成器和判別器

如上圖所示,N×N的白色框表示的是NxN空間分辨率下正在工作的可學習卷積層,灰色框表示的則是結構條件的不可學習的下采樣層。

訓練數據

本文用到的數據集有Unity合成的原始頭像動漫角色數據集,以及由Openpose檢測到的關鍵點的DeepFashion數據集。PSGAN的訓練要求是有成對的圖像和成對的關鍵點坐標。

Avatar Anime-Character數據集

我們按照以下3個要求為PSGAN重新構建了新數據集:

姿態多樣性。為了生成平滑、自然地圖像,我們需要各式各樣的姿態。

訓練圖像的數量。通過用Unity生成3D頭像,我們無需任何手動注釋就可以獲得大量帶注釋的合成圖像。

背景消除。我們把背景統一設置成白色,以避免不必要的信息對圖像產生負面干擾。

我們把單個角色的幾個連續動作分解成600個姿勢,并不捉每個姿勢的關鍵點。通過對79種服飾進行同樣的處理,我們最終獲得了47,400張圖像。此外,我們還根據3D模型的骨骼結構獲得了20個關鍵點。

下圖是幾個訓練樣本(上:動漫角色;下:姿態圖):

對于這個數據集,我們用Adam收斂網絡,其中β1= 0,β2= 0.99。當生成器中的圖像分辨率為4x4—64x64時,學習率為0.001。隨著尺寸逐漸變為128x128、256x256、512x512,學習率也逐漸降低為0.0008、0.0006和0.0002。

DeepFashion數據集

PSGAN利用姿態信息在圖像生成網絡上施加結構條件。我們使用Openpose從沒有關鍵點注釋的圖像中提取關鍵點坐標。

同樣的,這里我們還是使用Adam,β1= 0,β2= 0.99,學習率α始終是0.0008。

不同GAN的比較

我們先來看看PSGAN在多樣性上的表現。如下圖所示,PSGAN為每個姿勢條件生成各種各樣的圖像。

接下來,我們再來看看PSGAN在生成姿態上的表現。在對照組中,PG2和DPG2需要同時輸入源圖像和相應的目標姿態才能生成目標圖像,但PSGAN只需調整潛在變量就能使圖像具備目標結構,它所受到限制更少。

下圖對比了PG2、DPG2和PSGAN生成的姿態圖,其中前兩者所需的參考姿態圖沒有顯示出來。通過對比我們可以發現,PSGAN生成的圖像和PG2、DPG2一樣自然合理,但又一定的瑕疵。由于這是通過調整潛在變量實現的,所以從理論上來說,如果變量調試得完美,PSGAN同樣能生成具有相同的質量的姿態圖。

最后,我們還評估了PSGAN與Progressive GAN在結構一致性上的表現。實驗結果顯示,無論是細節還是全局,PSGAN生成的圖像都更自然,而且它在結構細節上的處理也更合理。

小結

本文展示了PSGAN在生成平滑、高分辨率動畫上的水平,也通過實驗證實它能基于512x512的目標姿勢序列生成動畫角色全身圖和相應動畫。由于實驗條件有限,神經網絡在一些方面還發揮欠佳,所以未來我們還會在更多條件下進行試驗和評估。

此外,經處理的Avatar Anime-Character數據集即將開放。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4772

    瀏覽量

    100801
  • GaN
    GaN
    +關注

    關注

    19

    文章

    1936

    瀏覽量

    73520

原文標題:旋轉吧!換裝少女:一種可生成高分辨率全身動畫的GAN

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    高分辨率合成孔徑雷達圖像的直線特征多尺度提取方法

    共線點之間的連續性和完整性,并在不同的尺度圖像中根據邊緣特征的特點選擇不同處理方法,來實現低分辨率條件下完整直線特征的粗略提取和高分辨率的精確定位。最后用高分辨率SAR
    發表于 05-06 09:04

    增強高分辨率圖像捕獲的選擇

    與現有器件相同的高分辨率、全局快門捕獲和CCD級圖像均勻度。但KAI-29052在近紅外波段如850 nm提供達現有器件兩倍的成像靈敏度,而不降低圖像清晰度(調制傳遞函數)。它還包括一個更新的放大器
    發表于 10-25 09:04

    如何設計高速高分辨率ADC電路?

    影響ADC信噪比因素有哪些?如何設計高速高分辨率ADC電路?基于AD6644AST一65的高速高分辨率ADC電路設計實例
    發表于 04-23 06:01

    如何實現DCP的高分辨率控制?

    實現高分辨率的原理是什么如何使用X9241實現高分辨率?
    發表于 04-27 06:54

    高分辨率圖像實時顯示系統設計

    自行設計的超高分辨率圖像實時顯示系統由圖形系統處理機、超高分辨率顯示器組成, 其核 心是圖形系統處理機, 顯示分辨率為2048 ×2048 , 逐行掃描, 每像素8 位,
    發表于 07-09 14:36 ?19次下載

    基于FPGA+PowerPC的高分辨率圖像實時壓縮系統的設計

    為解決機載高分辨率圖像的實時壓縮問題,提出了一個基于FPGA+PowerPC的高分辨率圖像實時壓縮系統的設計方案。本系統主控采用PowerPC 處理器,壓縮芯片采用ADV202,用FP
    發表于 09-15 11:45 ?40次下載

    如何優化高分辨率DAC的DC測量

    如何優化高分辨率DA
    發表于 01-09 12:13 ?43次下載
    如何優化<b class='flag-5'>高分辨率</b>DAC的DC測量

    基于FPGA的高分辨率全景圖像處理平臺

    基于FPGA的高分辨率全景圖像處理平臺基于FPGA的高分辨率全景圖像處理平臺
    發表于 11-04 16:30 ?2次下載

    基于FPGA的高分辨率圖像DCT域增強

    基于FPGA的高分辨率圖像DCT域增強,下來看看
    發表于 08-30 15:10 ?4次下載

    基于多模型表示的高分辨率遙感圖像配準方法_項盛文

    基于多模型表示的高分辨率遙感圖像配準方法_項盛文
    發表于 03-19 19:19 ?0次下載

    一種基于參考高分辨率圖像的視頻序列超分辨率復原算法

    一種基于參考高分辨率圖像的視頻序列超分辨率復原算法
    發表于 10-26 10:49 ?5次下載
    一種基于參考<b class='flag-5'>高分辨率</b><b class='flag-5'>圖像</b>的視頻序列超<b class='flag-5'>分辨率</b>復原算法

    高分辨率遙感圖像飛機目標檢測

    高分辨率遙感圖像中飛機目標的檢測和識別具有重要的軍事和民用價值,針對以往方法易受灰度分布和形態變化及偽裝干擾等缺點,提出一種基于視覺詞袋模型的高分辨率遙感圖像飛機目標檢測的新方法。為了
    發表于 03-06 11:04 ?1次下載
    <b class='flag-5'>高分辨率</b>遙感<b class='flag-5'>圖像</b>飛機目標檢測

    正弦編碼器高分辨率位置信息的提取

    正弦編碼器高分辨率位置信息的提取
    發表于 05-17 16:56 ?1次下載
    正弦編碼器<b class='flag-5'>高分辨率</b>位置<b class='flag-5'>信息</b>的提取

    YOLOv8版本升級支持小目標檢測與高分辨率圖像輸入

    YOLOv8版本最近版本又更新了,除了支持姿態評估以外,通過模型結構的修改還支持了小目標檢測與高分辨率圖像檢測。原始的YOLOv8模型結構如下。
    的頭像 發表于 05-16 11:14 ?1.2w次閱讀
    YOLOv8版本升級支持小目標檢測與<b class='flag-5'>高分辨率</b><b class='flag-5'>圖像</b>輸入

    什么是高分辨率示波器?它有哪些優勢?

    高分辨率示波器是一種在信息與系統科學相關工程與技術領域中廣泛應用的科學儀器,其設計旨在提供更高的信號分辨率和更精細的信號分析能力。以下是對高分辨率示波器的詳細解析,包括其定義、優勢以及
    的頭像 發表于 08-08 11:49 ?979次閱讀
    主站蜘蛛池模板: 青青草原伊人网| 忘忧草在线| 久久免费视频| 巨爆乳中文字幕爆乳区| 米奇影视999| 日本高清片免费观看| 无码乱人伦一区二区亚洲一| 亚洲日本欧美产综合在线| 最近高清日本免费| xiao77唯美清纯| 国产精品美女久久久久浪潮AV| 国产中的精品AV一区二区| 久久精品中文闷骚内射| 女人被弄到高潮叫床免| 色窝窝亚洲AV在线观看| 亚洲欧洲精品成人久久曰影片| 综合色就爱涩涩涩综合婷婷| 别插我B嗯啊视频免费| 国产欧美一区二区三区视频| 久久天天躁狠狠躁夜夜呲| 任你躁精品一区二区三区 | 51国产偷自视频在线视频播放 | 同时和两老师双飞| 怡春院欧美一区二区三区免费| V8成品人视频| 国产综合在线视频| 男女无遮挡吃奶gift动态图| 色色色五的天| 伊人久久电影院| 陈红下面又紧又小好爽| 黄梅戏mp3大全| 秋霞电影伦网理最新在线看片 | 久久影院毛片一区二区| 日韩欧美成人免费中文字幕| 亚洲日韩一区精品射精| tube日本护士| 激情床戏视频片段有叫声| 破苞流血哭泣 magnet| 亚洲婷婷天堂综合国产剧情| jizz黑丝| 精品亚洲永久免费精品|