色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

JD和OPPO的研究人員們提出了一種姿勢引導的時尚圖像生成模型

nlfO_thejiangme ? 來源:lq ? 2019-08-02 14:50 ? 次閱讀

時尚總在引領潮流。

人工智能、增強現實、可穿戴、虛擬試妝等技術的加持下,時尚行業特別是在線時尚行業獲得了飛速的發展。為了吸引客戶更多的目光、更棒的視覺體驗、更好地展現商品,高清大圖、模特多角度擺拍已經成了服裝、箱包、鞋類、美妝等線上商家的宣傳標配。在網上購物時,大家都想看看模特衣服在各種角度姿勢下的樣子,但是越多越全面的姿勢擺拍也就意味著越大的投入。為了降低宣傳成本,很多研究開始聚焦于如何合成高質量的逼真圖像。

在這篇文章中來自北卡羅來納大學、JD和OPPO的研究人員們提出了一種姿勢引導的時尚圖像生成模型,可以基于模特當前姿勢,生成出其他各種不同姿勢下的相同著裝的新圖像!也許在這樣技術的幫助下,模特再也不用辛苦一分鐘拍二十個動作了~

生成新姿勢下的時尚圖像

研究人員的主要目的在于訓練一個生成模型,將模特在當前姿勢上的圖像遷移到其他的目標姿勢上去,實現對于衣著等商品的全面展示。

這一模型主要由生成器和判別器構成,與先前工作不同的是這一模型架構中包含了兩個不同的判別器!其中生成器由兩個編碼器構成,分別用于從圖像和對應的動作關鍵點特征圖進行編碼,而解碼器則用于從動作和衣著的特征中合成目標圖像。對于判別器來說,除了判定生成圖像是否逼真外、還需要判定動作與生成圖像的連續性以保證生成圖像動作的連續性和魯棒性。

模型的主要架構,生成器的編碼器包含了對于圖像的編碼器Ei和對動作的編碼器Ep,基于U-Net和bi-LSTM共同構建而成,而兩個判別器分別用于判定圖像的真偽并保證生成圖像與動作間的連續性。

時尚圖像生成器

生成器中主要包含了兩個編碼器和一個解碼器用于處理圖像和對應姿勢,生成器探索了輸入圖像的視覺語義特征和位姿信息,并生成對應姿勢下的新圖像。圖像編碼器:圖像編碼器的目標是從單張或多張圖像中湖區語義編碼信息。研究人員首先使用了ResNet作為主干網絡抽取不同尺度的特征,包括紋理、顏色、邊緣線條信息等。隨后將這些特征輸入到雙邊長短時記憶網絡(bc-LSTM)中用于從相同衣著不同視角的模特圖像中抽取共同的特征,將不同種類的圖像特征進行轉換,同時對不同特征下的背景和噪聲進行處理。最終得到了可以表達圖像視覺語義信息的編碼Ci,用于后續圖像的生成。位姿編碼器:模型同時需要位姿數據來為生成圖像進行引導,研究人員利用了18個關鍵點來表示人體位姿,用不同顏色的直線相連并以RGB的格式進行表示。通過U-Net的架構和3*3的卷積從位姿圖中抽取高層次語義特征Cp并在解碼過程中通過跳接層連接進行特征共享。解碼器:其主要目的是通過圖像編碼Ci 和動作編碼Cp重建出逼真的圖像。首先將圖像編碼與位姿編碼的編碼拼接在一起,并基于U-Net架構和跳接層將視覺語義信息與動作編碼信息匹配起來,進行有效的圖像生成。判別器:其主要目標是引導模型生成比先前模型更逼真圖像。在訓練過程中研究人員利用兩個判別器來同時進行對抗訓練,主要采用了與PatchGAN類似的實現。其中Di用于判別生成圖像是否逼真,與先前的模型類似;而Dp則用于判定生成圖像與對應動作的連續性。Dp的輸出是真實圖像與對應位姿和這一位姿下生成的圖像,用于判定圖像是否與位姿匹配,它對于生成與位姿對應的時尚圖像具有重要的作用,能幫助網絡生成更為復雜的動作姿勢,同時保持連續性和魯棒性。

結果展示

通過DeepFashion和Market-1501數據的訓練后研究人員得到了不錯的結果。

Deep Fasion 數據集

Market-1501數據集

生成的結果與先前方法的比較,其中S和M代表了單張和多張圖像輸入的生成結果:

在數據集上的表現還不錯,從源圖像生成了新的姿勢:

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 解碼器
    +關注

    關注

    9

    文章

    1147

    瀏覽量

    40869
  • 圖像
    +關注

    關注

    2

    文章

    1089

    瀏覽量

    40534
  • 模型
    +關注

    關注

    1

    文章

    3298

    瀏覽量

    49063

原文標題:從姿勢到圖像——基于人體姿勢引導的時尚圖像生成算法

文章出處:【微信號:thejiangmen,微信公眾號:將門創投】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    一種圖像語義分層處理框架,可以實現像素級別的圖像語義理解和操縱

    這多虧了密歇根大學和谷歌大腦的研究人員,他們提出了一種新的圖像語義處理分層框架,首先根據圖像中給定對象的邊界框,學習
    的頭像 發表于 08-27 08:52 ?7131次閱讀

    美國普渡大學和哈佛大學的研究人員出了項新發明 新...

    據物理學家組織網報道,美國普渡大學和哈佛大學的研究人員出了項極為應景的新發明:一種外形如同顆圣誕樹
    發表于 02-03 20:30

    研究人員提出了一種柔性可拉伸擴展的多功能集成傳感器陣列

    研究人員提出了一種柔性可拉伸擴展的多功能集成傳感器陣列,成功將電子皮膚的探測能力擴展到7,實現溫度、濕度、紫外光、磁、應變、壓力和接近等多種外界刺激的實時同步監測。
    的頭像 發表于 01-24 15:15 ?7279次閱讀
    <b class='flag-5'>研究人員</b><b class='flag-5'>提出了</b><b class='flag-5'>一種</b>柔性可拉伸擴展的多功能集成傳感器陣列

    特倫托大學與Inria合作:使用GAN生成人體的新姿勢圖像

    使用GAN(對抗生成網絡)生成人體的新姿勢圖像研究人員提出的可變形跳躍連接和最近鄰損失函數,更
    的頭像 發表于 01-29 16:34 ?9653次閱讀
    特倫托大學與Inria合作:使用GAN<b class='flag-5'>生成</b>人體的新<b class='flag-5'>姿勢</b><b class='flag-5'>圖像</b>

    OpenAI的研究提出了一種新的生成模型,能快速輸出高清、真實的圖像

    為下游任務提供了有用的隱藏空間。自回歸模型的隱藏層有著位置的邊緣分布,使其更難對數據進行正確操作。在GAN中,數據點經常不能直接表現在隱藏空間中,因為它們沒有編碼器,可能無法支持數據分布。在可逆生成模型和VAE上就沒有這種情況。
    的頭像 發表于 07-12 08:43 ?8286次閱讀

    以色列研究人員開發出了一種能夠識別不同刺激的新型傳感系統

    據麥姆斯咨詢報道,海法以色列理工學院的研究人員開發出了一種能夠識別并區分不同刺激的創新型傳感系統。該系統基于折紙藝術,結合了以色列理工學院開發的智能墨水材料。
    發表于 05-21 08:45 ?927次閱讀

    研究人員提出了系列新的點云處理模塊

    為了探索這些問題的解決辦法、來自倫敦大學學院的研究人員提出了系列新的點云處理模塊,從效率、信息共享和點云卷積操作等方面進行了研究,得到了
    的頭像 發表于 08-02 14:44 ?3085次閱讀
    <b class='flag-5'>研究人員</b><b class='flag-5'>們</b><b class='flag-5'>提出了</b><b class='flag-5'>一</b>系列新的點云處理模塊

    Facebook的研究人員提出了Mesh R-CNN模型

    研究的目標是通過單張圖像輸入,對圖像中的物體進行檢測、獲取不同物體的類別、掩膜和對應的三維網格,并對真實世界中的復雜模型進行有效處理。在
    的頭像 發表于 08-02 15:51 ?3920次閱讀
    Facebook的<b class='flag-5'>研究人員</b><b class='flag-5'>提出了</b>Mesh R-CNN<b class='flag-5'>模型</b>

    研究人員出了一種新的基于深度學習的策略

    蘇黎世聯邦理工學院的研究人員最近推出了一種新的基于深度學習的策略,該策略可以在不需要大量真實數據的情況下在機器人中實現觸覺傳感。在arXiv上預先發表的篇論文中概述了他們的方法,該方
    的頭像 發表于 03-26 15:47 ?2631次閱讀

    研究人員開發出了一種稱為LB-WayPtNav-DH的機器人導航新框架

    加州大學伯克利分校的研究人員最近開發了一種新的框架,該框架可以增強辦公室,房屋或博物館等室內環境中人類的機器人導航能力。他們的模型在arXiv上預先發表的篇論文中
    發表于 04-09 11:18 ?949次閱讀

    研究人員開發了一種新穎的機器學習管道

    研究人員通過一種特殊的神經網絡模型,它以“基本塊”(計算指令的基本摘要)形式訓練標記的數據,以自動預測其持續時間使用給定的芯片執行以前看不見的基本塊。結果表明,這種神經網絡模型的性能要
    的頭像 發表于 04-15 16:42 ?1868次閱讀

    微軟亞洲研究院的研究提出了一種模型壓縮的新思路

    近日,來自微軟亞洲研究院自然語言計算組的研究提出了一種與顯式地利用蒸餾損失函數來最小化教師模型
    的頭像 發表于 11-24 09:48 ?1678次閱讀

    一種基于改進的DCGAN生成SAR圖像的方法

    針對SAR圖像識別軟件,通過改進 DCGAN模型生成器與單判別器對抗的結構,采用多生成器與單判別器進行對抗,設計了控制各生成
    發表于 04-23 11:01 ?21次下載
    <b class='flag-5'>一種</b>基于改進的DCGAN<b class='flag-5'>生成</b>SAR<b class='flag-5'>圖像</b>的方法

    MIT研究人員提出了一種制造軟氣動執行器的新方法

    麻省理工學院 (MIT) 的研究人員創造了一種新的制造技術,可以制造出更具成本效益的軟氣動執行器。
    的頭像 發表于 05-06 16:38 ?1674次閱讀
    MIT<b class='flag-5'>研究人員</b><b class='flag-5'>提出了</b><b class='flag-5'>一種</b>制造軟氣動執行器的新方法

    生成式 AI 研究通過引導圖像結構控制為創作者賦能

    新的研究正在通過個文本引導圖像編輯工具來提升生成式 AI 的創造性潛能。這項創新性的研究
    的頭像 發表于 07-24 19:30 ?586次閱讀
    主站蜘蛛池模板: 亚洲欧美另类无码专区 | 中文字幕专区高清在线观看 | 久久机热视频 这里只有精品首页 | 日日干夜夜艹 | thermo脱色摇床安卓下载 | 动漫美女的禁 | 欧美亚洲另类丝袜自拍动漫 | 优菈的乳液狂飙天堂W98 | 老师好爽你下面水好多视频 | 在线亚洲精品国产一区麻豆 | 1313久久国产午夜精品理论片 | 大香伊人久久精品一区二区 | 亚洲精品久久区二区三区蜜桃臀 | 日韩av片无码一区二区不卡电影 | 99精品国产高清自在线看超 | 狠狠色噜噜狠狠狠狠米奇777 | av女优快播 | bbw美女与zooxx| 久草网国产自偷拍 | 九九热久久只有精品2 | 久久成人免费观看全部免费 | 久久精品人人做人人爽97 | 四虎国产精品永久一区高清 | 黑色丝袜美腿美女被躁翻了 | 粉色视频午夜网站入口 | 草草久久久无码国产专区全集观看 | 2020精品极品国产色在线 | 欧美一区二区高清 | 精品无码久久久久久久久 | 永久免费精品影视网站 | 欧美精品高潮呻吟AV久久 | 久久热精品18国产 | 主播蜜汁丝袜精品自拍 | 姐姐不~不可以动漫在线观看 | 欧美久久无码AV麻豆 | 国产精品永久AV无码视频 | 亚洲AV永久无码精品老司机蜜桃 | 中文字幕AV亚洲精品影视 | 真人美女精美小穴 | china年轻小帅脸直播飞机 | 色婷婷亚洲五月 |