色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

EditGAN圖像編輯框架將影響未來幾代GAN的發展

星星科技指導員 ? 來源:NVIDIA ? 作者:Nathan Horrocks ? 2022-04-06 16:29 ? 次閱讀

編輯貓、汽車甚至古董畫照片的愿望,由于一種稱為EditGAN的生成性對抗網絡(GAN)模型,從未像現在這樣容易實現。來自 NVIDIA,多倫多大學和 MIT 研究人員的工作建立了 DatasetGAN ,這是一種人工智能視覺模型,可以用最少16個人類注釋的圖像來訓練,并像其他需要100X更多圖像的方法一樣有效地執行。EditGAN 利用了前一個模型的功能,允許用戶使用簡單的命令(如繪圖)編輯或操作所需的圖像,而不會影響原始圖像質量。

什么是 EditGAN ?

根據 paper :“ EditGAN 是第一個 GAN 驅動的圖像編輯框架,它同時提供非常高精度的編輯,只需要很少的帶注釋的訓練數據(并且不依賴外部分類器),可以實時交互運行,允許對多個編輯進行簡單的合成,并可處理真正的嵌入式、生成的圖像,甚至是域外圖像。”

該模型學習特定數量的編輯向量,這些編輯向量可以交互地應用于圖像。本質上,它形成了對圖像及其內容的直觀理解,用戶可以利用這些信息進行特定的修改和編輯。該模型從相似的圖像中學習,并識別圖像中對象的不同組件和特定部分。用戶可以利用它對不同子部分進行有針對性的修改,或在特定區域內進行編輯。由于模型的精確性,圖像在用戶設置的參數之外不會失真。

“該框架允許我們學習任意數量的編輯向量,然后可以以交互速率直接應用于其他圖像。”研究人員在他們的研究中解釋道。“我們的實驗表明, EditGAN 可以以前所未有的細節和自由度處理圖像,同時保持完整的圖像質量。我們還可以輕松地組合多種編輯,并在 EditGAN 的訓練數據之外執行合理的編輯。我們在各種圖像類型上演示了 EditGAN ,并在數量上優于幾種預處理的圖像標準編輯基準任務的編輯方法。”

從增加微笑、改變別人看的方向、創造新的發型,或者給汽車一套更好的輪子,研究人員展示了模型的內在性,只需要很少的數據注釋。用戶可以根據所需的編輯繪制簡單的草圖或遮罩,并引導 AI 模型實現修改,例如更大的貓耳或更酷的汽車前燈。人工智能然后渲染圖像,同時保持非常高的精度和原始圖像的質量。之后,同樣的編輯可以實時應用于其他圖像。

poYBAGJNT3iAFP43AAFEfxepoiI936.png

poYBAGJNT3iAFP43AAFEfxepoiI936.png

圖 2 分配給圖像不同部分的像素示例。人工智能可以識別不同的區域,并可以根據人工輸入進行編輯。

這是怎么工作的?

Edigan 將圖像的每個像素指定給一個類別,例如輪胎、擋風玻璃或車架。這些像素在人工智能潛在空間內控制,并基于用戶的輸入,用戶可以輕松靈活地編輯這些類別。 Edigan 操縱 only 與所需更改相關的像素。人工智能根據訓練模型時使用的其他圖像知道每個像素代表什么,因此你無法嘗試將貓耳朵添加到汽車中以獲得準確的結果。但是,當在正確的模型中使用時, EditGAN 是一個非凡的工具,可以提供出色的圖像編輯效果。

pYYBAGJNT3qAAggwAANRBkD8Lts841.png

pYYBAGJNT3qAAggwAANRBkD8Lts841.png

圖 3 Edigan 可以訓練各種各樣的圖像,從動物到環境,形成對其內容的詳細理解。

EditGAN 的潛能

人工智能驅動的照片和圖像編輯有可能簡化攝影師和內容創作者的工作流程,并實現創新和數字藝術的新水平。 EditGAN 還使新手攝影師和編輯能夠制作高質量的內容,以及偶爾的病毒性模因。

“這個人工智能可能會改變我們編輯照片的方式,也許最終會改變視頻。它允許人們通過簡單的文本命令拍攝圖像并對其進行修改。如果你有一張汽車照片,你想讓車輪更大,只需鍵入“ make wheels bigger ”,然后噗 – 這是一張完全真實的照片,上面是同一輛車輪更大的汽車。”—— Fortune magazine

EditGAN 將來也可能用于其他重要應用。例如, EditGAN 的編輯功能可用于創建具有特定特征的大型圖像數據集。當針對不同的計算機視覺任務訓練下游機器學習模型時,這種特定的數據集可能很有用。

此外, EditGAN 框架可能會影響未來幾代 GAN 的發展。雖然當前版本的 EditGAN 側重于圖像編輯,但類似的方法也可能用于編輯 3D 形狀和對象,這在為游戲、電影或 metaverse 創建虛擬 3D 內容時非常有用。

關于作者

Nathan Horrocks 是 NVIDIA Research 的內容營銷經理。他重點強調了 NVIDIA 實驗室在世界各地進行的驚人研究。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5075

    瀏覽量

    103569
  • 人工智能
    +關注

    關注

    1796

    文章

    47642

    瀏覽量

    239821
  • GaN
    GaN
    +關注

    關注

    19

    文章

    1964

    瀏覽量

    74016
收藏 人收藏

    評論

    相關推薦

    SparseViT:以非語義為中心、參數高效的稀疏化視覺Transformer

    ? 背景簡介 隨著圖像編輯工具和圖像生成技術的快速發展圖像處理變得非常方便。然而圖像在經過處理后不可避免的會留下偽影(操作痕跡),這些偽影
    的頭像 發表于 01-15 09:30 ?105次閱讀
    SparseViT:以非語義為中心、參數高效的稀疏化視覺Transformer

    EE-276:Blackfin處理器上圖像處理的視頻框架注意事項

    電子發燒友網站提供《EE-276:Blackfin處理器上圖像處理的視頻框架注意事項.pdf》資料免費下載
    發表于 01-06 14:17 ?0次下載
    EE-276:Blackfin處理器上<b class='flag-5'>圖像</b>處理的視頻<b class='flag-5'>框架</b>注意事項

    探秘GaN功率半導體封裝:未來趨勢一網打盡!

    GaN功率半導體器件的優異性能要想得到充分發揮,離不開先進的封裝技術。本文深入探討GaN功率半導體器件的封裝技術,分析其面臨的挑戰、現有的解決方案以及未來
    的頭像 發表于 01-02 12:46 ?445次閱讀
    探秘<b class='flag-5'>GaN</b>功率半導體封裝:<b class='flag-5'>未來</b>趨勢一網打盡!

    字節發布SeedEdit圖像編輯模型

    近日,字節跳動公司在其豆包大模型團隊的官方網站上,正式公布了其最新的通用圖像編輯模型——SeedEdit。這款創新性的圖像編輯模型,為用戶提供了前所未有的便捷圖像編輯體驗。 據官方介紹
    的頭像 發表于 11-12 10:43 ?312次閱讀

    圖像采集卡的接口類型有哪些?

    圖像采集卡又稱圖像捕獲卡,是一種能獲取數字視頻圖像信息并進行存儲和播放的硬件設備。它的作用是圖像信號采集到計算機中,以數據文件的形式保存在
    的頭像 發表于 10-24 17:07 ?261次閱讀
    <b class='flag-5'>圖像</b>采集卡的接口類型有哪些?

    未來AI大模型的發展趨勢

    上得到了顯著提升。未來,算法和架構的進一步優化推動AI大模型在性能上實現新的突破。 多頭自注意力機制、前饋神經網絡等關鍵技術的改進,增強模型的表達能力和泛化能力。 多模態融合 : AI大模型正逐漸從單一模態向多模態
    的頭像 發表于 10-23 15:06 ?803次閱讀

    DMA與C64x的框架組件結合使用

    電子發燒友網站提供《DMA與C64x的框架組件結合使用.pdf》資料免費下載
    發表于 10-16 10:29 ?0次下載
    <b class='flag-5'>將</b>DMA與C64x的<b class='flag-5'>框架</b>組件結合使用

    變阻器的未來發展趨勢和前景如何?是否有替代品出現?

    變阻器是一種用于調節電路中電阻值的電子元件,廣泛應用于各種電子設備和系統中。隨著科技的不斷進步和應用領域的擴展,變阻器的未來發展趨勢和前景備受關注。 未來變阻器趨向于智能化和多功能化
    發表于 10-10 14:35

    嵌入式系統的未來趨勢有哪些?

    (ML)技術的快速發展,嵌入式系統更多地整合這些先進技術,以支持智能決策和自動化。在設備上直接運行AI和ML模型,進行圖像識別、自然語言處理、預測分析等任務,極大提升嵌入式系統的智
    發表于 09-12 15:42

    圖像處理器的發展歷史

    圖像處理器(Image Processor)的發展歷史是一段充滿創新與突破的歷程,它伴隨著計算機技術的不斷進步和圖像處理需求的日益增長而逐漸成熟。以下是對圖像處理器
    的頭像 發表于 08-14 09:42 ?1168次閱讀

    全球SiC與GaN市場發展趨勢,未來迎來快速增長

    在近期的慕尼黑上海電子展上,YoleGroup的分析師邱柏順深入剖析了全球碳化硅(SiC)和氮化鎵(GaN)市場的發展趨勢,提供了對未來電力電子行業的深刻見解。隨著科技的進步和市場需求的變化,寬禁帶
    的頭像 發表于 07-22 11:46 ?448次閱讀
    全球SiC與<b class='flag-5'>GaN</b>市場<b class='flag-5'>發展</b>趨勢,<b class='flag-5'>未來</b><b class='flag-5'>將</b>迎來快速增長

    計算機視覺怎么給圖像分類

    圖像分類是計算機視覺領域中的一項核心任務,其目標是輸入的圖像自動分配到預定義的類別集合中。這一過程涉及圖像的特征提取、特征表示以及分類器的設計與訓練。隨著深度學習技術的飛速
    的頭像 發表于 07-08 17:06 ?878次閱讀

    微軟AI新成果:將不可編輯PDF轉化為可編輯文檔

    市面現有相關軟件雖能將PDF轉為可編輯版,但易喪失原始布局。微軟研究論文名為《從不可編輯文檔生成可編輯文檔的方法和系統》,其獨特之處在于運用AI技術保持了字體、色彩、布局及圖像格式等視
    的頭像 發表于 05-30 10:11 ?834次閱讀

    谷歌模型怎么用PS打開文件和圖片

    )或ONNX模型(.onnx)等。這些模型文件是二進制的,并且是為特定的機器學習框架設計的,而不是為圖像編輯軟件如PS設計的。
    的頭像 發表于 02-29 18:25 ?1532次閱讀

    機器視覺圖像采集卡:關鍵的圖像處理設備

    機器視覺圖像采集卡是一種用于采集和處理圖像數據的關鍵設備,它在現代工業生產和科學研究中起著至關重要的作用。本文探討機器視覺圖像采集卡的工作原理、應用領域以及
    的頭像 發表于 02-22 16:23 ?557次閱讀
    機器視覺<b class='flag-5'>圖像</b>采集卡:關鍵的<b class='flag-5'>圖像</b>處理設備
    主站蜘蛛池模板: 国产精品久久久久久精品... | 最近更新2019中文字幕国语 | 无码人妻精品一区二区蜜桃在线看 | 亚洲中文字幕国产综合 | 胸大美女又黄的网站 | 丝袜诱惑qvod | 含羞草影院免费区 | 成人手机在线观看 | 黄色天堂网 | 亚洲免费在线视频 | 2022精品福利在线小视频 | 97午夜理论片影院在线播放 | 国产在线高清亚洲精品一区 | 欲乱艳荡少寡妇全文免费 | 国产亚洲精品久久精品69 | 日韩精品一区二区亚洲AV观看 | 免费又黄又硬又爽大片 | 囯产精品久久久久久久久免费蜜桃 | 97人妻在线公开视频在线观看 | 日本大片免a费观看视频 | 激情男女高潮射精AV免费 | 国语大学生自产拍在线观看 | bt天堂午夜国产精品 | 99国产精品综合AV无码 | 久久久久伊人 | 成人在线视频播放 | 久久精品视频在线看99 | 亚洲一区在线观看视频 | 欧美残忍xxxx极端 | 在线成 人av影院 | 国产亚洲日韩另类在线播放 | 亚洲国产精品VA在线看黑人 | 国产一区亚洲 | 亚洲野狼综合网站 | 木凡的天空在线收听 | 精品日韩二区三区精品视频 | 99re8久久热在线视频 | 野花社区视频WWW高清 | 欧美97色伦影院在线观看 | 亚洲国产精品久久精品成人网站 | 国产精品久久久久久久久久久 |