內(nèi)容生成器 — 無論是生成語言、2D 圖像、3D 模型還是視頻 — 為創(chuàng)意社區(qū)提供了各種工具,可更快將想象變?yōu)楝F(xiàn)實。
為幫助開發(fā)者構(gòu)建這些新型生成式 AI 工具,NVIDIA 建立了 NVIDIA AI Foundry。它有助于公司使用 NVIDIA Edify 基于自己的已授權(quán)數(shù)據(jù)訓(xùn)練生成式 AI 模型。Edify 是一種多模態(tài) AI 結(jié)構(gòu),可使用簡單的文本提示生成圖像、視頻、3D 素材、360 度高動態(tài)范圍成像和基于物理性質(zhì)的渲染(PBR)材質(zhì)。使用 AI Foundry,公司可以訓(xùn)練定制 AI 模型來生成上述任何素材。
Edify 的關(guān)鍵優(yōu)勢包括能夠生成多種類型的內(nèi)容、其卓越的訓(xùn)練效率(這便于它在基于更少的圖像進行訓(xùn)練時生成高質(zhì)量內(nèi)容),及其調(diào)優(yōu)模型以進行風格匹配或?qū)W習字符或?qū)ο蟮哪芰Α?/p>
基于 NVIDIA AI Foundry 和 Edify 構(gòu)建的服務(wù)范例之一為 Generative AI by Getty Images,一種可商用的生成式攝影服務(wù)。組合使用 AI Foundry 與 Edify,用戶可以控制他們的訓(xùn)練數(shù)據(jù)集,從而創(chuàng)建符合其需求的模型。
為避免版權(quán)問題,Getty Images 使用 Edify 基于自己的已授權(quán)內(nèi)容對該服務(wù)進行了訓(xùn)練,以確保數(shù)據(jù)集中不存在知名人物或產(chǎn)品。該公司還與貢獻者分享部分利潤,為對該模型做出貢獻的創(chuàng)作者創(chuàng)造了新的收入來源。
使用 Edify 生成資產(chǎn)
可以對 Edify 進行訓(xùn)練,以生成各種圖像類型,包括圖像、3D 素材和 360 度 HDRi 環(huán)境光貼圖。
Edify Image 可在約六秒內(nèi)生成四張高質(zhì)量 1K 圖像,性能比之前的模型提高一倍。還可以通過生成式放大器添加其他細節(jié),將圖像轉(zhuǎn)換為 4K 格式。
Getty Images 4K 圖像生成使用安全商用創(chuàng)意庫在 NVIDIA Edify 上進行訓(xùn)練。
得益于高級提示依從性,圖像實現(xiàn)了高度可控,攝像頭控制可指定焦距或場景深度,同時 ControlNets 將指導(dǎo)生成。ControlNets 包括 Sketch 和 Depth,前者允許用戶提供要依從的草圖或復(fù)制圖像的構(gòu)圖,后者用于復(fù)制圖像的構(gòu)圖。
也可以使用 Edify Image 來編輯圖像。InPaint 允許用戶在圖像中添加或修改內(nèi)容。Replace — 一個嚴格 InPaint — 可以更改衣服等細節(jié)。并且 OutPaint 可以擴大圖像以匹配不同的寬高比。所有這些操作都可通過 Segment 進行簡化,這是一項只需要一條文本提示即可遮罩對象的功能。
Edify 還可以創(chuàng)建藝術(shù)家級別的 3D 網(wǎng)格。這些網(wǎng)格采用基于四邊形的清晰拓撲、高達 4K 的 PBR 材質(zhì)和自動 UV 展開,便于更輕松地進行紋理編輯。快速預(yù)覽模式可在短短 10 秒內(nèi)提供結(jié)果,然后將其轉(zhuǎn)換為完整的 3D 網(wǎng)格。
這類網(wǎng)格非常適合原型設(shè)計場景、為布景生成背景對象,或作為 3D 雕刻的開端。
Edify 360 HDRi 將生成自然景觀環(huán)境圖,可將其用于場景照明、反射甚至作為背景。該模型可根據(jù)文本或圖像提示生成高達 16K 的 HDRi 圖像。獲得所需背板后,用戶就可以創(chuàng)建自定義 HDRi 來進行匹配,而不必花費數(shù)小時尋找。
根據(jù)文本提示生成高動態(tài)范圍 360 度全景圖。
多模態(tài)功能為 Edify 所獨有,能夠?qū)崿F(xiàn)組合不同素材類型的高級工作流。例如,與智能體結(jié)合使用時,Edify 允許用戶在幾分鐘內(nèi)使用簡單的文本提示進行完整場景原型設(shè)計 — 就像在 NVIDIA 研究團隊 SIGGRAPH 演示中那樣,該演示展示了由 NVIDIA Edify 提供支持的模型和 NVIDIA Omniverse 平臺的輔助性 3D 世界構(gòu)建功能。
另一個用例是將 Edify 3D 和 360 HDRi 與 Image 結(jié)合起來使用,以便用戶完全控制圖像生成過程。通過以 3D 格式生成場景,藝術(shù)家可以四處移動物體并設(shè)定他們想要的鏡頭,然后使用 Edify Image 將原型轉(zhuǎn)化為逼真的圖像。
Generative AI by Getty Images
Getty Images 是創(chuàng)意視覺效果、編輯攝影、視頻和音樂領(lǐng)域的大型內(nèi)容服務(wù)提供商和供應(yīng)商之一,也是人們最初搜尋、購買和分享來自世界上的優(yōu)秀攝影師和錄像師的精彩視覺內(nèi)容的地方之一。
Getty Images 使用 NVIDIA AI Foundry 來訓(xùn)練 NVIDIA Edify Image 模型,以支持其生成式 AI 服務(wù)。該服務(wù)通過面向企業(yè)的 Generative AI by Getty Images 以及面向小型企業(yè)和業(yè)余創(chuàng)作者的 Generative AI by iStock 提供,允許用戶使用由 NVIDIA Edify 提供支持的模型來生成和修改圖像。
Generative AI by Getty Images(或 iStock)提供了一系列已授權(quán)內(nèi)容。
Getty Images 和 iStock 最近已更新到最新版本的 Edify Image,以便更快生成內(nèi)容,實現(xiàn)更高的提示依從性并公布攝像頭控制。
已更新 Generative AI by Getty Images 中的攝像頭控制。
用戶現(xiàn)在還可以在預(yù)拍創(chuàng)意內(nèi)容時使用生成式 AI 工具,這便于他們編輯和修改 iStock 的視覺效果庫,以快速迭代和美化內(nèi)容。這些相同的功能將于不久后在 Gettyimages.com 上發(fā)布。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5075瀏覽量
103669 -
AI
+關(guān)注
關(guān)注
87文章
31493瀏覽量
270212 -
模型
+關(guān)注
關(guān)注
1文章
3298瀏覽量
49184
原文標題:NVIDIA Edify 解密:幫助開發(fā)者創(chuàng)建自定義模型的技術(shù),這些模型可基于其數(shù)據(jù)進行訓(xùn)練
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論