如何在PyTorch中使用擴(kuò)散模型生成圖像

本文中，我們將研究擴(kuò)散模型的理論基礎(chǔ)，然后演示如何在PyTorch中使用擴(kuò)散模型生成圖像。 ? 擴(kuò)散模型的迅速崛起是機(jī)器學(xué)習(xí)在過(guò)去幾年中最大的發(fā)展之一。在這篇文章中，你能了解到關(guān)于擴(kuò)散模型的一切。 ? ? ?

擴(kuò)散模型是生成模型，在過(guò)去的幾年里已經(jīng)獲得了顯著的普及。僅在21世紀(jì)20年代發(fā)表的幾篇開(kāi)創(chuàng)性論文就向世界展示了擴(kuò)散模型的能力，比如在圖像合成方面擊敗GANs。以及DALL-E 2，OpenAI的圖像生成模型的發(fā)布。 ? ?

? ? 鑒于擴(kuò)散模型最近的成功浪潮，許多機(jī)器學(xué)習(xí)從業(yè)者肯定對(duì)它們的內(nèi)部工作原理感興趣。在本文中，我們將研究擴(kuò)散模型的理論基礎(chǔ)，然后演示如何在PyTorch中使用擴(kuò)散模型生成圖像。??

介紹

擴(kuò)散模型是生成模型，這意味著它們用于生成與訓(xùn)練數(shù)據(jù)相似的數(shù)據(jù)。從根本上講，擴(kuò)散模型的工作原理是通過(guò)連續(xù)添加高斯噪聲破壞訓(xùn)練數(shù)據(jù)，然后通過(guò)學(xué)習(xí)反轉(zhuǎn)這個(gè)噪聲過(guò)程來(lái)恢復(fù)數(shù)據(jù)。訓(xùn)練后，我們可以使用擴(kuò)散模型通過(guò)簡(jiǎn)單地通過(guò)學(xué)習(xí)的去噪過(guò)程傳遞隨機(jī)采樣的噪聲來(lái)生成數(shù)據(jù)。

更具體地說(shuō)，擴(kuò)散模型是一種潛變量模型，它使用固定的馬爾可夫鏈映射到潛在空間。該鏈逐步向數(shù)據(jù)中添加噪聲，以獲得近似后驗(yàn)值，其中為與x0具有相同維數(shù)的潛變量。在下面的圖中，我們可以看到這樣一個(gè)馬爾可夫鏈。

最后，圖像逐漸變?yōu)榧兏咚乖肼暋Ｓ?xùn)練擴(kuò)散模型的目標(biāo)是學(xué)習(xí)逆向過(guò)程，即訓(xùn)練。通過(guò)沿著這條鏈向后遍歷，我們可以生成新的數(shù)據(jù)。

擴(kuò)散模型的優(yōu)點(diǎn)

如上所述，對(duì)擴(kuò)散模型的研究近年來(lái)呈爆炸式增長(zhǎng)。受非平衡熱力學(xué)的啟發(fā)，擴(kuò)散模型目前可以生成State-of-the-Art 的圖像質(zhì)量。

除了頂尖的圖像質(zhì)量，擴(kuò)散模型還帶來(lái)了許多其他好處，包括不需要對(duì)抗性訓(xùn)練。對(duì)抗訓(xùn)練的困難是有據(jù)可查的。在訓(xùn)練效率的話題上，擴(kuò)散模型還具有可伸縮性和并行性的額外好處。

雖然擴(kuò)散模型似乎是憑空產(chǎn)生的結(jié)果，但有很多仔細(xì)和有趣的數(shù)學(xué)選擇和細(xì)節(jié)為這些結(jié)果提供了基礎(chǔ)，并且最佳實(shí)踐仍在文獻(xiàn)中不斷發(fā)展。現(xiàn)在讓我們更詳細(xì)地看看支撐擴(kuò)散模型的數(shù)學(xué)理論。

擴(kuò)散模型——深入

如上所述，擴(kuò)散模型由正向過(guò)程(或擴(kuò)散過(guò)程)和反向過(guò)程(或反向擴(kuò)散過(guò)程)組成，前者是對(duì)數(shù)據(jù)(通常是圖像)進(jìn)行逐步噪聲化，后者是將噪聲從目標(biāo)分布轉(zhuǎn)化回樣本。

當(dāng)噪聲水平足夠低時(shí)，正向過(guò)程中的采樣鏈轉(zhuǎn)換可以設(shè)置為條件高斯。將這與馬爾可夫假設(shè)結(jié)合起來(lái)，就得到了正向過(guò)程的簡(jiǎn)單參數(shù)化：

是一個(gè)方差策略(學(xué)習(xí)的或固定的)，如果表現(xiàn)良好，確保對(duì)于足夠大的T，幾乎是一個(gè)各向同性的高斯噪聲。

在馬爾可夫假設(shè)下，潛變量的聯(lián)合分布是高斯條件鏈變換的乘積 ?

如前所述，擴(kuò)散模型的“魔力”來(lái)自于反向過(guò)程。在訓(xùn)練過(guò)程中，模型學(xué)習(xí)這個(gè)擴(kuò)散過(guò)程的反轉(zhuǎn)，以生成新的數(shù)據(jù)。從純高斯噪聲開(kāi)始，模型學(xué)習(xí)聯(lián)合分布為：

其中高斯變換的隨時(shí)間變化的參數(shù)被學(xué)習(xí)到。特別要注意的是，馬爾可夫公式斷言，給定的反向擴(kuò)散變換分布只依賴于前一個(gè)時(shí)間步(或下一個(gè)時(shí)間步，取決于你如何看待它)：

訓(xùn)練

擴(kuò)散模型通過(guò)尋找反向馬爾可夫變換來(lái)訓(xùn)練，使訓(xùn)練數(shù)據(jù)的似然性最大化。在實(shí)踐中，訓(xùn)練等價(jià)于最小化負(fù)對(duì)數(shù)似然的變分上界。

我們?cè)噲D根據(jù)?Kullback-Leibler (KL) Divergences?重寫(xiě)。KL 散度是一種不對(duì)稱統(tǒng)計(jì)距離度量，衡量一個(gè)概率分布 P 與參考分布 Q 的差異程度。我們感興趣的是根據(jù) KL 散度來(lái)重寫(xiě)，因?yàn)槲覀兊鸟R爾可夫鏈中的過(guò)渡分布是高斯分布，并且高斯分布之間的 KL散度具有封閉形式。

什么是KL散度?

連續(xù)分布的KL散度的數(shù)學(xué)形式：

雙杠表示該函數(shù)關(guān)于其參數(shù)不對(duì)稱

下面你可以看到分布 P（藍(lán)色）與參考分布 Q（紅色）的 KL 散度的變化。綠色曲線表示上述KL散度定義中積分內(nèi)的函數(shù)，曲線下的總面積表示任意給定時(shí)刻P與Q的KL散度值。

將轉(zhuǎn)換為KL散度的形式

如上所述，可以將重寫(xiě)成KL散度的形式：

其中

對(duì)中的后驗(yàn)的前向過(guò)程進(jìn)行條件化會(huì)導(dǎo)致易于處理的形式，從而導(dǎo)致所有 KL 散度都是高斯分布之間的比較。這意味著可以使用封閉式表達(dá)式而不是蒙特卡羅估計(jì)來(lái)精確計(jì)算。

模型選擇

建立了目標(biāo)函數(shù)的數(shù)學(xué)基礎(chǔ)后，我們現(xiàn)在需要就如何實(shí)施擴(kuò)散模型做出幾個(gè)選擇。對(duì)于前向過(guò)程，唯一需要的是定義方差策略，其值在前向過(guò)程中通常會(huì)增加。

對(duì)于逆向過(guò)程，我們多選擇高斯分布參數(shù)化/模型架構(gòu)。請(qǐng)注意擴(kuò)散模型提供的高度靈活性——我們架構(gòu)的唯一要求是其輸入和輸出具有相同的維度。

我們將在下面更詳細(xì)地探討這些選擇的細(xì)節(jié)。

前向過(guò)程和

如上所述，關(guān)于前向過(guò)程，我們必須定義方差策略。特別是，我們將它們?cè)O(shè)置為依賴時(shí)間的常數(shù)，而忽略了它們可以學(xué)習(xí)的事實(shí)。例如，從到可能使用線性策略，或者可能使用幾何級(jí)數(shù)。

不管選擇的特定值如何，方差策略是固定的這一事實(shí)導(dǎo)致了相對(duì)于我們的可學(xué)習(xí)參數(shù)集成為了一個(gè)常數(shù)，允許我們就訓(xùn)練而言忽略它。

反向過(guò)程和

現(xiàn)在我們討論定義反向向過(guò)程所需的東西。回想一下，我們將逆馬爾可夫轉(zhuǎn)換定義為高斯：

我們現(xiàn)在必須定義?或的函數(shù)形式。雖然有更復(fù)雜的方法來(lái)參數(shù)化，我們只需設(shè)置：

也就是說(shuō)，我們假設(shè)多元高斯分布是具有相同方差的獨(dú)立高斯分布的乘積，方差值可以隨時(shí)間變化。我們將這些方差設(shè)置為我們的前向過(guò)程中的方差策略中的值。

給定了新的的形式，我們有：

這就允許我們進(jìn)行變換，將：

變換為：

其中差分中的第一項(xiàng)是和的線性組合，它取決于方差策略。此函數(shù)的確切形式與我們的目的無(wú)關(guān)。

上述比例的意義在于最直接的對(duì)進(jìn)行參數(shù)化，直接預(yù)測(cè)擴(kuò)散的后驗(yàn)均值。重要的是，有學(xué)者發(fā)現(xiàn)訓(xùn)練來(lái)預(yù)測(cè)噪聲，在任何給定時(shí)間步長(zhǎng)的下都會(huì)產(chǎn)生更好的結(jié)果。特別地，讓

這里：

這可以導(dǎo)出下面的替代損失函數(shù)，有學(xué)者發(fā)現(xiàn)可以帶來(lái)更穩(wěn)定的訓(xùn)練和更好的結(jié)果：

img

該學(xué)者還注意到這種擴(kuò)散模型公式與得分匹配生成模型在基于Langevin 動(dòng)力學(xué)的模型上的聯(lián)系。事實(shí)上，擴(kuò)散模型和基于分?jǐn)?shù)的模型似乎是同一枚硬幣的兩面，類似于基于波的量子力學(xué)和基于矩陣的量子力學(xué)的獨(dú)立和同時(shí)發(fā)展，揭示了同一現(xiàn)象的兩個(gè)等價(jià)公式。

網(wǎng)絡(luò)結(jié)構(gòu)

雖然我們的簡(jiǎn)化損失函數(shù)旨在訓(xùn)練模型，但我們?nèi)晕炊x該模型的架構(gòu)。請(qǐng)注意，模型的唯一要求是其輸入和輸出維度相同。

鑒于此限制，圖像擴(kuò)散模型通常使用類似 U-Net 的架構(gòu)來(lái)實(shí)現(xiàn)。

反向過(guò)程解碼和

反向過(guò)程的路徑由連續(xù)條件高斯分布下的許多變換組成。在反向過(guò)程結(jié)束時(shí)，回想一下我們正在嘗試生成一個(gè)圖像，它由整數(shù)像素值組成。因此，我們必須設(shè)計(jì)一種方法來(lái)獲得所有像素中每個(gè)可能像素值的離散（對(duì)數(shù)）似然。

這樣做的方法是將反向擴(kuò)散鏈中的最后一個(gè)轉(zhuǎn)換設(shè)置為獨(dú)立的離散解碼器。為了確定給定生成圖像的可能性，我們首先在數(shù)據(jù)維度之間施加獨(dú)立性：

其中D為數(shù)據(jù)的維數(shù)，上標(biāo)i表示取一個(gè)坐標(biāo)。現(xiàn)在的目標(biāo)是在時(shí)刻t=1時(shí)，一個(gè)給定的像素的概率分布和輕微噪聲圖中的對(duì)應(yīng)像素的相似程度：

其中t=1 的像素分布源自下面的多元高斯分布，其對(duì)角協(xié)方差矩陣允許我們將分布拆分為單變量高斯分布的乘積，每個(gè)高斯分布對(duì)應(yīng)數(shù)據(jù)的每個(gè)維度：

我們假設(shè)圖像由 0,1,...,255（作為標(biāo)準(zhǔn) RGB 圖像）中的整數(shù)組成，這些整數(shù)已線性縮放到 [?1,1]。其中，對(duì)于給定的像素值 x，該像素值的連續(xù)變化范圍是 [x?1/255,x+1/255]。給定中相應(yīng)像素的單變量高斯分布，像素值 x 的概率是以 x為中心的 [x?1/255,x+1/255]范圍內(nèi)的單變量高斯分布下的面積區(qū)域。

下面你可以看到每個(gè)范圍中的面積及其均值為 0 高斯的概率，在這種情況下，對(duì)應(yīng)于平均像素值為 255/2（半亮度）的分布。

對(duì)于每個(gè)像素，給定t=0時(shí)刻的像素值，就是簡(jiǎn)單的相乘就可以，這個(gè)過(guò)程可以用下面的式子表示：

其中

并且

給定了的等式，我們可以計(jì)算出最終的的形式，并不是和KL散度一樣的形式：

最終目標(biāo)

如上一節(jié)所述，作者發(fā)現(xiàn)預(yù)測(cè)給定時(shí)間步長(zhǎng)的圖像產(chǎn)生了最好的結(jié)果。最終，他們使用以下目標(biāo)：

我們的擴(kuò)散模型的訓(xùn)練和采樣算法可見(jiàn)下圖：

擴(kuò)散模型總結(jié)

在本節(jié)中，我們?cè)敿?xì)探討了擴(kuò)散模型的理論。人們很容易陷入數(shù)學(xué)細(xì)節(jié)，因此我們?cè)谙旅嬗涗浟俗钪匾囊c(diǎn)，以便讓我們從總體的角度來(lái)定位：

我們的擴(kuò)散模型被參數(shù)化為馬爾可夫鏈，這意味著我們的潛變量?jī)H取決于之前（或之后）的時(shí)間步長(zhǎng)。

馬爾可夫鏈中的變換分布是高斯的，正向過(guò)程需要方差策略，逆向過(guò)程的參數(shù)是學(xué)習(xí)的。

擴(kuò)散過(guò)程確保對(duì)于足夠大的 T，漸近分布為各向同性高斯分布。

在我們的案例中，方差策略是固定的，但它也可以學(xué)習(xí)。對(duì)于固定策略，遵循幾何級(jí)數(shù)可能比線性級(jí)數(shù)提供更好的結(jié)果。在任一情況下，序列中的方差通常隨時(shí)間增加。

擴(kuò)散模型高度靈活，允許使用輸入和輸出維度相同的任何架構(gòu)。許多實(shí)現(xiàn)使用 U-Net-like架構(gòu)。

訓(xùn)練目標(biāo)是最大化訓(xùn)練數(shù)據(jù)的似然。這表現(xiàn)為調(diào)整模型參數(shù)以最小化數(shù)據(jù)負(fù)對(duì)數(shù)似然的變分上限。

由于我們的馬爾可夫假設(shè)，目標(biāo)函數(shù)中的幾乎所有項(xiàng)都可以轉(zhuǎn)換為 KL 散度。鑒于我們使用的是高斯分布，這些值變得可以計(jì)算，因此無(wú)需執(zhí)行蒙特卡羅近似。

最終，使用簡(jiǎn)化的訓(xùn)練目標(biāo)來(lái)訓(xùn)練預(yù)測(cè)給定潛變量的噪聲分量的函數(shù)會(huì)產(chǎn)生最佳和最穩(wěn)定的結(jié)果。

作為反向擴(kuò)散過(guò)程的最后一步，離散解碼器用于獲取像素值的對(duì)數(shù)似然。

有了這個(gè)擴(kuò)散模型的高級(jí)概述，讓我們繼續(xù)看看如何在 PyTorch 中使用擴(kuò)散模型。

PyTorch中的擴(kuò)散模型

雖然擴(kuò)散模型還沒(méi)有像機(jī)器學(xué)習(xí)中其他結(jié)構(gòu)/方法那樣有很多人的實(shí)現(xiàn)，但仍有可用的實(shí)現(xiàn)。在 PyTorch 中使用擴(kuò)散模型的最簡(jiǎn)單方法是使用denoising-diffusion-pytorch包，它實(shí)現(xiàn)了本文中討論的圖像擴(kuò)散模型。要安裝軟件包，只需在終端中鍵入以下命令：

pip?install?denoising_diffusion_pytorch

Minimal Example

為了訓(xùn)練模型生成圖像，我們首先導(dǎo)入必要的包：

import?torch
from?denoising_diffusion_pytorch?import?Unet,?GaussianDiffusion

然后，我們定義網(wǎng)絡(luò)結(jié)構(gòu)，這里用U-Net，參數(shù)中的dim表示第一次下采樣之前的特征圖的數(shù)量，dim_mults參數(shù)提了每次下采樣時(shí)，通道數(shù)的乘數(shù)。

model?=?Unet(
????dim?=?64,
????dim_mults?=?(1,?2,?4,?8)
)

? 現(xiàn)在，網(wǎng)絡(luò)結(jié)構(gòu)定義好了，我們需要定義擴(kuò)散模型本身，我們將U-Net模型作為參數(shù)輸入到擴(kuò)散模型中，還有其他幾個(gè)參數(shù)，生成的圖像的尺寸，擴(kuò)散過(guò)程的步數(shù)，選擇L1還是L2歸一化。 ?

diffusion?=?GaussianDiffusion(
????model,
????image_size?=?128,
????timesteps?=?1000,???#?number?of?steps
????loss_type?=?'l1'????#?L1?or?L2
)

現(xiàn)在，擴(kuò)散模型定義好了，我們通過(guò)生成隨機(jī)數(shù)據(jù)來(lái)訓(xùn)練，然后使用常用的流程來(lái)訓(xùn)練：

training_images?=?torch.randn(8,?3,?128,?128)
loss?=?diffusion(training_images)
loss.backward()

模型訓(xùn)練完成后，我們最終可以使用 diffusion 對(duì)象的 sample() 方法生成圖像。這里我們生成 4 張圖像，由于我們的訓(xùn)練數(shù)據(jù)是隨機(jī)的，我們也只能得到噪聲：

sampled_images?=?diffusion.sample(batch_size?=?4)

img

在自定義數(shù)據(jù)集上訓(xùn)練

denoising-diffusion-pytorch 包還允許你在特定數(shù)據(jù)集上訓(xùn)練擴(kuò)散模型。只需將下面的 Trainer() 對(duì)象中的 path/to/your/images 字符串替換為數(shù)據(jù)集目錄路徑，并將 image_size更改為適當(dāng)?shù)闹怠Ｖ螅恍柽\(yùn)行代碼來(lái)訓(xùn)練模型，然后像以前一樣進(jìn)行采樣。請(qǐng)注意，PyTorch 必須在啟用 CUDA 的情況下編譯才能使用 Trainer 類：

from?denoising_diffusion_pytorch?import?Unet,?GaussianDiffusion,?Trainer

model?=?Unet(
????dim?=?64,
????dim_mults?=?(1,?2,?4,?8)
).cuda()

diffusion?=?GaussianDiffusion(
????model,
????image_size?=?128,
????timesteps?=?1000,???#?number?of?steps
????loss_type?=?'l1'????#?L1?or?L2
).cuda()

trainer?=?Trainer(
????diffusion,
????'path/to/your/images',
????train_batch_size?=?32,
????train_lr?=?2e-5,
????train_num_steps?=?700000,?????????#?total?training?steps
????gradient_accumulate_every?=?2,????#?gradient?accumulation?steps
????ema_decay?=?0.995,????????????????#?exponential?moving?average?decay
????amp?=?True????????????????????????#?turn?on?mixed?precision
)

trainer.train()

下面你可以看到從多元高斯噪聲到MNIST數(shù)字的漸進(jìn)去噪，類似于反向擴(kuò)散：

審核編輯：黃飛

閱讀全文

解碼器(40056) 解碼器(40056)
機(jī)器學(xué)習(xí)(130423) 機(jī)器學(xué)習(xí)(130423)
pytorch(12788) pytorch(12788)

評(píng)論

相關(guān)推薦

如何在PyTorch中使用交叉熵?fù)p失函數(shù)

Keras有一個(gè)簡(jiǎn)潔的API來(lái)查看模型的每一層輸出尺寸，這在調(diào)試網(wǎng)絡(luò)時(shí)非常有用。現(xiàn)在在PyTorch中也可以實(shí)現(xiàn)這個(gè)功能。

2022-08-18 11:01:07

2080

如何在實(shí)際電路中使用帶通濾波器

在本教程中，我們將了解此帶通濾波器、其背后的理論以及如何在實(shí)際電路中使用它。

2022-09-08 15:52:34

5594

如何在bash中使用條件語(yǔ)句

今天我們介紹一下如何在 bash 中使用條件語(yǔ)句。

2022-12-09 17:27:19

1812

基于擴(kuò)散模型的圖像生成過(guò)程

近年來(lái)，擴(kuò)散模型在文本到圖像生成方面取得了巨大的成功，實(shí)現(xiàn)了更高圖像生成質(zhì)量，提高了推理性能，也可以激發(fā)擴(kuò)展創(chuàng)作靈感。不過(guò)僅憑文本來(lái)控制圖像的生成往往得不到想要的結(jié)果，比如具體的人物姿勢(shì)、面部表情

2023-07-17 11:00:35

1939

如何在Linux中使用htop命令

本文介紹如何在 Linux 中使用 htop 命令。

2023-12-04 14:45:28

446

Pytorch模型如何通過(guò)paddlelite部署到嵌入式設(shè)備？

Pytorch模型如何通過(guò)paddlelite部署到嵌入式設(shè)備？

2021-12-23 09:38:19

Pytorch模型訓(xùn)練實(shí)用PDF教程【中文】

？模型部分？還是優(yōu)化器？只有這樣不斷的通過(guò)可視化診斷你的模型，不斷的對(duì)癥下藥，才能訓(xùn)練出一個(gè)較滿意的模型。本教程內(nèi)容及結(jié)構(gòu)：本教程內(nèi)容主要為在 PyTorch 中訓(xùn)練一個(gè)模型所可能涉及到的方法及函數(shù)，并且

2018-12-21 09:18:02

pytorch模型轉(zhuǎn)換需要注意的事項(xiàng)有哪些？

什么是JIT（torch.jit）？答：JIT（Just-In-Time）是一組編譯工具，用于彌合PyTorch研究與生產(chǎn)之間的差距。它允許創(chuàng)建可以在不依賴Python解釋器的情況下運(yùn)行的模型

2023-09-18 08:05:13

圖像生成對(duì)抗生成網(wǎng)絡(luò)gan_GAN生成汽車圖像精選資料推薦

, with PyTorch. 你好！這是我用PyTorch制作可生成汽車圖像的GAN的故事。 First of all, let me tell you what a GAN is — at least to...

2021-08-31 06:48:41

為什么生成模型值得研究

1.Why study generative modeling? 人們可能很自然地想知道為什么生成模型值得研究，尤其是那些只能夠生成數(shù)據(jù)而不能提供密度函數(shù)估計(jì)的生成模型。畢竟，當(dāng)應(yīng)用于圖像時(shí)，這樣

2021-09-15 06:03:29

為什么RK3399Pro平臺(tái)YOLOv4 pytorch模型轉(zhuǎn)RKNN模型會(huì)失敗呢

為什么RK3399Pro平臺(tái)YOLOv4 pytorch模型轉(zhuǎn)RKNN模型會(huì)失敗呢？有何解決辦法？

2022-02-11 09:29:29

如何在PyTorch上學(xué)習(xí)和創(chuàng)建網(wǎng)絡(luò)模型呢？

之一。在本文中，我們將在 PyTorch 上學(xué)習(xí)和創(chuàng)建網(wǎng)絡(luò)模型。PyTorch安裝參考官網(wǎng)步驟。我使用的 Ubuntu 16.04 LTS 上安裝的 Python 3.5 不支持最新的 PyTorch

2023-02-21 15:22:18

如何在DSADC中使用外部生成載波而不是aurix生成的激發(fā)波的例子？

你好，有沒(méi)有關(guān)于如何在 DSADC 中使用外部生成載波而不是 aurix 生成的激發(fā)波的例子？背景：當(dāng)定子和轉(zhuǎn)子角度為 90 度時(shí)，我試圖通過(guò)嘗試饋送來(lái)自函數(shù)生成器的信號(hào)來(lái)模擬解析器位置。由于

2024-01-22 07:37:44

如何在STM32cube中使用最終模型？

的我正在使用 LSM6DSOX 和 ProfiMEMS 板。我基于 WEKA（決策樹(shù)）創(chuàng)建了我的模型，并在 Unico v.8 中對(duì)其進(jìn)行了測(cè)試并且它有效。現(xiàn)在的問(wèn)題是如何在 STM32cube 中使用我的最終模型（我在 MLC 中加載的模型）？程序如何？預(yù)先感謝您的幫助。

2023-01-12 09:14:43

如何在Visual Studio Code中使用Yocto Project生成的Linux SDK

如何在Visual Studio Code中使用Yocto Project生成的Linux SDK，并針對(duì)Arm處理器進(jìn)行C/C++應(yīng)用交叉編譯和調(diào)試。首先使用Yocto Project生成SDK，我們這里以Apalis iMX8上的minimal console ima...

2021-12-16 07:47:26

如何在i.MX8QM中使用u-boot、內(nèi)核映像和rootfs生成.wiC映像？

如何在 i.MX8QM 中使用 u-boot、內(nèi)核映像和 rootfs 生成 .wic 映像。

2023-05-29 08:46:47

如何在最新版本的Genesys中使用ADS模型？

應(yīng)該能夠在Genesys中使用它，因?yàn)镚enesys支持相同的模型。但問(wèn)題是，如果我下載一個(gè)ADS模型，比如飛思卡爾MRFE6VP560H設(shè)備，我對(duì)如何在Genesys中使用它毫無(wú)頭緒。（我有最新版

2019-10-17 10:32:19

如何將PyTorch模型與OpenVINO trade結(jié)合使用？

無(wú)法確定如何轉(zhuǎn)換 PyTorch 掩碼 R-CNN 模型以配合OpenVINO?使用。

2023-08-15 07:04:51

將Pytorch模型轉(zhuǎn)換為DeepViewRT模型時(shí)出錯(cuò)怎么解決？

我正在尋求您的幫助以解決以下問(wèn)題.. 我在 Windows 10 上安裝了 eIQ Toolkit 1.7.3，我想將我的 Pytorch 模型轉(zhuǎn)換為 DeepViewRT (.rtm) 模型，這樣

2023-06-09 06:42:58

將pytorch模型轉(zhuǎn)化為onxx模型的步驟有哪些

YoloV3模型的pytorch權(quán)重文件轉(zhuǎn)化為onxx然后使用圖形化界面進(jìn)行轉(zhuǎn)化，只要安裝了rknn模塊就會(huì)有圖形化界面python3 -m rknn.bin.visualization量化成功生成成功原作者：雨淺聽(tīng)風(fēng)吟

2022-05-09 16:36:55

將ONNX模型轉(zhuǎn)換為中間表示（IR）后，精度下降了怎么解決？

將 ONNX 模型轉(zhuǎn)換為 IR。與使用 PyTorch 運(yùn)行 ONNX 模型相比，Ran IR 采用基準(zhǔn) C++ 工具，其性能準(zhǔn)確率降低了 20%。無(wú)法確定如何對(duì)圖像進(jìn)行預(yù)處理以獲得更好的準(zhǔn)確性。

2023-08-15 08:28:31

怎樣使用PyTorch Hub去加載YOLOv5模型

PyTorch Hub 加載預(yù)訓(xùn)練的 YOLOv5s 模型，model并傳遞圖像進(jìn)行推理。'yolov5s'是最輕最快的 YOLOv5 型號(hào)。有關(guān)所有可用模型的詳細(xì)信息，請(qǐng)參閱自述文件。詳細(xì)示例此示例

2022-07-22 16:02:42

怎樣去解決pytorch模型一直無(wú)法加載的問(wèn)題呢

rknn的模型轉(zhuǎn)換過(guò)程是如何實(shí)現(xiàn)的？怎樣去解決pytorch模型一直無(wú)法加載的問(wèn)題呢？

2022-02-11 06:03:34

通過(guò)Cortex來(lái)非常方便的部署PyTorch模型

到軟件中。如何從“跨語(yǔ)言語(yǔ)言模型”轉(zhuǎn)換為谷歌翻譯？在這篇博客文章中，我們將了解在生產(chǎn)環(huán)境中使用 PyTorch 模型意味著什么，然后介紹一種允許部署任何 PyTorch 模型以便在軟件中使用的方法。在生產(chǎn)中使

2022-11-01 15:25:02

基于結(jié)構(gòu)張量的自適應(yīng)CTV彩色圖像恢復(fù)模型

討論一種基于非線性擴(kuò)散方程的彩色圖像去噪方法。在圖像去噪的3 個(gè)基本要求的基礎(chǔ)上，總結(jié)出調(diào)和項(xiàng)模型和彩色總變差去噪模型中的不足，利用圖像的局部信息構(gòu)造函數(shù)使得模型

2009-03-20 17:02:33

如何在VxWorks系統(tǒng)中使用TrueType字庫(kù)

2009-03-29 12:25:18

基于圖像局部結(jié)構(gòu)的擴(kuò)散平滑

各向異性擴(kuò)散平滑去噪的主要特點(diǎn)是擴(kuò)散方向的選擇性與定向擴(kuò)散能力，有效表征信號(hào)或圖像的局部結(jié)構(gòu)特征是各向異性擴(kuò)散的基礎(chǔ)，傳統(tǒng)的梯度表示方法極易受到噪聲干擾。該文

2009-04-23 09:56:32

LuxStudio增材制造晶格模型自動(dòng)生成平臺(tái)

LuxStudio增材制造晶格模型自動(dòng)生成平臺(tái)｜LuxCreo目前，市面上大多數(shù)的晶格設(shè)計(jì)軟件幾乎都有局限性，比如晶格種類過(guò)少、生成的晶胞質(zhì)量本身有問(wèn)題、效果不理想，另外軟件操作門(mén)檻較高等，種種弊端

2022-11-09 10:43:02

基于改進(jìn)的各向異性擴(kuò)散的圖像恢復(fù)

基于改進(jìn)的各向異性擴(kuò)散的圖像恢復(fù):擴(kuò)散加權(quán)圖像中廣泛存在的高斯白噪聲會(huì)給張量計(jì)算和腦白質(zhì)追蹤等帶來(lái)嚴(yán)重的影響為了減少噪聲影響, 嘗試采用改進(jìn)的各向異性擴(kuò)散濾波器來(lái)

2009-10-26 11:29:46

如何在Saber中使用模塊

介紹了如何在Saber中使用這些模型.其實(shí)很簡(jiǎn)單,當(dāng)你下載完基于Saber軟件的模型(*.sin文件)以后,所需要做的事情就是為這個(gè)模型建立一個(gè)同名的符號(hào)(*.ai_sym文件),并設(shè)置兩個(gè)屬性值,就

2010-06-18 16:24:39

小波變換模極大值的擴(kuò)散模型

本內(nèi)容詳細(xì)介紹了小波變換模極大值的擴(kuò)散模型，歡迎大家下載，希望對(duì)大家學(xué)習(xí)有所幫助

2011-07-27 16:55:52

各向異性擴(kuò)散深度圖像增強(qiáng)算法

多幀均值濾波預(yù)處理；其次，通過(guò)在彩色圖像中引入權(quán)重的思想，構(gòu)建具有4鄰域形式的深度圖像模型，利用彩色圖像引導(dǎo)的深度圖像進(jìn)行各向異性擴(kuò)散，填補(bǔ)孔洞；最后，使用改進(jìn)的自適應(yīng)中值濾波平滑圖像噪聲。實(shí)驗(yàn)結(jié)果表明，該方法能

2017-11-25 11:08:46

圖像插值的一個(gè)變指數(shù)變分模型

為了消除插值圖像在邊緣的鋸齒現(xiàn)象、在平坦區(qū)域的分塊現(xiàn)象，提出了一種變指數(shù)變分模型的圖像插值方法。通過(guò)對(duì)變指數(shù)變分模型擴(kuò)散特性的研究，引入了一個(gè)滿足插值擴(kuò)散特性的指數(shù)函數(shù)。指數(shù)函數(shù)中的兩個(gè)參數(shù)實(shí)現(xiàn)

2017-11-30 15:35:55

如何在一個(gè)集成中使用多種模型的使用向?qū)?/a>

不同類型的模型集成。我目前并沒(méi)有發(fā)現(xiàn)有任何的教程或文檔教人們?nèi)?b class="flag-6" style="color: red">何在一個(gè)集成中使用多種模型，因此我決定自己做一個(gè)這方面的使用向?qū)А?/div>

2017-12-21 15:15:25

10102

利用Attention模型為圖像生成字幕

這款筆記是一種端到端(end-to-end)的樣例。如果你運(yùn)行它，將會(huì)下載 MS-COCO數(shù)據(jù)集，使用Inception V3來(lái)預(yù)處理和緩存圖像的子集、訓(xùn)練出編碼-解碼模型，并使用它來(lái)在新的圖像上生成字幕。

2018-07-20 10:19:47

4306

如何在UltraScale+設(shè)計(jì)中使用UltraRAM模塊

了解如何在UltraScale +設(shè)計(jì)中包含新的UltraRAM模塊。該視頻演示了如何在UltraScale + FPGA和MPSoC中使用UltraRAM，包括新的Xilinx參數(shù)化宏（XPM）工具。

2018-11-22 05:50:00

7646

如何讓PyTorch模型訓(xùn)練變得飛快？

有了），使用這個(gè)清單，一步一步確保你能榨干你模型的所有性能。本指南從最簡(jiǎn)單的結(jié)構(gòu)到最復(fù)雜的改動(dòng)都有，可以使你的網(wǎng)絡(luò)得到最大的好處。我會(huì)給你展示示例Pytorch代碼以及可以在Pytorch- lightning Trainer中使用的相關(guān)flags，這樣你可以不用自己編寫(xiě)這些代碼！這篇

2020-11-27 10:43:52

1487

融合施工場(chǎng)景及空間關(guān)系的圖像描述生成模型

為解決施工場(chǎng)景中缺少空間關(guān)系圖像描述的問(wèn)題，提出一種融合施工場(chǎng)景及空間關(guān)系的圖像描述生成模型。采用YoLoⅴ3網(wǎng)絡(luò)進(jìn)行目標(biāo)檢測(cè)，以 Transe算法為基礎(chǔ)在傳統(tǒng)對(duì)象檢測(cè)模型中加入特征提取層形成關(guān)系

2021-04-02 14:15:04

基于生成器的圖像分類對(duì)抗樣本生成模型

，并保證攻擊成功率。模型將對(duì)抗樣本生成的過(guò)程視為對(duì)原圖進(jìn)行圖像増強(qiáng)的操作引入生成對(duì)抗網(wǎng)絡(luò)，并改進(jìn)感知損失函數(shù)以增加對(duì)抗樣本與原圖在內(nèi)容與特征空間上的相似性，采用多分類器損失函數(shù)優(yōu)化訓(xùn)練從而提高攻擊效率。實(shí)

2021-04-07 14:56:47

基于生成式對(duì)抗網(wǎng)絡(luò)的端到端圖像去霧模型

針對(duì)現(xiàn)有圖像去霧算法嚴(yán)重依賴中間量準(zhǔn)確估計(jì)的問(wèn)題，提出了一種基于 Wasserstein生成對(duì)抗網(wǎng)絡(luò)（wGAN）的端到端圖像去霧模型。首先，使用全卷積密集塊網(wǎng)絡(luò)（FC- Dense Net充分學(xué)習(xí)

2021-04-12 15:03:33

一種基于改進(jìn)的DCGAN生成SAR圖像的方法

針對(duì)SAR圖像識(shí)別軟件，通過(guò)改進(jìn) DCGAN模型單生成器與單判別器對(duì)抗的結(jié)構(gòu)，采用多生成器與單判別器進(jìn)行對(duì)抗，設(shè)計(jì)了控制各生成器生成圖像平均質(zhì)量的算法，提出了一種基于改進(jìn)的 DCGAN生成SAR圖像

2021-04-23 11:01:58

梯度懲罰優(yōu)化的圖像循環(huán)生成對(duì)抗網(wǎng)絡(luò)模型

通常情形下，現(xiàn)有的圖像生成模型都采用單次前向傳播的方式生成圖像，但實(shí)際中，畫(huà)家通常是反復(fù)修改后才完成一幅畫(huà)作的;生成對(duì)抗模型（ Generative Adversarial Networks，GAN

2021-05-10 16:25:42

基于波域調(diào)和濾波擴(kuò)散模型的圖像去噪算法

針對(duì)當(dāng)前圖像去噪算法缺乏對(duì)整體結(jié)構(gòu)的分析以及運(yùn)算量過(guò)大的不足，提岀了一種利用波域調(diào)和濾波擴(kuò)散模型改進(jìn)BM3D去噪技術(shù)的新算法。首先，利用傳統(tǒng)的歐氏距離法將相似二維圖像塊合并，得到三維數(shù)組，再將聯(lián)合

2021-05-18 15:39:57

基于生成式對(duì)抗網(wǎng)絡(luò)的圖像補(bǔ)全方法

圖像補(bǔ)全是數(shù)字圖像處理領(lǐng)域的重要研究方向，具有廣闊的應(yīng)用前景。提出了一種基于生成式對(duì)抗網(wǎng)絡(luò)（GAN）的圖像補(bǔ)全方法。生成式對(duì)抗網(wǎng)絡(luò)模型由生成器模型和判別器模型兩部分構(gòu)成，通過(guò)采用卷積神經(jīng)網(wǎng)絡(luò)（NN

2021-05-19 14:38:24

用生成模型來(lái)做圖像恢復(fù)的介紹和回顧

導(dǎo)讀本文給出了圖像恢復(fù)的一般性框架，編解碼器 + GAN，后面的圖像復(fù)原基本都是這個(gè)框架。本文會(huì)介紹圖像修復(fù)的目的，它的應(yīng)用，等等。然后，我們將深入研究文獻(xiàn)中關(guān)于圖像修復(fù)的第一個(gè)生成模型

2021-06-10 15:56:47

1705

如何去解決文本到圖像生成的跨模態(tài)對(duì)比損失問(wèn)題？

從文本到圖像的自動(dòng)生成，如何訓(xùn)練模型僅通過(guò)一段文本描述輸入就能生成具體的圖像，是一項(xiàng)非常具有挑戰(zhàn)性的任務(wù)。

2021-06-15 10:07:48

2347

基于像素級(jí)生成對(duì)抗網(wǎng)絡(luò)的圖像彩色化模型

2021-06-27 11:02:01

機(jī)器學(xué)習(xí)中如何使用擴(kuò)散模型產(chǎn)生高保真度圖像

臨各種類型的應(yīng)用所帶來(lái)的許多設(shè)計(jì)挑戰(zhàn)。其中之一就是圖像超分辨率，即訓(xùn)練一個(gè)模型來(lái)將低分辨率的圖像，轉(zhuǎn)換為細(xì)節(jié)豐富的高分辨率圖像（例如 RAISR）。超分辨率的應(yīng)用有很多，從恢復(fù)古舊的家族畫(huà)像，到改善醫(yī)療成像

2021-08-24 09:22:24

2617

擴(kuò)散模型在視頻領(lǐng)域表現(xiàn)如何？

在視頻生成領(lǐng)域，研究的一個(gè)重要里程碑是生成時(shí)間相干的高保真視頻。來(lái)自谷歌的研究者通過(guò)提出一個(gè)視頻生成擴(kuò)散模型來(lái)實(shí)現(xiàn)這一里程碑，顯示出非常有希望的初步結(jié)果。本文所提出的模型是標(biāo)準(zhǔn)圖像擴(kuò)散架構(gòu)的自然擴(kuò)展

2022-04-13 10:04:24

1281

如何改進(jìn)和加速擴(kuò)散模型采樣的方法1

　　盡管擴(kuò)散模型實(shí)現(xiàn)了較高的樣本質(zhì)量和多樣性，但不幸的是，它們?cè)诓蓸铀俣确矫娲嬖诓蛔恪＿@限制了擴(kuò)散模型在實(shí)際應(yīng)用中的廣泛采用，并導(dǎo)致了從這些模型加速采樣的研究領(lǐng)域的活躍。在 Part 2 中，我們回顧了 NVIDIA 為克服擴(kuò)散模型的主要局限性而開(kāi)發(fā)的三種技術(shù)。

2022-05-07 14:25:26

1768

如何改進(jìn)和加速擴(kuò)散模型采樣的方法2

　　事實(shí)上，擴(kuò)散模型已經(jīng)在深層生成性學(xué)習(xí)方面取得了重大進(jìn)展。我們預(yù)計(jì)，它們可能會(huì)在圖像和視頻處理、 3D 內(nèi)容生成和數(shù)字藝術(shù)以及語(yǔ)音和語(yǔ)言建模等領(lǐng)域得到實(shí)際應(yīng)用。它們還將用于藥物發(fā)現(xiàn)和材料設(shè)計(jì)等領(lǐng)域，以及其他各種重要應(yīng)用。我們認(rèn)為，基于擴(kuò)散的方法有可能推動(dòng)下一代領(lǐng)先的生成模型。

2022-05-07 14:38:38

2563

新晉圖像生成王者擴(kuò)散模型

他們確定了最佳的時(shí)間離散化（time discretization），對(duì)采樣過(guò)程應(yīng)用了更高階的Runge–Kutta方法，并在三個(gè)預(yù)訓(xùn)練模型上評(píng)估不同的方法，分析了隨機(jī)性在采樣過(guò)程中的有用性。

2022-06-06 10:54:25

971

在PyTorch中使用ReLU激活函數(shù)的例子

PyTorch已為我們實(shí)現(xiàn)了大多數(shù)常用的非線性激活函數(shù)，我們可以像使用任何其他的層那樣使用它們。讓我們快速看一個(gè)在PyTorch中使用ReLU激活函數(shù)的例子：

2022-07-06 15:27:37

2147

擴(kuò)散模型和其在文本生成圖像任務(wù)上的應(yīng)用

擴(kuò)散過(guò)程有一個(gè)顯著特性，我們可以對(duì)任意進(jìn)行采樣。為了證明該性質(zhì)需要使用參數(shù)重整化技巧：假設(shè)要從高斯分布中采樣時(shí)，可以先從采樣出 ,然后計(jì)算 ,這樣可以解決梯度無(wú)法回傳問(wèn)題。

2022-08-03 15:34:08

2331

如何在java代碼中使用HTTP代理IP

如何在java代碼中使用HTTP代理IP。

2022-08-04 15:38:49

1867

如何在python代碼中使用HTTP代理IP

如何在python代碼中使用HTTP代理IP。

2022-08-04 15:46:27

1011

如何在PHP代碼中使用HTTP代理IP

如何在PHP代碼中使用HTTP代理IP。

2022-08-04 16:08:51

2057

蒸餾無(wú)分類器指導(dǎo)擴(kuò)散模型的方法

去噪擴(kuò)散概率模型（DDPM）在圖像生成、音頻合成、分子生成和似然估計(jì)領(lǐng)域都已經(jīng)實(shí)現(xiàn)了 SOTA 性能。同時(shí)無(wú)分類器（classifier-free）指導(dǎo)進(jìn)一步提升了擴(kuò)散模型的樣本質(zhì)量，并已被廣泛應(yīng)用在包括 GLIDE、DALL·E 2 和 Imagen 在內(nèi)的大規(guī)模擴(kuò)散模型框架中。

2022-10-13 10:35:49

813

基于泊松方程的生成模型 PFGM

擴(kuò)散模型最早來(lái)源于物理中的熱力學(xué)，最近卻在人工智能領(lǐng)域大放異彩。還有什么物理理論可以推動(dòng)生成模型研究的發(fā)展呢？

2022-10-20 09:22:22

1137

如何在Arduino中使用伺服電機(jī)

電子發(fā)燒友網(wǎng)站提供《如何在Arduino中使用伺服電機(jī).zip》資料免費(fèi)下載

2022-10-24 09:46:03

如何在arduino中使用I2c LCD模塊

電子發(fā)燒友網(wǎng)站提供《如何在arduino中使用I2c LCD模塊.zip》資料免費(fèi)下載

2022-10-26 14:29:36

如何在Arduino中使用LDR

電子發(fā)燒友網(wǎng)站提供《如何在Arduino中使用LDR.zip》資料免費(fèi)下載

2022-10-31 09:50:41

如何在Arduino中使用Modbus

電子發(fā)燒友網(wǎng)站提供《如何在Arduino中使用Modbus.zip》資料免費(fèi)下載

2022-11-22 11:21:30

如何在Arduino中使用微型伺服

電子發(fā)燒友網(wǎng)站提供《如何在Arduino中使用微型伺服.zip》資料免費(fèi)下載

2022-11-28 09:50:24

那些年在pytorch上踩過(guò)的坑

今天又發(fā)現(xiàn)了一個(gè)pytorch的小坑，給大家分享一下。手上兩份同一模型的代碼，一份用tensorflow寫(xiě)的，另一份是我拿pytorch寫(xiě)的，模型架構(gòu)一模一樣，預(yù)處理數(shù)據(jù)的邏輯也一模一樣，測(cè)試發(fā)現(xiàn)模型推理的速度也差不多。一份預(yù)處理代碼是為pytorch模型寫(xiě)的，用到的庫(kù)是

2023-02-22 14:18:20

782

PyTorch教程4.2之圖像分類數(shù)據(jù)集

電子發(fā)燒友網(wǎng)站提供《PyTorch教程4.2之圖像分類數(shù)據(jù)集.pdf》資料免費(fèi)下載

2023-06-05 15:41:46

PyTorch教程4.3之基本分類模型

電子發(fā)燒友網(wǎng)站提供《PyTorch教程4.3之基本分類模型.pdf》資料免費(fèi)下載

2023-06-05 15:43:55

PyTorch教程7.2之圖像卷積

電子發(fā)燒友網(wǎng)站提供《PyTorch教程7.2之圖像卷積.pdf》資料免費(fèi)下載

2023-06-05 10:13:56

PyTorch教程9.3.之語(yǔ)言模型

電子發(fā)燒友網(wǎng)站提供《PyTorch教程9.3.之語(yǔ)言模型.pdf》資料免費(fèi)下載

2023-06-05 09:59:00

PyTorch教程14.1之圖像增強(qiáng)

電子發(fā)燒友網(wǎng)站提供《PyTorch教程14.1之圖像增強(qiáng).pdf》資料免費(fèi)下載

2023-06-05 14:24:23

PyTorch教程20.2之深度卷積生成對(duì)抗網(wǎng)絡(luò)

電子發(fā)燒友網(wǎng)站提供《PyTorch教程20.2之深度卷積生成對(duì)抗網(wǎng)絡(luò).pdf》資料免費(fèi)下載

2023-06-05 10:21:24

如何在生成的代碼中使用UVM Register Layer？

寄存器模型一般可以使用工具生成或者從頭開(kāi)始編寫(xiě)

2023-06-05 14:14:02

413

基于文本到圖像模型的可控文本到視頻生成

1. 論文信息 2. 引言 ? 大規(guī)模擴(kuò)散模型在文本到圖像合成方面取得了巨大的突破，并在創(chuàng)意應(yīng)用方面取得了成功。一些工作試圖在視頻領(lǐng)域復(fù)制這個(gè)成功，即在野外世界建模高維復(fù)雜視頻分布。然而，訓(xùn)練這樣

2023-06-14 10:39:14

536

如何在深度學(xué)習(xí)結(jié)構(gòu)中使用紋理特征

篇文章中，我們將討論紋理分析在圖像分類中的重要性，以及如何在深度學(xué)習(xí)中使用紋理分析。我們還將討論一些常用的紋理提取技術(shù)，這些技術(shù)用于預(yù)先訓(xùn)練的模型，以更有效地解決分類任

2022-10-10 09:15:41

594

如何在Python中使用MQTT

本文主要介紹如何在 Python 項(xiàng)目中使用?paho-mqtt?客戶端庫(kù) ，實(shí)現(xiàn)客戶端與?MQTT?服務(wù)器的連接、訂閱、取消訂閱、收發(fā)消息等功能。

2022-12-22 10:41:54

5805

英特爾研究院發(fā)布全新AI擴(kuò)散模型，可根據(jù)文本提示生成360度全景圖

for 3D）模型，這一全新的擴(kuò)散模型使用生成式AI創(chuàng)建3D視覺(jué)內(nèi)容。LDM3D是業(yè)界領(lǐng)先的利用擴(kuò)散過(guò)程（diffusion process）生成深度圖（depth map）的模型，進(jìn)而生成逼真

2023-06-25 09:19:59

262

沒(méi)有“中間商賺差價(jià)”， OpenVINO? 直接支持 PyTorch 模型對(duì)象

隨著 OpenVINO 2023.0 版本的發(fā)布，OpenVINO 工具庫(kù)中預(yù)置了全新的 PyTorch 前端，為開(kāi)發(fā)者們提供了一條全新的 PyTorch 模型支持路徑，帶來(lái)更友好的用戶

2023-06-27 16:39:40

382

英特爾研究院發(fā)布全新AI擴(kuò)散模型，可根據(jù)文本提示生成360度全景圖

英特爾研究院宣布與Blockade Labs合作發(fā)布LDM3D（Latent Diffusion Model for 3D）模型，這一全新的擴(kuò)散模型使用生成式AI創(chuàng)建3D視覺(jué)內(nèi)容。LDM3D是業(yè)界

2023-06-30 19:50:02

209

深度學(xué)習(xí)框架pytorch入門(mén)與實(shí)踐

的。PyTorch是一個(gè)開(kāi)源的深度學(xué)習(xí)框架，在深度學(xué)習(xí)領(lǐng)域得到了廣泛應(yīng)用。本文將介紹PyTorch框架的基本知識(shí)、核心概念以及如何在實(shí)踐中使用PyTorch框架。一、PyTorch框架概述 PyTorch是一個(gè)Facebook開(kāi)源項(xiàng)目，是一個(gè)動(dòng)態(tài)計(jì)算圖的深度學(xué)習(xí)框架。與靜態(tài)計(jì)算圖的T

2023-08-17 16:03:06

1075

使用PyTorch加速圖像分割

使用PyTorch加速圖像分割

2023-08-31 14:27:10

441

如何加速生成2 PyTorch擴(kuò)散模型

加速生成2 PyTorch擴(kuò)散模型

2023-09-04 16:09:08

782

頂刊TPAMI 2023！生成式AI與圖像合成綜述發(fā)布！

近期，火熱的擴(kuò)散模型也被廣泛應(yīng)用于多模態(tài)合成與編輯任務(wù)。例如效果驚人的DALLE-2和Imagen都是基于擴(kuò)散模型實(shí)現(xiàn)的。相比于GAN，擴(kuò)散式生成模型擁有一些良好的性質(zhì)，比如靜態(tài)的訓(xùn)練目標(biāo)和易擴(kuò)展性。該論文依據(jù)條件擴(kuò)散模型和預(yù)訓(xùn)練擴(kuò)散模型對(duì)現(xiàn)有方法進(jìn)行了分類與詳細(xì)分析。

2023-09-05 16:06:06

398

ICCV 2023 | 重塑人體動(dòng)作生成，融合擴(kuò)散模型與檢索策略的新范式ReMoDiffuse來(lái)了

知識(shí)，涉及昂貴的系統(tǒng)和軟件，不同軟硬件系統(tǒng)之間可能存在兼容性問(wèn)題等。隨著深度學(xué)習(xí)的發(fā)展，人們開(kāi)始嘗試使用生成模型來(lái)實(shí)現(xiàn)人體動(dòng)作序列的自動(dòng)生成，例如通過(guò)輸入文本描述，要求模型生成與文本要求相匹配的動(dòng)作序列。隨著擴(kuò)散模

2023-09-10 22:30:04

429

DDFM：首個(gè)使用擴(kuò)散模型進(jìn)行多模態(tài)圖像融合的方法

近來(lái)去噪擴(kuò)散概率模型 Denoising diffusion probabilistic model (DDPM)在圖像生成中獲得很多進(jìn)步，通過(guò)對(duì)一張noise-corrupted圖像恢復(fù)為干凈圖像的擴(kuò)散過(guò)程進(jìn)行建模，可以生成質(zhì)量很好的圖像。

2023-09-19 16:02:50

982

使用Pytorch實(shí)現(xiàn)頻譜歸一化生成對(duì)抗網(wǎng)絡(luò)(SN-GAN)

自從擴(kuò)散模型發(fā)布以來(lái)，GAN的關(guān)注度和論文是越來(lái)越少了，但是它們里面的一些思路還是值得我們了解和學(xué)習(xí)。所以本文我們來(lái)使用Pytorch 來(lái)實(shí)現(xiàn)SN-GAN

2023-10-18 10:59:17

232

谷歌新作UFOGen：通過(guò)擴(kuò)散GAN實(shí)現(xiàn)大規(guī)模文本到圖像生成

擴(kuò)散模型和 GAN 的混合模型最早是英偉達(dá)的研究團(tuán)隊(duì)在 ICLR 2022 上提出的 DDGAN（《Tackling the Generative Learning Trilemma with Denoising Diffusion GANs》）。其靈感來(lái)自于普通擴(kuò)散模型對(duì)降噪分布進(jìn)行高斯假設(shè)的根本缺陷。

2023-11-21 16:02:19

275

基于DiAD擴(kuò)散模型的多類異常檢測(cè)工作

現(xiàn)有的基于計(jì)算機(jī)視覺(jué)的工業(yè)異常檢測(cè)技術(shù)包括基于特征的、基于重構(gòu)的和基于合成的技術(shù)。最近，擴(kuò)散模型因其強(qiáng)大的生成能力而聞名，因此本文作者希望通過(guò)擴(kuò)散模型將異常區(qū)域重構(gòu)成正常。

2024-01-08 14:55:49

238

Adobe提出DMV3D：3D生成只需30秒！讓文本、圖像都動(dòng)起來(lái)的新方法！

因此，本文研究者的目標(biāo)是實(shí)現(xiàn)快速、逼真和通用的 3D 生成。為此，他們提出了 DMV3D。DMV3D 是一種全新的單階段的全類別擴(kuò)散模型，能直接根據(jù)模型文字或單張圖片的輸入，生成 3D NeRF。在單個(gè) A100 GPU 上，僅需 30 秒，DMV3D 就能生成各種高保真 3D 圖像。

2024-01-30 16:20:08

331

谷歌推出AI擴(kuò)散模型Lumiere

近日，谷歌研究院重磅推出全新AI擴(kuò)散模型Lumiere，這款模型基于谷歌自主研發(fā)的“Space-Time U-Net”基礎(chǔ)架構(gòu)，旨在實(shí)現(xiàn)視頻生成的一次性完成，同時(shí)保證視頻的真實(shí)性和動(dòng)作連貫性。

2024-02-04 13:49:39

548

Stability AI試圖通過(guò)新的圖像生成人工智能模型保持領(lǐng)先地位

Stability AI的最新圖像生成模型Stable Cascade承諾比其業(yè)界領(lǐng)先的前身Stable Diffusion更快、更強(qiáng)大，而Stable Diffusion是許多其他文本到圖像生成AI工具的基礎(chǔ)。

2024-02-19 16:03:35

375

如何在測(cè)試中使用ChatGPT

Dimitar Panayotov 在 2023 年 QA Challenge Accepted 大會(huì) 上分享了他如何在測(cè)試中使用 ChatGPT。

2024-02-20 13:57:01

280

KOALA人工智能圖像生成模型問(wèn)世

近日，韓國(guó)科學(xué)團(tuán)隊(duì)宣布研發(fā)出名為 KOALA 的新型人工智能圖像生成模型，該模型在速度和質(zhì)量上均實(shí)現(xiàn)了顯著突破。KOALA 能夠在短短 2 秒內(nèi)生成高質(zhì)量圖片，同時(shí)大幅降低了對(duì)硬件的需求，為圖像生成領(lǐng)域帶來(lái)了全新的可能性。

2024-03-05 10:46:30

268

已全部加載完成

搜索歷史

如何在PyTorch中使用擴(kuò)散模型生成圖像

評(píng)論