伊在人亚洲香蕉精品播放,亚洲在线视频一区,又黄又涩

如今人工智能越來(lái)越強(qiáng)大，比如可以實(shí)現(xiàn)生成音樂(lè)、改變圖片藝術(shù)風(fēng)格等等。最近，人工智能非營(yíng)利組織OpenAI發(fā)布了一個(gè)名為DALL-E的神經(jīng)網(wǎng)絡(luò)，可以將文本轉(zhuǎn)換成與內(nèi)容相關(guān)的圖像。

比如生成下面這些穿著芭蕾舞裙揮舞著光劍的熊貓寶寶：

OpenAI在一篇博文中表示，該系統(tǒng)是具有里程碑意義的GPT-3語(yǔ)言模型的120億參數(shù)版本。

DALL-E模型具有多種功能，包括創(chuàng)建動(dòng)物和物體的擬物化版本，以合理的方式展示相關(guān)的概念，渲染文本，以及對(duì)現(xiàn)有圖像進(jìn)行轉(zhuǎn)換。

比如在該模型中選定“與貓有關(guān)的文本關(guān)鍵詞”，同時(shí)選擇給定的其中一種貓類型，最終系統(tǒng)會(huì)自動(dòng)生成一系列與貓主題有關(guān)的圖像，并且風(fēng)格呈現(xiàn)多樣化。

訓(xùn)練該模型的數(shù)據(jù)集主要基于互聯(lián)網(wǎng)大量文本-圖像。這使得它能夠通過(guò)探索提示的結(jié)構(gòu)來(lái)創(chuàng)造出全新的圖片。比如生成一些令人印象深刻的地標(biāo)、位置、雜交動(dòng)物和不同年代設(shè)計(jì)的圖像。但是OpenAI承認(rèn)并不是所有的結(jié)果都是成功的。

不過(guò)，OpenAI承認(rèn)并不是所有生成的結(jié)果都是成功的。該公司表示，DALL-E系統(tǒng)有時(shí)無(wú)法繪制出某些特定的項(xiàng)目，混淆了對(duì)象與其特定屬性之間的關(guān)系。

通常，提示DALL-E寫(xiě)的字符串越長(zhǎng)，成功率越低。測(cè)試中發(fā)現(xiàn)，重復(fù)部分文本內(nèi)容，準(zhǔn)確率有所提高。

當(dāng)回答有關(guān)地理方面的問(wèn)題時(shí)，比如旗幟、菜肴和當(dāng)?shù)匾吧鷦?dòng)物，DALL-E也經(jīng)常反映出膚淺的刻板印象。考慮到人們?cè)絹?lái)越關(guān)注人工智能算法偏見(jiàn)的問(wèn)題，這個(gè)缺點(diǎn)尤為明顯。

OpenAI表示，它計(jì)劃分析DALL-E等模特的社會(huì)影響，但該公司認(rèn)為，該系統(tǒng)表明“通過(guò)語(yǔ)言操縱視覺(jué)概念現(xiàn)在已經(jīng)觸手可及?！?/p>

感興趣的小伙伴可以在OpenAI網(wǎng)站上查看更多DALL-E模型生成的圖像。
責(zé)編AJX

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

圖像處理

圖像處理

+關(guān)注

關(guān)注
27

文章
1299

瀏覽量
56837
AI

AI

+關(guān)注

關(guān)注
87

文章
31429

瀏覽量
269824
模型

模型

+關(guān)注

關(guān)注
1

文章
3294

瀏覽量
49036

評(píng)論

相關(guān)推薦

廣和通發(fā)布AI玩具大模型解決方案

玩具行業(yè)的新篇章。這一解決方案的最大亮點(diǎn)在于其高度的集成性和智能化。無(wú)需外接MCU，即可輕松實(shí)現(xiàn)音視頻及圖像的實(shí)時(shí)傳輸、精準(zhǔn)的語(yǔ)音識(shí)別、流暢的自然語(yǔ)言處理以及強(qiáng)大的機(jī)器學(xué)習(xí)功能。通過(guò)擬人、擬動(dòng)物或擬IP的生動(dòng)形式，該方案能夠讓AI

發(fā)表于 01-21 14:45 ?257次閱讀

【「基于大模型的RAG應(yīng)用開(kāi)發(fā)與優(yōu)化」閱讀體驗(yàn)】+Embedding技術(shù)解讀

今天學(xué)習(xí)大模型RAG 檢索增強(qiáng)生成技術(shù)Embedding，即嵌入，是一種將離散數(shù)據(jù)（如文字、圖像、音頻等）轉(zhuǎn)換為連續(xù)的密集向量表示的技術(shù)。這些向量能夠反映原始數(shù)據(jù)之間的關(guān)系，使得計(jì)算機(jī)能夠更好地處

發(fā)表于 01-17 19:53

OpenAI推出AI視頻生成模型Sora

近日，備受期待的OpenAI再次推出了其創(chuàng)新之作——AI視頻生成模型Sora。這一新品的發(fā)布，無(wú)疑為AI技術(shù)注入了新的活力。據(jù)悉，Sora與OpenAI旗下的AI工具DALL-E有著

發(fā)表于 12-12 09:40 ?229次閱讀

AI模型部署邊緣設(shè)備的奇妙之旅：如何實(shí)現(xiàn)手寫(xiě)數(shù)字識(shí)別

涉及將浮點(diǎn)數(shù)（如32位或16位）表示的權(quán)重和激活轉(zhuǎn)換為低精度的數(shù)據(jù)類型（如8位整數(shù)或更低），從而實(shí)現(xiàn)模型壓縮和加速推理。過(guò)程（1）訓(xùn)練后量化這是最簡(jiǎn)單的方法，直接應(yīng)用于已經(jīng)訓(xùn)練好的模型。過(guò)程如下

發(fā)表于 12-06 17:20

NVIDIA推出全新生成式AI模型Fugatto

NVIDIA 開(kāi)發(fā)了一個(gè)全新的生成式 AI 模型。利用輸入的文本和音頻，該模型可以創(chuàng)作出包含任意的音樂(lè)、人聲和聲音組合的作品。

發(fā)表于 11-27 11:29 ?407次閱讀

AI大模型的訓(xùn)練數(shù)據(jù)來(lái)源分析

學(xué)術(shù)機(jī)構(gòu)、政府組織或企業(yè)公開(kāi)發(fā)布，涵蓋了各種類型的數(shù)據(jù)，如圖像、文本、音頻、視頻等。例如： ImageNet ：一個(gè)廣泛用于圖像識(shí)別任務(wù)的大規(guī)模圖像數(shù)據(jù)集。 Common Crawl

發(fā)表于 10-23 15:32 ?925次閱讀

AI大模型的最新研究進(jìn)展

。例如，在醫(yī)療領(lǐng)域，生成式AI可以幫助醫(yī)生生成診斷報(bào)告、治療方案等；在教育領(lǐng)域，AI大模型可以生成個(gè)性化的學(xué)習(xí)資源和建議。多模態(tài)融合與交互： AI大

發(fā)表于 10-23 15:19 ?543次閱讀

未來(lái)AI大模型的發(fā)展趨勢(shì)

上得到了顯著提升。未來(lái)，算法和架構(gòu)的進(jìn)一步優(yōu)化將推動(dòng)AI大模型在性能上實(shí)現(xiàn)新的突破。多頭自注意力機(jī)制、前饋神經(jīng)網(wǎng)絡(luò)等關(guān)鍵技術(shù)的改進(jìn)，將增強(qiáng)模型的表達(dá)能力和泛化能力。多模態(tài)融合： AI

發(fā)表于 10-23 15:06 ?761次閱讀

AI大模型在圖像識(shí)別中的優(yōu)勢(shì)

AI大模型在圖像識(shí)別中展現(xiàn)出了顯著的優(yōu)勢(shì)，這些優(yōu)勢(shì)主要源于其強(qiáng)大的計(jì)算能力、深度學(xué)習(xí)算法以及大規(guī)模的數(shù)據(jù)處理能力。以下是對(duì)AI大模型在

發(fā)表于 10-23 15:01 ?890次閱讀

AI大模型在自然語(yǔ)言處理中的應(yīng)用

AI大模型在自然語(yǔ)言處理（NLP）中的應(yīng)用廣泛且深入，其強(qiáng)大的語(yǔ)義理解和生成能力為NLP任務(wù)帶來(lái)了顯著的性能提升。以下是對(duì)AI大模型在NLP中應(yīng)用的介紹：一、核心應(yīng)用

發(fā)表于 10-23 14:38 ?596次閱讀

微軟Azure AI語(yǔ)音服務(wù)革新:引入虛擬人形象,文本一鍵轉(zhuǎn)生動(dòng)視頻

微軟于8月23日宣布，在其領(lǐng)先的Azure AI語(yǔ)音服務(wù)中融入了一項(xiàng)革命性創(chuàng)新——虛擬人形象功能，此功能徹底顛覆了傳統(tǒng)交互方式，讓文本轉(zhuǎn)視頻的過(guò)程變得前所未有的直觀與生動(dòng)。

發(fā)表于 08-23 16:25 ?743次閱讀

李未可科技正式推出WAKE-AI多模態(tài)AI大模型

文本生成、語(yǔ)言理解、圖像識(shí)別及視頻生成等多模態(tài)交互能力。 ? 該大模型圍繞 GPS 軌跡+視覺(jué)+語(yǔ)音打造新一代 LLM-Based的自然交互，同時(shí)多模態(tài)問(wèn)答技術(shù)的加持，能實(shí)現(xiàn)所見(jiàn)即所問(wèn)、所問(wèn)即所得的精準(zhǔn)服務(wù)。此外，融合了人類意圖

發(fā)表于 04-18 17:01 ?639次閱讀

阿里巴巴推出全新AI圖生視頻模型EMO

近日，阿里巴巴集團(tuán)智能計(jì)算研究院宣布推出了一款革命性的AI圖片-音頻-視頻模型技術(shù)——EMO。據(jù)官方介紹，EMO是一種先進(jìn)的音頻驅(qū)動(dòng)肖像視頻生成框架，能夠?qū)㈧o態(tài)照片轉(zhuǎn)化為生動(dòng)逼真的動(dòng)態(tài)視頻，并且能夠隨著任意音頻文件“說(shuō)話”或“唱

發(fā)表于 03-05 11:00 ?1406次閱讀

英偉達(dá)如何應(yīng)對(duì)AI芯片市場(chǎng)需求的轉(zhuǎn)變

隨著該行業(yè)的快速發(fā)展，更大的機(jī)遇將是銷售讓這些模型在訓(xùn)練后運(yùn)行的芯片，為生成式AI工具迅速擴(kuò)大的公司和個(gè)人使用者提供大量文本和圖像。

發(fā)表于 02-27 10:34 ?257次閱讀

Stability AI試圖通過(guò)新的圖像生成人工智能模型保持領(lǐng)先地位

Stability AI的最新圖像生成模型Stable Cascade承諾比其業(yè)界領(lǐng)先的前身Stable Diffusion更快、更強(qiáng)大，而Stable Diffusion是許多其他文本

發(fā)表于 02-19 16:03 ?982次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

AI新模型可將文本轉(zhuǎn)換為生動(dòng)的圖像

評(píng)論

廣和通發(fā)布AI玩具大模型解決方案

【「基于大模型的RAG應(yīng)用開(kāi)發(fā)與優(yōu)化」閱讀體驗(yàn)】+Embedding技術(shù)解讀

OpenAI推出AI視頻生成模型Sora

AI模型部署邊緣設(shè)備的奇妙之旅：如何實(shí)現(xiàn)手寫(xiě)數(shù)字識(shí)別

NVIDIA推出全新生成式AI模型Fugatto

AI大模型的訓(xùn)練數(shù)據(jù)來(lái)源分析

AI大模型的最新研究進(jìn)展

未來(lái)AI大模型的發(fā)展趨勢(shì)

AI大模型在圖像識(shí)別中的優(yōu)勢(shì)

AI大模型在自然語(yǔ)言處理中的應(yīng)用

微軟Azure AI語(yǔ)音服務(wù)革新:引入虛擬人形象,文本一鍵轉(zhuǎn)生動(dòng)視頻

李未可科技正式推出WAKE-AI多模態(tài)AI大模型

阿里巴巴推出全新AI圖生視頻模型EMO

英偉達(dá)如何應(yīng)對(duì)AI芯片市場(chǎng)需求的轉(zhuǎn)變

Stability AI試圖通過(guò)新的圖像生成人工智能模型保持領(lǐng)先地位