色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

OpenAI重磅推出語(yǔ)言模型DALL·E和圖像識(shí)別系統(tǒng)CLIP

454398 ? 來(lái)源:控制工程網(wǎng) ? 作者:控制工程網(wǎng) ? 2021-01-15 11:27 ? 次閱讀

人工智能AI)研究組織OpenAI重磅推出了最新的語(yǔ)言模型DALL·E和圖像識(shí)別系統(tǒng)CLIP。

這兩個(gè)模型是OpenAI第三代語(yǔ)言生成器的一個(gè)分支。兩種神經(jīng)網(wǎng)絡(luò)都旨在生成能夠理解圖像和相關(guān)文本的模型。OpenAI希望這些升級(jí)后的語(yǔ)言模型能夠以接近人類解釋世界的方式來(lái)解讀圖像。

2020年5月,OpenAI發(fā)布了迄今為止全球規(guī)模最大的預(yù)訓(xùn)練語(yǔ)言模型GPT-3。GPT-3具有1750億參數(shù),訓(xùn)練所用的數(shù)據(jù)量達(dá)到45TB。對(duì)于所有任務(wù),應(yīng)用GPT-3無(wú)需進(jìn)行任何梯度更新或微調(diào),僅需要與模型文本交互為其指定任務(wù)和展示少量演示即可使其完成任務(wù)。

GPT-3在許多自然語(yǔ)言處理數(shù)據(jù)集上均具有出色的性能,包括翻譯、問(wèn)答和文本填空任務(wù),還包括一些需要即時(shí)推理或領(lǐng)域適應(yīng)的任務(wù)等,已在很多實(shí)際任務(wù)上大幅接近人類水平。

新發(fā)布的語(yǔ)言模型DALL·E,是GPT-3的120億參數(shù)版本,可以按照自然語(yǔ)言文字描述直接生成對(duì)應(yīng)圖片!

這個(gè)新系統(tǒng)的名稱DALL·E,來(lái)源于藝術(shù)家薩爾瓦多·達(dá)利(Salvador Dali)和皮克斯的機(jī)器人英雄瓦力(WALL-E)的結(jié)合。新系統(tǒng)展示了“為一系列廣泛的概念”創(chuàng)造圖像的能力,可從文字標(biāo)題直接創(chuàng)建圖像以表達(dá)概念。通過(guò)從文本描述而不是標(biāo)簽數(shù)據(jù)生成圖像,可以為模型提供了更多有關(guān)含義的上下文。

開(kāi)發(fā)人員將DALL·E稱為“轉(zhuǎn)換語(yǔ)言模型”(transformer language model),能夠?qū)⑽谋竞蛨D像作為單個(gè)數(shù)據(jù)流接收。這種訓(xùn)練程序使得DALL·E不僅可以從零開(kāi)始生成圖像,而且還可以重新生成現(xiàn)有圖像的任何矩形區(qū)域……。以一種與文本提示一致的方式。

這種語(yǔ)言模型能夠反映人類語(yǔ)言的微妙之處,包括 “將不同的想法結(jié)合起來(lái)合成物體的能力”。例如,在DALL·E模型中輸入“牛油果形狀的扶手椅”,它就可以生成這樣的圖片:

DALL·E還擴(kuò)展了被稱為“零樣本推理”(zero-shotreasoning)的GPT-3功能,這是一種強(qiáng)大的常識(shí)性機(jī)器學(xué)習(xí)形式。DALL·E將這一功能擴(kuò)展到了視覺(jué)領(lǐng)域,并且在以正確的方式提示時(shí)能夠執(zhí)行多種圖像到圖像的翻譯任務(wù)。

圖像識(shí)別系統(tǒng)CLIP的通用性比當(dāng)前針對(duì)單個(gè)任務(wù)的系統(tǒng)更好,可以用網(wǎng)上公開(kāi)的文字圖像配對(duì)數(shù)據(jù)集來(lái)訓(xùn)練。CLIP系統(tǒng)可用于對(duì)比語(yǔ)言-圖像預(yù)訓(xùn)練,通過(guò)從網(wǎng)絡(luò)圖像中收集的自然語(yǔ)言監(jiān)督學(xué)習(xí)視覺(jué)概念。OpenAI表示CLIP的工作方式是提供要識(shí)別的視覺(jué)類別的名稱。

當(dāng)將其應(yīng)用于圖像分類基準(zhǔn)時(shí),可以指示模型執(zhí)行一系列基準(zhǔn),而無(wú)需針對(duì)每個(gè)測(cè)試進(jìn)行優(yōu)化。OpenAI表示:“通過(guò)不直接針對(duì)基準(zhǔn)進(jìn)行優(yōu)化,我們證明它變得更具代表性。” CLIP方法可將“穩(wěn)健性差距”縮小多達(dá)75%。

OpenAI 聯(lián)合創(chuàng)始人、首席科學(xué)家 Ilya Sutskever認(rèn)為,人工智能的長(zhǎng)期目標(biāo)是構(gòu)建多模態(tài)神經(jīng)網(wǎng)絡(luò),即AI能夠?qū)W習(xí)不同模態(tài)之間的概念(文本和視覺(jué)領(lǐng)域?yàn)橹鳎瑥亩玫乩斫馐澜纾?DALL·E 和 CLIP 使我們更接近“多模態(tài) AI 系統(tǒng)”這一目標(biāo)。

未來(lái),我們將擁有同時(shí)理解文本和圖像的模型。人工智能將能夠更好地理解語(yǔ)言,因?yàn)樗梢钥吹絾卧~和句子的含義。
編輯:hfy

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4774

    瀏覽量

    100898
  • 圖像識(shí)別
    +關(guān)注

    關(guān)注

    9

    文章

    520

    瀏覽量

    38290
  • 人工智能
    +關(guān)注

    關(guān)注

    1792

    文章

    47425

    瀏覽量

    238963
  • Clip
    +關(guān)注

    關(guān)注

    0

    文章

    31

    瀏覽量

    6673
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1100

    瀏覽量

    6576
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    AI圖像識(shí)別攝像機(jī)

    ?AI圖像識(shí)別攝像機(jī)是一種集成了先進(jìn)算法和深度學(xué)習(xí)模型的智能監(jiān)控設(shè)備。這些攝像機(jī)不僅能夠捕捉視頻畫(huà)面,還能實(shí)時(shí)分析和處理所拍攝的內(nèi)容,從而實(shí)現(xiàn)對(duì)特定對(duì)象、場(chǎng)景或行
    的頭像 發(fā)表于 11-08 10:38 ?280次閱讀
    AI<b class='flag-5'>圖像識(shí)別</b>攝像機(jī)

    AI大模型圖像識(shí)別中的優(yōu)勢(shì)

    AI大模型圖像識(shí)別中展現(xiàn)出了顯著的優(yōu)勢(shì),這些優(yōu)勢(shì)主要源于其強(qiáng)大的計(jì)算能力、深度學(xué)習(xí)算法以及大規(guī)模的數(shù)據(jù)處理能力。以下是對(duì)AI大模型圖像識(shí)別中優(yōu)勢(shì)的介紹: 一、高效性與準(zhǔn)確性 處理速
    的頭像 發(fā)表于 10-23 15:01 ?759次閱讀

    圖像識(shí)別算法都有哪些方法

    圖像識(shí)別算法是計(jì)算機(jī)視覺(jué)領(lǐng)域的核心任務(wù)之一,它涉及到從圖像中提取特征并進(jìn)行分類、識(shí)別和分析的過(guò)程。隨著深度學(xué)習(xí)技術(shù)的不斷發(fā)展,圖像識(shí)別算法已經(jīng)取得了顯著的進(jìn)展。本文將介紹
    的頭像 發(fā)表于 07-16 11:14 ?5706次閱讀

    圖像識(shí)別算法的提升有哪些

    方法。 數(shù)據(jù)增強(qiáng) 數(shù)據(jù)增強(qiáng)是提高圖像識(shí)別算法性能的一種有效方法。通過(guò)對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行變換和擴(kuò)展,可以增加數(shù)據(jù)的多樣性,提高模型的泛化能力。常見(jiàn)的數(shù)據(jù)增強(qiáng)方法包括: 2.1 旋轉(zhuǎn)、縮放、平移和翻轉(zhuǎn) 通過(guò)對(duì)圖像進(jìn)行旋轉(zhuǎn)、縮放
    的頭像 發(fā)表于 07-16 11:12 ?669次閱讀

    圖像識(shí)別算法的優(yōu)缺點(diǎn)有哪些

    圖像識(shí)別算法是一種利用計(jì)算機(jī)視覺(jué)技術(shù)對(duì)圖像進(jìn)行分析和理解的方法,它在許多領(lǐng)域都有廣泛的應(yīng)用,如自動(dòng)駕駛、醫(yī)療診斷、安全監(jiān)控等。然而,圖像識(shí)別算法也存在一些優(yōu)缺點(diǎn)。 一、圖像識(shí)別算法的優(yōu)
    的頭像 發(fā)表于 07-16 11:09 ?1726次閱讀

    圖像識(shí)別技術(shù)包括自然語(yǔ)言處理嗎

    計(jì)算機(jī)視覺(jué)技術(shù)對(duì)圖像進(jìn)行處理、分析和理解,從而實(shí)現(xiàn)對(duì)圖像中的目標(biāo)、場(chǎng)景、行為等信息的識(shí)別和理解。圖像識(shí)別技術(shù)包括圖像預(yù)處理、特征提取、分類器
    的頭像 發(fā)表于 07-16 10:54 ?880次閱讀

    圖像識(shí)別技術(shù)的原理是什么

    圖像識(shí)別技術(shù)是一種利用計(jì)算機(jī)視覺(jué)和機(jī)器學(xué)習(xí)技術(shù)對(duì)圖像進(jìn)行分析和理解的技術(shù)。它可以幫助計(jì)算機(jī)識(shí)別和理解圖像中的對(duì)象、場(chǎng)景和活動(dòng)。 圖像預(yù)處理
    的頭像 發(fā)表于 07-16 10:46 ?1147次閱讀

    圖像識(shí)別屬于人工智能嗎

    屬于。圖像識(shí)別是人工智能(Artificial Intelligence, AI)領(lǐng)域的一個(gè)重要分支。 一、圖像識(shí)別概述 1.1 定義 圖像識(shí)別是指利用計(jì)算機(jī)技術(shù)對(duì)圖像中的內(nèi)容進(jìn)行分析
    的頭像 發(fā)表于 07-16 10:44 ?1184次閱讀

    如何利用CNN實(shí)現(xiàn)圖像識(shí)別

    卷積神經(jīng)網(wǎng)絡(luò)(CNN)是深度學(xué)習(xí)領(lǐng)域中一種特別適用于圖像識(shí)別任務(wù)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。它通過(guò)模擬人類視覺(jué)系統(tǒng)的處理方式,利用卷積、池化等操作,自動(dòng)提取圖像中的特征,進(jìn)而實(shí)現(xiàn)高效的圖像識(shí)別。本
    的頭像 發(fā)表于 07-03 16:16 ?1438次閱讀

    愛(ài)芯元智推出邊端側(cè)智能SoCAX650N,讓視覺(jué)更智能

    當(dāng)前大模型蓬勃發(fā)展,OpenAI的Sora、ChatGPT、CLIPDALL-E,Google的Gemini、ViT-22B,Meta的LLaMA3、DINO v2,
    的頭像 發(fā)表于 05-09 14:39 ?1655次閱讀
    愛(ài)芯元智<b class='flag-5'>推出</b>邊端側(cè)智能SoCAX650N,讓視覺(jué)更智能

    OpenAI推出專用的AI檢測(cè)工具

    OpenAI最近推出了一款全新的AI檢測(cè)工具,這款工具專門(mén)針對(duì)由DALL·E 3模型生成的圖片。令人印象深刻的是,該工具能夠精準(zhǔn)
    的頭像 發(fā)表于 05-09 10:01 ?537次閱讀

    微軟封禁員工討論OpenAI DALL-E 3模型漏洞

    瓊斯去年底在進(jìn)行自主研究時(shí),發(fā)現(xiàn)OpenAI圖像生成模型DALL-E 3存在一個(gè)漏洞,漏洞利用者可以越過(guò)AI保護(hù)墻來(lái)制作色情內(nèi)容。他將此情況報(bào)告給微軟和
    的頭像 發(fā)表于 02-02 14:38 ?594次閱讀

    圖像識(shí)別技術(shù)原理 圖像識(shí)別技術(shù)的應(yīng)用領(lǐng)域

    圖像識(shí)別技術(shù)是一種通過(guò)計(jì)算機(jī)對(duì)圖像進(jìn)行分析和理解的技術(shù)。它借助計(jì)算機(jī)視覺(jué)、模式識(shí)別、人工智能等相關(guān)技術(shù),通過(guò)對(duì)圖像進(jìn)行特征提取和匹配,找出圖像
    的頭像 發(fā)表于 02-02 11:01 ?2559次閱讀

    基于TensorFlow和Keras的圖像識(shí)別

    TensorFlow和Keras最常見(jiàn)的用途之一是圖像識(shí)別/分類。通過(guò)本文,您將了解如何使用Keras達(dá)到這一目的。定義如果您不了解圖像識(shí)別的基本概念,將很難完全理解本文的內(nèi)容。因此在正文開(kāi)始之前
    的頭像 發(fā)表于 01-13 08:27 ?849次閱讀
    基于TensorFlow和Keras的<b class='flag-5'>圖像識(shí)別</b>

    如何使用Python進(jìn)行圖像識(shí)別的自動(dòng)學(xué)習(xí)自動(dòng)訓(xùn)練?

    圖像識(shí)別的自動(dòng)學(xué)習(xí)和自動(dòng)訓(xùn)練。 首先,讓我們了解一下圖像識(shí)別的基本概念。圖像識(shí)別是指通過(guò)計(jì)算機(jī)程序識(shí)別和理解圖像內(nèi)容的過(guò)程。自動(dòng)學(xué)習(xí)和自動(dòng)訓(xùn)
    的頭像 發(fā)表于 01-12 16:06 ?610次閱讀
    主站蜘蛛池模板: 色哟哟tv| 夫妻日本换H视频| 又黄又肉到湿的爽文| 97成人在线| 成人无码精品1区2区3区免费看 | 亚洲人成色777777老人头| 最近中文字幕MV免费高清视频8| 爱情岛论坛网亚洲品质| 国产人妻精品久久久久久很牛| 久久天天综合| 色橹| 一个人HD在线观看免费高清视频| 99热久久久无码国产精品性麻豆| 国产精品国产三级国产AV麻豆| 久久婷婷久久一区二区三区| 日本无码欧美激情在线视频| 亚洲日本一区二区三区在线不卡| CHINA篮球体育飞机2023 | 99九九99九九九视频精品| 国产成人精品免费视频大全可播放的 | 波多结衣一区二区三区| 黑色丝袜美女被网站| 欧美在线激情| 亚洲欧美精品一中文字幕| wwwwwwwww日本电影| 姐姐不~不可以动漫在线观看| 亲胸吻胸添奶头GIF动态图免费 | jizz黑丝| 花蝴蝶在线观看免费中文版高清| 女人张开腿让男人添| 亚洲精品视频久久| 被免费网站在线视频| 精品无码久久久久久动漫| 日韩在线 无码 精品| 中文亚洲大香伊蕉不卡一区| 国产精品99久久久久久AV色戒 | 国产在线精品国自产拍影院午夜| 男助理憋尿PLAY灌尿BL出去| 亚洲视频免费在线观看| 电影果冻传媒在线播放| 乱码AV午夜噜噜噜噜|