色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI讀懂中國,文心方可雕龍

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2022-10-30 21:25 ? 次閱讀

作為中文系學生,記得在學校時候老師叮囑有一本書一定要讀,那就是《文心雕龍》。

《文心雕龍》是由南朝劉勰所作,被魯迅先生認為可以媲美亞里士多德的《詩學》。這部著作之所以寶貴,在于它根據中國文學的發展脈絡,提出了文體、原道等一系列經典理論。甚至在近現代歷史上,還讓“中國沒有自己文學理論”的說法不攻自破。

《文心雕龍》的成功,向我們展示了這樣一種理念:只有懂中國的內容與語言,理解中國獨有的創作技巧、表達意境,才能提出符合中國的理論架構。這一點或許可以從文學推而廣之,在更多與內容創作相關的領域找到依據。

比如最近一段時間,AIGC異常火爆,尤其AI作畫已經破圈到我身邊的每個人都想試試。但在一段時間之后,我們卻會發現大量海外的AI作畫平臺,在最終表達上似乎與中國創作者的需求有些偏差。

這種問題為什么存在?又應該如何解決?

《文心雕龍》千年之后,另一個“文心”躍然而出。百度剛剛發布了文心系列大模型的新作——文心ERNIE-ViLG 2.0。

與其他AI作畫大模型相比,文心ERNIE-ViLG 2.0有兩個顯著的特點。首先在通用的理解能力和清晰度上更進一步,語義理解能力更強,生成的圖像更高清;另外一點就是它能夠更加準確地理解中文表達,也更懂中國文化。讓我們借著這個很有意思、也很獨特的AIGC差異化特質,聊聊文心ERNIE-ViLG 2.0的創新之路。

AI筆觸融華夏,文心依舊可雕龍。

AI作畫全球繁榮,但國人更需要基于語言與文化的理解

AI作畫其實并不是剛剛才興起,但愈發出色的繪畫能力,以及不斷降低的門檻,讓AI作畫在近半年時間風靡全球,從一項“極客玩具” 徹底變成了街談巷議的大眾文化潮流。

AI作畫有多火?這個問題有很多答案,我們可以看到AI作畫的軟件、平臺創業者不斷增多,相關的全球投融資熱度在全球科技產業放緩的局面下一枝獨秀。“AI作畫拿下人類大獎”“AI作畫以假亂真”等消息不斷破圈,主流媒體也在爭相探討AI作畫會不會讓人類畫師感到壓力。

9fe00f9b7e2d446f993d68d287252e8b~tplv-tt-shrink:640:0.image

(ERNIE-ViLG 2.0在中國元素相關概念上創作的圖像:仙鶴、京劇)

在這種全球普遍的繁榮景象下,我們卻會注意到一重潛在的“缺失”,那就是國內外蜂擁而起的AI作畫產品,背后的算法能力主要是來自基于擴散生成算法的DALL-E 2和Stable Diffusion等國外模型。或許有人會認為這并沒有什么問題。當然,我們也非常支持和推崇科技的全球化。但就實際應用而言,國外大模型卻在AI作畫上有著不夠理解中國語言、文化的問題。這就像一個不通中文,也不理解中國文化的外國文學評論家,恐怕也難以寫出媲美《文心雕龍》的文藝理論。

e78a5057270341a1942d404c2420fe9f~tplv-tt-shrink:640:0.image

(ERNIE-ViLG 2.0 創作的圖像示例:令人震撼的科幻插圖杰作,神秘宇宙星辰背景中出現一只巨大的星球, 大場景,無比詳細,明暗對比,32k)

具體到AI作畫中,我們會看到AI作畫的邏輯是根據文字描述生成畫面,而畫作又可能應用到各行業的場景當中。這就暴露出海外AI算法作為基礎存在的問題。比如說:

1.模型不能夠充分理解中文描述,導致生成畫面不夠精細、準確。

2.模型不能理解中國行業與應用場景的主要訴求、想法以及一般規則。這讓AI作畫更多停留在單純的繪畫創作階段,難以融入中國的行業訴求與行業場景。

3.模型不能準確理解中國文化,也就難以創作出針對性的作品。比如讓海外AI模型創作與中國古典意境、節氣、節日相關的畫作,往往會產生巨大偏差。

面對AI作畫基礎模型的空白,文心ERNIE-ViLG 2.0成為了國內首個在這一方向取得突破的工作。更懂中國文化的AI妙筆,已然成為現實。

丹青妙筆,中國心魂:文心ERNIE-ViLG 2.0的多樣化創新

從技術創新的邏輯上看,ERNIE-ViLG 2.0帶來的差異化是多方面的。首先,秉承著百度在文心大模型當中探索的知識增強方向,ERNIE-ViLG 2.0本身在AI作畫的技術能力上帶來了大幅的提升。目前階段,主流AI作畫大模型依舊存在一些亟待解決的問題,其中最顯著的兩點就是語義理解不夠精細,以及圖像不夠清晰。這些問題的存在,依舊限制了用戶對AI作畫的使用上限,尤其阻礙了復雜專業場景與AI作畫的結合。

為此,ERNIE-ViLG 2.0采用了基于知識增強算法的混合降噪專家建模,使其成為全球首個將知識增強與AI作畫相互結合的大模型。同時,ERNIE-ViLG 2.0也是全球參數規模最大的AI作畫大模型。

據了解,ERNIE-ViLG 2.0 在文本生成圖像公開權威評測集 MS-COCO 和人工盲評上均超越了 Stable Diffusion、DALL-E 2等模型,取得了當前該領域的世界最好效果,在語義可控性、圖像清晰度等方面均展現出了顯著優勢。

c0746854d08946c78cb6c5fdb4452592~tplv-tt-shrink:640:0.image

(ERNIE-ViLG 2.0 創作的圖像示例:鳳凰周身火焰,多彩的祥云,明月,cg感)

讓我們具體來看,取得優秀成績的ERNIE-ViLG 2.0是如何解決語義理解與畫面精度兩大通用問題的。

首先,在AI作畫模型的使用中,用戶會特別關注語義表達是否被準確理解的問題,在生成比較復雜、多要素的畫作時尤其如此。為了提升相關能力,ERNIE-ViLG 2.0通過視覺、語言等多源知識指引擴散模型學習,強化文圖生成擴散模型對于語義的精確理解。

基于語言和圖像知識的知識增強算法,提升了ERNIE-ViLG 2.0生成圖像的語義一致性和可控性。百度研究者提出了將知識增強算法融入擴散模型學習的方法,從而在擴散模型學習過程中,引入語言、視覺等多源知識,指引模型更加關注文本和圖像中的核心語義元素,同時針對訓練數據噪聲帶來的訓練圖文樣本語義偏差問題提出了文本語義補全的方法,對圖文的語義一致性進行針對性學習,進而實現精準的細粒度語義控制。

另一方面,用戶對AI生成畫作的精細度的需求也不斷提升。尤其用于行業場景,有明確指向的AI生成畫作,必須保證充分可用的圖像質量。在這個方面,ERNIE-ViLG 2.0首次引入基于時間步的混合降噪專家模型來提升模型建模能力,讓模型在不同的生成階段選擇不同的“降噪專家”網絡,從而實現更加細致的降噪任務建模,進而提升生成圖像的質量。

d59fe38d58c54e308bb7757c1234ef6c~tplv-tt-shrink:640:0.image

(ERNIE-ViLG 2.0 架構圖)

針對模型建模能力不足,導致圖像質量不夠好的問題,百度研究者發現,擴散模型的降噪過程中不同階段對降噪網絡的能力要求不同,初始階段模型需要從純隨機噪聲中生成圖像輪廓,結尾階段對模型的要求變為對圖像細節補全,傳統方法使用同一網絡建模整個降噪過程,模型需要同時滿足不同階段的建模需求。為此,百度提出了針對不同階段選擇不同網絡(降噪專家)進行建模的框架,可以有效解決不同階段對模型能力要求不一致的問題,減少降噪任務的互相干擾。由于每個生成階段只選取一個專家進行生成,實現了在不增加模型預測計算量的情況下對模型建模能力的擴充。

af0c0ac6230d4e488fdbf9931244f26b~tplv-tt-shrink:640:0.image

(ERNIE-ViLG 2.0在中國元素相關概念上創作的圖像:剪紙、鳳凰)

接下來,就要說到我們之前著重討論AI作畫對中文、中國文化的理解問題。這個領域的能力提升訣竅,在于模型訓練需要結合海量的中文圖文數據。而對于海外科技公司與算法開發者來說,這樣的數據儲備難度太大、耗時太長,并且也缺乏足夠的市場動力。而百度則在這一領域具有先天的優勢。從搜索到AI,再到深度學習框架、能力與大模型的不斷建設,中文圖文數據都是百度AI發展的必選項和基礎項。于是,百度研究者構建了近2億規模的高質量中文圖文數據對,基于知識增強的混合降噪專家建模,從而使得ERNIE-ViLG 2.0具備了強大的中文語義理解能力。

最終我們可以發現,ERNIE-ViLG 2.0具有非常精準的中文理解能力,同時也對中國文化、中國元素有了充分的吸收。我們可以通過ERNIE-ViLG 2.0得到非常具有中國風、中國文化意境的畫作。而這在其他模型中是很難實現的。

一幅山水寫文心,千行百業盡雕龍

對于廣大AI作畫的用戶與潛在用戶來說,最關注的事情莫過于文心ERNIE-ViLG 2.0的使用情況與使用前景。

在今天,我們可以看到AI作畫正處在高速發展的黃金階段。相信不久之后這項能力就會成為我們日常獲得圖像內容的基礎選項,完全融入我們的生活與工作。而在這種趨勢下,ERNIE-ViLG 2.0投入產業空間,服務千行百業的節奏也是非常快的。

在今年8月,ERNIE-ViLG 2.0模型就通過API服務的方式對外開放。一經上線,就受到了廣大開發者和愛好者的關注。尤其值得注意的是,很多國外的開發者、AI作畫用戶都對ERNIE-ViLG 2.0給出了非常高的評價。認為其效果遠遠超過目前其他的AI作畫模型。甚至有國外網友感嘆“最先進的 AI 動畫生成技術在中國”。這又一次證明了,民族的也就是世界的。

79c29c8e6f854b36bf29dd528f65f3f9~tplv-tt-shrink:640:0.image

(ERNIE-ViLG 2.0 創作的圖像示例:srudio ghibli風格,一個巨大的圓月、超現實的超自然村莊,抽象的生物形態建筑、白色,金色)

目前階段,AI作畫相關的軟件、平臺高速發展,開發者非常需要具有足夠強大能力的基礎模型。而ERNIE-ViLG 2.0已經為廣大開發者、科技愛好者提供了飛槳開源工具和API服務能力,滿足開發者靈活探索等需求。對靈活性需求更高的開發者,可以使用飛槳的開源工具PaddleHub基于文圖生成開源算法極簡開發,并完成模型的管理和一鍵預測。對便捷性需求更高的開發者,可以使用文心ERNIE-ViLG API,極速獲得沉浸式文圖生成大模型的技術體驗,更可靈活方便、高效地實現產品集成。

同時,對于更多需要AI作畫能力的普通用戶來說,百度已經推出了基于ERNIE-ViLG 2.0大模型的AI 作畫產品—— AI藝術與創意輔助平臺:文心一格。目前,文心一格已經成為了我們團隊小伙伴在圖像內容創作方面的“輔助神器”。

d5a25d70a7d64cea80f2da4fca4453b1~tplv-tt-shrink:640:0.image

(ERNIE-ViLG 2.0在中國元素相關概念上創作的圖像:青花瓷、建筑)

緊接著,我們可以看到ERNIE-ViLG 2.0的價值不僅僅停留在目前我們可以看到的AI作畫體驗。它更廣闊的價值在于千行百業的圖像內容生成需求與整體數字化進展。在很多行業,圖像設計和創作的價值都非常重要,比如工業設計、動漫設計、游戲制作、服裝設計等等。ERNIE-ViLG 2.0的未來發展空間,在于與各行業的設計需求、圖像升級需求相結合,成為輔助創作的效率助推器,提升相關行業的數字化、智能化水平。

隨著AI作畫的連續破圈,我們可以看到AIGC的新紀元正在開啟。這次突破一方面證明了AI技術本身具有連綿不絕的價值潛力,同時也展示了AI技術關鍵能力自主、自立、自強的必要性。

從這個角度看,ERNIE-ViLG 2.0作為文心大模型家族的新成員,既走在潮流前沿,也走在中國智能化的大道上。

AI妙筆,正在寫一部新時代的“文心雕龍”。

審核編輯 黃昊宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    31402

    瀏覽量

    269814
收藏 人收藏

    評論

    相關推薦

    大模型生態大會:啟明智顯AI智能產品展現AI無限“模力”

    12月26日,在人工智能蓬勃發展的浪潮中,以“模力無限星河共創”為主題的大模型生態大會在上海·張江科學會堂盛大舉行。啟明智顯AI筆筒、AI潮玩底座、
    的頭像 發表于 12-26 18:33 ?402次閱讀
    <b class='flag-5'>文</b><b class='flag-5'>心</b>大模型生態大會:啟明智顯<b class='flag-5'>AI</b>智能產品展現<b class='flag-5'>AI</b>無限“模力”

    模力無限,星河共創:啟明云端與您共赴大模型生態大會

    力無限星河共創”為主題,匯聚了行業AI專家、知名高校學者、全球頂尖開發者,共同探討AI行業的發展、前沿技術與應用、人才培養,以及AI生態的新實踐。啟明云端作為
    的頭像 發表于 12-24 18:01 ?833次閱讀
    模力無限,星河共創:啟明云端與您共赴<b class='flag-5'>文</b><b class='flag-5'>心</b>大模型生態大會

    一言登頂中國生成式AI使用率榜首

    人工智能產品的用戶規模已達到2.3億人,占整體人口的16.4%。這一數據表明,生成式人工智能產品在網民中已經形成了相當規模的用戶群體,并且未來仍有顯著的增長空間。 在激烈的市場競爭中,百度一言憑借其卓越的性能和廣泛的應用場景,成功脫穎而出
    的頭像 發表于 12-04 14:03 ?397次閱讀

    讀懂單燈控制器工作原理

    讀懂單燈控制器工作原理
    的頭像 發表于 11-11 13:13 ?322次閱讀
    一<b class='flag-5'>文</b><b class='flag-5'>讀懂</b>單燈控制器工作原理

    讀懂MSA(測量系統分析)

    讀懂MSA(測量系統分析)
    的頭像 發表于 11-01 11:08 ?1048次閱讀
    一<b class='flag-5'>文</b><b class='flag-5'>讀懂</b>MSA(測量系統分析)

    讀懂新能源汽車的功能安全

    電子發燒友網站提供《一讀懂新能源汽車的功能安全.pdf》資料免費下載
    發表于 09-04 09:22 ?3次下載

    百度大模型4.0免費了 百度心智能體平臺免費開放大模型4.0

    據悉;7月5日起 百度心智能體平臺(AgentBuilder) 免費開放大模型4.0。 開發者在心智能體平臺上制作智能體時; 可靈活選擇
    的頭像 發表于 07-06 17:12 ?1264次閱讀

    百度發布智能代碼助手“快碼”

    在近日舉辦的WAVE SUMMIT大會上,百度公司震撼發布了全新的智能代碼助手——“快碼”。這款基于百度大模型的強大工具,結合了海量的編程數據,旨在為開發者提供一站式的代碼智能
    的頭像 發表于 07-01 11:20 ?941次閱讀

    百度發布大模型4.0 Turbo與飛槳框架3.0,引領AI技術新篇章

    SUMMIT深度學習開發者大會2024上,向世界展示了百度在AI領域的最新成果——大模型4.0 Turbo和飛槳框架3.0,并詳細披露了飛槳
    的頭像 發表于 06-29 16:03 ?683次閱讀

    百度大模型4.0 Turbo,正式發布 用戶規模已達3億

    一言累計用戶規模已達3億,日調用次數也達到了5億。”6月28日,百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰在WAVE SUMMIT深度學習開發者大會2024上宣布了
    的頭像 發表于 06-29 10:06 ?899次閱讀

    百度大模型擴展合作領域

    百度創始人兼CEO李彥宏在2024年第一季度財報電話會上宣布,大模型API在繼與中國三星、榮耀成功合作后,本季度再度實現重要突破。小米、OPPO、vivo等主流手機廠商已全面接入
    的頭像 發表于 05-17 11:17 ?610次閱讀

    全進化,開發者赴星河

    筑基,星河璀璨
    的頭像 發表于 04-16 21:02 ?1276次閱讀
    <b class='flag-5'>文</b><b class='flag-5'>心</b>全進化,開發者赴星河

    百度一言用戶破2億,AI原生應用開發數量達19萬

    此外,李彥宏還提到,百度在去年 8 月宣布開放一言后,不僅在C端借助大模型改造用戶產品,將AI功能融入旗下多款產品;同時在B端,通過云業務推出企業級一站式大模型平臺——千帆大模型平臺。
    的頭像 發表于 04-16 15:05 ?659次閱讀

    優必選宣布人形機器人Walker S接入百度大模型

    優必選宣布人形機器人Walker S接入百度大模型,共同探索中國AI大模型+人形機器人的應用。
    的頭像 發表于 04-07 10:17 ?947次閱讀

    三星Galaxy AI集成百度大模型

    近日,中國三星與百度智能云宣布正式結成AI生態戰略合作伙伴,共同推動AI技術在智能手機等設備上的應用。作為這一合作的一部分,三星Galaxy AI深度集成了百度
    的頭像 發表于 01-29 17:03 ?1284次閱讀
    主站蜘蛛池模板: 99视频精品全部免费 在线| 麻豆第一区MV免费观看网站| 被黑人做的白浆直流| 久久免费视频| 野花视频在线观看免费| 狠狠色综合久久丁香婷婷| 天天狠狠弄夜夜狠狠躁·太爽了| 本庄优花aⅴ全部在线影片| 琪琪伦伦影院理论片| zooskoo1videos人与狗| 拍戏被CAO翻了H| 出租屋自拍贵在真实15P| 日本艳妓BBW高潮一19| 动漫成年美女黄漫网站| 偷拍亚洲色自拍| 国产九九熟女在线视频| 亚洲不卡高清免v无码屋| 国产在线精品亚洲二品区| 亚洲精品久久区二区三区蜜桃臀| 国产在线观看91精品| 伊人热| 理论片午午伦夜理片I| 99精品亚洲| 日韩一区二区三区精品| 国产精品国产三级国产AV麻豆| 无码射肉在线播放视频| 狠狠插狠狠干| 40岁东北老阿姨无码| 欧美在线视频一区| 国产精品久久免费视频 | 国产精品资源在线观看网站| 羞羞漫画免费漫画页面在线看漫画秋蝉 | 日韩一区二区在线免费观看| 国产成人综合网在线观看| 亚洲刺激视频| 毛片免费在线| 大地影院在线播放| 亚洲理论片在线中文字幕| 美女大BXXXXN内射| 国产成人精品久久久久婷婷| 一本之道高清www在线观看|