亚洲国语,中文字幕波多野结衣,亚洲综合在线播放

電子發燒友網報道（文/李彎彎）日前，阿里云宣布通義實驗室研發的視頻生成模型EMO正式上線通義App，免費對所有人開放。借助這一功能，用戶可以在歌曲、熱梗、表情包中任選一款模板，然后通過上傳一張肖像照片就能讓 EMO 合成演戲唱歌視頻。

阿里云在視頻生成領域的創新

EMO（Emote Portrait Alive）是一個由阿里巴巴集團智能計算研究院開發的框架，一個音頻驅動的 AI 肖像視頻生成系統，能夠通過輸入單一的參考圖像和語音音頻，生成具有表現力的面部表情和各種頭部姿勢的視頻。

據介紹，通義 App 首批上線了80多個 EMO 模板，包括熱門歌曲《上春山》《野狼 Disco》等，還有網絡熱梗“缽缽雞”“回手掏”等。EMO自2月底公布模型論文以來，在海內外引發廣泛關注，并與OpenAI的Sora模型相提并論。

具體來看，EMO的功能包括，音頻驅動的視頻生成，通過輸入一段音頻（如語音、歌曲等）和一張參考圖片（通常是人物的肖像），就能生成一個動態的、與音頻內容同步的視頻。

阿里EMO使用先進的音視頻擴散模型和注意力機制，能夠生成具有高度真實感和豐富表現力的肖像視頻。肖像的表情和動作會非常自然和流暢，與音頻內容緊密同步。

阿里EMO的應用場景非常廣泛。它不僅可以用于娛樂和創作領域，如讓歷史人物“復活”、為電影角色配音等，還可以用于教育、廣告、游戲等多個領域，為用戶提供更多樣化、個性化的視頻內容。

另外，阿里EMO采用高效的算法和計算框架，能夠在較短的時間內生成高質量的肖像視頻。這為用戶節省了大量的時間成本，提高了工作效率。

阿里EMO的框架還具有良好的可擴展性和靈活性，可以根據用戶的具體需求進行定制和優化。例如，可以通過調整參數或添加新的模型組件來優化生成視頻的質量和性能。

阿里在視頻生成領域做過非常多創新，此前還推出過VideoComposer，這是一個結合了空間條件和時序條件的視頻生成框架。它利用單張圖像或草圖作為空間條件，同時結合運動矢量和深度序列等時序條件，來生成具有高度視覺逼真度的視頻。

阿里云還發布了AtomoVideo模型，這是一種能夠從單一靜態圖像生成高保真視頻序列的技術。它結合了個性化文本到圖像（T2I）模型，能夠根據文字描述和靜態圖片生成符合描述的視頻內容。

此外，阿里云視覺智能開放平臺提供了豐富的視頻生產能力，包括視頻摘要、視頻編輯、視頻人臉融合等功能。這些功能可以應用于電商、影視、廣告等多個領域，幫助用戶快速生成高質量的視頻內容。

視頻生成使用到的AI技術和算法

視頻生成是一個涉及多個步驟和技術的過程，目前國內外有多款視頻生成工具，如Pixverse、Pika、Runway Gen-2、Kaiber、Plaiday、Genmo等。其中，Pika因其高質量和穩定的畫面生成能力而受到用戶好評，Runway Gen-2則可以將midjourney生成的圖像轉換為高質量動畫。另外，Sora作為一款新興的視頻生成工具，其獨特之處在于能夠生成高質量的長視頻內容，并理解長文本指令以生成詳盡細節的視頻內容。

從算法的角度來看，視頻生成涉及到一些基本的算法和技術。例如，循環神經網絡（RNN）中的GRU和LSTM可以有效避免梯度下降和衰減的問題，而encoder-decoder架構則使得機器翻譯等任務的效果大幅提升。在視頻生成領域，這些算法和技術可能用于生成視頻的內容、結構、風格等方面。

視頻生成采用了相當多的技術，包括深度學習模型，這是視頻生成中最為關鍵的技術之一。深度學習模型，特別是生成對抗網絡（GANs）和變分自編碼器（VAEs），被廣泛應用于視頻生成中。這些模型能夠學習并模仿視頻數據的分布，從而生成新的、與原始數據相似的視頻。

計算機圖形學，它在視頻生成中扮演著重要角色，特別是在創建虛擬場景、角色和特效時。通過計算機圖形學技術，可以生成逼真的虛擬場景和角色，并將其與真實視頻相結合，創造出獨特的視覺效果。

物理模擬，為了生成更逼真的視頻，物理模擬技術被用來模擬物體的運動和交互。這包括模擬物體的運動軌跡、碰撞效果、光影變化等，以使得生成的視頻更加真實可信。

自然語言處理，隨著技術的發展，自然語言處理（NLP）也被應用于視頻生成中。通過解析文本描述，NLP技術可以指導視頻生成模型生成與文本內容相匹配的視頻。這為視頻生成提供了更多的創意和可能性。

還有音頻合成技術，除了視覺元素外，音頻也是視頻的重要組成部分。音頻合成技術可以生成與視頻內容相匹配的音效和背景音樂，從而提升視頻的觀看體驗。此外，還有一些其他的技術也被用于視頻生成中，如增強學習、遷移學習等。這些技術使得視頻生成更加靈活、高效和多樣化。

寫在最后

經過近些年的發展，視頻生成技術也逐漸成熟，并且在新聞報道、廣告制作、教育培訓、電影與游戲制作、醫療健康等領域有不少實際的應用案例。未來，娛樂與媒體、廣告與營銷、教育培訓、虛擬現實/增強現實、醫療健康等都將會成為視頻生成技術的主流應用。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

算法

算法

+關注

關注
23

文章
4613

瀏覽量
92941
AI

AI

+關注

關注
87

文章
30932

瀏覽量
269181
阿里云

阿里云

+關注

關注
3

文章
956

瀏覽量
43054

OpenAI推出AI視頻生成模型Sora

近日，備受期待的OpenAI再次推出了其創新之作——AI視頻生成模型Sora。這一新品的發布，無疑為AI技術注入了新的活力。據悉，Sora

發表于 12-12 09:40 ?199次閱讀

OpenAI開放Sora視頻生成模型

OpenAI近日宣布，其傾力打造的人工智能視頻生成系統Sora已正式向美國及其他市場的ChatGPT Plus訂閱用戶開放。自去年首次公開預覽以來，Sora歷經約10個月的精心研發與優化，現已全面

發表于 12-10 11:16 ?332次閱讀

字節跳動自研視頻生成模型Seaweed開放

近日，字節跳動旗下的AI內容平臺即夢AI傳來新消息，宣布自研的視頻生成模型Seaweed即日起正式面向平臺用戶開放使用。這一舉措標志著字節跳動在AI

發表于 11-11 14:31 ?254次閱讀

今日看點丨Vishay裁員800人，關閉上海等三家工廠；字節跳動發布兩款視頻生成大模型

企業市場開啟邀測。 ? 火山引擎介紹，豆包視頻生成模型基于DiT架構，通過高效的DiT融合計算單元，能更充分地壓縮編碼視頻與文本，讓視頻在大動態與運鏡中自由切換，擁有變焦、環繞、平搖、縮放、目標跟隨等多鏡頭語言能力。此外，豆包

發表于 09-25 15:48 ?751次閱讀

火山引擎推出豆包·視頻生成模型

在近期舉辦的2024火山引擎AI創新巡展上，火山引擎總裁譚待隆重推出了豆包·視頻生成模型，這一舉措標志著火山引擎在視頻內容生成領域邁出了重要

發表于 09-25 14:11 ?305次閱讀

阿里通義將發布視頻生成大模型

在即將召開的云棲大會上，阿里通義將震撼發布其自主研發的視頻生成大模型。目前，用戶已可通過通義App頻道及通義萬相PC端預約體驗這一創新功能，盡管具體使用尚未開放。

發表于 09-19 17:01 ?348次閱讀

阿里首推AI視頻生成利器Tora:指尖畫圈,自由操控物體運動軌跡

近日，阿里巴巴團隊震撼發布了一項革命性的創新成果——Tora，一個前所未有的AI視頻生成框架。Tora深度融合了文本、視覺與軌跡條件，依托其獨創的軌跡導向擴散變換器（DiT）

發表于 08-06 16:41 ?824次閱讀

MediaTek與快手攜手創新，端側視頻生成技術引領AI新紀元

在科技日新月異的今天，MediaTek與快手再次攜手，于近日宣布了一項重大技術突破——高效端側視頻生成技術的誕生。這項技術不僅是對即將于2024年世界移動通信大會（MWC 2024）上

發表于 07-05 11:52 ?1016次閱讀

MediaTek聯合快手推出高效端側視頻生成技術

MediaTek 與快手共同宣布，推出高效端側視頻生成技術，共同探索并推進生成式 AI 技術的革新。作為對 2024 世界移動通信大會（MW

發表于 07-05 11:23 ?4788次閱讀

新火種AI|圍攻光明頂：Sora效應下的AI視頻生成競賽

Sora的出現，讓AI視頻生成領域真正“活”了起來

發表于 03-16 11:12 ?643次閱讀

除了刷屏的Sora，國內外還有哪些AI視頻生成工具

。Sora的發布也讓AI生成視頻有了突破性進展。 ? 過去一年多，全球科技公司都在發布各種大模型，然而AI生成內容更多集中在文本和圖片方面，

發表于 02-26 08:42 ?4413次閱讀

openai發布首個視頻生成模型sora

美國當地時間2024年2月15日，OpenAI正式發布文生視頻模型Sora ，并發布了48個文生視頻案例和技術報告，正式入局視頻生成領域。Sora能夠根據提示詞

發表于 02-21 16:45 ?1271次閱讀

AI視頻年大爆發！2023年AI視頻生成領域的現狀全盤點

2023年，也是AI視頻元年。過去一年究竟有哪些爆款應用誕生，未來視頻生成領域面臨的難題還有哪些？

發表于 02-20 10:40 ?1252次閱讀

OpenAI發布文生視頻模型Sora，引領AI視頻生成新紀元

在人工智能(AI)領域掀起新一輪革命浪潮的，正是OpenAI最新推出的文生視頻大模型——Sora。這款被業界廣泛贊譽的模型，以其“逼真”和“富有想象力”的視頻生成能力，徹底顛覆了傳統視頻生成

發表于 02-19 11:03 ?961次閱讀

OpenAI發布首個視頻生成模型Sora

OpenAI近日宣布推出其全新的文本到視頻生成模型——Sora。這一突破性的技術將視頻創作帶入了一個全新的紀元，為用戶提供了前所未有的創作可能性。

發表于 02-18 10:07 ?1068次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

阿里云視頻生成技術創新！視頻生成使用了哪些AI技術和算法

評論

OpenAI推出AI視頻生成模型Sora

OpenAI開放Sora視頻生成模型

字節跳動自研視頻生成模型Seaweed開放

今日看點丨Vishay裁員800人，關閉上海等三家工廠；字節跳動發布兩款視頻生成大模型

火山引擎推出豆包·視頻生成模型

阿里通義將發布視頻生成大模型

阿里首推AI視頻生成利器Tora:指尖畫圈,自由操控物體運動軌跡

MediaTek與快手攜手創新，端側視頻生成技術引領AI新紀元

MediaTek聯合快手推出高效端側視頻生成技術

新火種AI|圍攻光明頂：Sora效應下的AI視頻生成競賽

除了刷屏的Sora，國內外還有哪些AI視頻生成工具

openai發布首個視頻生成模型sora

AI視頻年大爆發！2023年AI視頻生成領域的現狀全盤點

OpenAI發布文生視頻模型Sora，引領AI視頻生成新紀元

OpenAI發布首個視頻生成模型Sora