Sora爆紅，多模態大模型是下一發展階段

“大語言模型為 AI 產業帶來新的生機，然而語言模型的應用場景有限。要全面打開生成式 AI 的想象力，還是要依托多模態大模型。”IDC 中國研究總監盧言霞近日表示。Sora在文生視頻領域真正邁出了第一步，真正做到生成式 AI 驅動生成短視頻。接下來也將刺激其他科技巨頭加快在該領域的技術攻關力度以及產品發布速度。

哪些公司有潛力快速推出類似產品呢？根據盧言霞的判斷，幾個最有潛力的群體包括，在大模型以及 AI 領域投入最為領先的科技巨頭，如 BAT、科大訊飛等；在計算機視覺領域擁有深厚積累的公司，比如商湯、海康一類的公司；以及短視頻類公司；更可大膽想象，也或許會培訓出多模態大模型的全新創企。

多模態大模型將率先在短視頻、廣告、互娛、影視、媒體等領域采用，輔助人類員工生成視頻，既可以提高生產速度又可以提高生產數量，還可以創造全新的視覺感受，能夠幫助企業真正實現降本增效、提升用戶體驗。

根據預測，未來 5 年，生成式 AI 生成的文本類文件、圖像類文件、視頻類文件、軟件代碼類文件數量將會越來越平均。而這其中，與圖像文件相關的數據量可能是文本文件的 100 倍，視頻文件是圖像文件的 10 倍。整體來看，由于 GenAI 的采用和使用日益增多，近期和遠期所創建數據的增長速度都將快于近幾年。

盧言霞指出，多模態大模型行業發展的挑戰在于：

? 高質量數據的稀缺：圖像、視頻類數據掌握在少數公司手中。這些數據也需要標注，甚至重新采集，才能用于大模型的訓練。
? 多模態大模型對算力的消耗更高，算力的可獲取性以及成本將是挑戰之一。
? 頂尖的大模型研發人才，也是行業發展的稀缺資源。

此外，多模態大模型將帶來更嚴峻的安全方面的挑戰。一方面多模態大模型將讀取更多的圖像、視頻類數據，這些圖像視頻數據是否合規是否安全，需要得到保障；另一方面，生成的視頻與真實世界之間的差異，是否會影響到人身安全、社會穩定、企業安全等，也需要注意。

當前 Sora 生成的是1分鐘的視頻，對于行業已經是重大突破，何時能生成2分鐘、5分鐘以上的視頻還未知，無論如何多模態大模型的應用都將是顛覆性的。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

商湯日日新多模態大模型權威評測第一

剛剛，商湯科技日日新SenseNova多模態大模型，在權威綜合評測權威平臺OpenCompass的多模態評測中取得榜單第

發表于 12-20 10:39 ?306次閱讀

成都匯陽投資關于Sora 正式上線，多模態模型的里程碑

? 事?件 ?12月10日,OpenAl正式上線?Sora,并向包括美國在內的多數國家用戶開放,用戶可在OpenAI官網上體驗Sora。同時,Sora?被包含在ChatGPT?Plus

發表于 12-16 14:39 ?241次閱讀

一文理解多模態大語言模型——下

/understanding-multimodal-llms ? 《一文理解多模態大語言模型 - 上》介紹了什么是多

發表于 12-03 15:18 ?187次閱讀

<b class='flag-5'>一</b>文理解<b class='flag-5'>多</b><b class='flag-5'>模態</b>大語言<b class='flag-5'>模型</b>——下

一文理解多模態大語言模型——上

/understanding-multimodal-llms 在過去幾個月中， OpenVINO? 架構師 Yury閱讀了眾多有關多模態大語言模型的論文和博客，在此基礎上，推薦了一篇解

發表于 12-02 18:29 ?423次閱讀

<b class='flag-5'>一</b>文理解<b class='flag-5'>多</b><b class='flag-5'>模態</b>大語言<b class='flag-5'>模型</b>——上

利用OpenVINO部署Qwen2多模態模型

多模態大模型的核心思想是將不同媒體數據（如文本、圖像、音頻和視頻等）進行融合，通過學習不同模態之間的關聯，實現更加智能化的信息處理。簡單來說，多

發表于 10-18 09:39 ?515次閱讀

蘋果發布300億參數多模態AI大模型MM1.5

蘋果近日推出了全新的多模態AI大模型MM1.5，該模型擁有高達300億的參數規模，是在前代MM1架構的基礎上進一步

發表于 10-14 15:50 ?304次閱讀

依圖多模態大模型伙伴CTO精研班圓滿舉辦

大模型在不同行業領域的應用前景;7月19日， “依圖科技多模態大模型伙伴CTO精研班”在杭州圓滿舉辦，讓更多的伙伴們深度體驗了依圖多

發表于 07-23 15:16 ?449次閱讀

Sora還在PPT階段，“中國版Sora”已經開放使用了！

電子發燒友網報道（文/梁浩斌）今年春節期間，OpenAI的AI文字生成視頻模型Sora驚艷全世界，極高的視頻生成效果、長達60秒的視頻生成長度，讓過去Pika Labs推出的Pika 1.0、去年

發表于 06-17 09:07 ?3466次閱讀

Sora短期不會向公眾開放還處于反饋獲取階段

Sora短期不會向公眾開放還處于反饋獲取階段據外媒報道Sora核心團隊在一次采訪中透露，Sora短期不會向公眾開放，

發表于 03-14 14:55 ?697次閱讀

sora模型中國可以使用嗎 sora模型是哪個公司

。 Sora是一種擴散模型，具備從噪聲中生成完整視頻的能力，它生成的視頻一開始看起來像靜態噪音，通過多個步驟逐漸去除噪聲后，視頻也從最初的隨機像素轉化為清晰的圖像場景，其能夠

發表于 02-22 16:52 ?3384次閱讀

sora模型上市公司 sora模型對現實的影響

sora模型的上市公司目前沒有相關官方的報道，因此無法給出準確的回答。 Sora能夠獲取現有視頻并對其進行擴展或填充缺失的幀，這一功能在視頻編輯、電影特效等領域具有應用前景，可以幫助用

發表于 02-22 16:46 ?1147次閱讀

sora模型怎么使用 sora模型對現實的影響

美國當地時間2024年2月15日，OpenAI正式發布文生視頻模型Sora ，并發布了48個文生視頻案例和技術報告，正式入局視頻生成領域。Sora能夠根據提示詞生成60s的連貫視頻，“碾壓”了

發表于 02-22 16:42 ?1210次閱讀

字節跳動辟謠推出中文版Sora 期待國產Sora大模型

有推出“中文版sora” 有字節跳動相關人士透露Boximator是視頻生成領域控制對象運動的技術方法研究項目，Boximator確實可以通過文本精準控制生成視頻中人物或物體的動作；但是目前還不能作為一個完善的產品直接落地。但是雖然說Boximator

發表于 02-21 17:29 ?883次閱讀

奧特曼發布王炸模型Sora OpenAI首個文生視頻模型Sora正式亮相

奧特曼發布王炸模型Sora OpenAI首個文生視頻模型Sora正式亮相 2月16日凌晨OpenAI的首個文生視頻模型

發表于 02-18 17:41 ?1019次閱讀

OpenAI推出新款大模型Sora，引領多模態AI新潮流

全球人工智能領域的佼佼者OpenAI近日發布了一款名為Sora的短視頻生成模型，該模型能夠根據文字指令即時生成高質量短視頻，引起了業界的廣泛關注。

發表于 02-18 10:16 ?1387次閱讀

精選推薦
更多

文章

資料

帖子

德州儀器隔離式交流電壓檢測器件的應用示例

德州儀器
9小時前

229 閱讀

井芯微電子WENOS-PROTO協議簇軟件詳解

井芯微電子
11小時前

216 閱讀

迅為RK3568開發板驅動指南Linux中通用SPI設備驅動

北京迅為電子
16小時前

280 閱讀

功率半導體器件的雙脈沖測試方案

泰克科技
1天前

378 閱讀

國產AI卷翻硅谷，奧特曼發文“陰陽”，類o1模型都在卷什么？

腦極體
1天前

697 閱讀

Agilent Technologies 85052D 3.

賈桂林
887

5積分

21下載

FPGA_SOPC快速開發教程

fanB
1050

10積分

73下載

hi3515海思原版原理圖

1125632
494 KB

免費

0下載

Verilog數字系統設計

leixiaodong007
22 MB

免費

0下載

OpenMQTTGateway MQTT網關

凌章致
16.26 MB

免費

18下載

PI公司驅動器，使用時有響聲正常嗎？

Akyoou
1天前

263 閱讀

關于cypress 3014輸出rgb24圖像

jf_73571444
1天前

280 閱讀

【RA-Eco-RA2L1-48PIN-V1.0開發板試用】——使用RTC實現萬年歷年月日時分秒

jf_43382582
1天前

181 閱讀

【RA-Eco-RA2L1-48PIN-V1.0開發板試用】——使用串口輸出打印printf實現

jf_43382582
1天前

203 閱讀

嵌入式學習-飛凌嵌入式ElfBoard ELF 1板卡-移植前準備之git管理內核源碼

jf_13411809
1天前

383 閱讀

推薦專欄
更多

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

Sora爆紅，多模態大模型是下一發展階段

評論

商湯日日新多模態大模型權威評測第一

成都匯陽投資關于Sora 正式上線，多模態模型的里程碑

一文理解多模態大語言模型——下

一文理解多模態大語言模型——上

利用OpenVINO部署Qwen2多模態模型

蘋果發布300億參數多模態AI大模型MM1.5

依圖多模態大模型伙伴CTO精研班圓滿舉辦

Sora還在PPT階段，“中國版Sora”已經開放使用了！

Sora短期不會向公眾開放還處于反饋獲取階段

sora模型中國可以使用嗎 sora模型是哪個公司

sora模型上市公司 sora模型對現實的影響

sora模型怎么使用 sora模型對現實的影響

字節跳動辟謠推出中文版Sora 期待國產Sora大模型

奧特曼發布王炸模型Sora OpenAI首個文生視頻模型Sora正式亮相

OpenAI推出新款大模型Sora，引領多模態AI新潮流