色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

PPTAgent: 大模型驅動的PPT自動生成

中科院軟件所中文信息處理實驗室 ? 來源:中科院軟件所中文信息處 ? 2025-01-21 10:24 ? 次閱讀

論文題目

PPTAgent: Generating and Evaluating Presentations Beyond Text-to-Slides

論文鏈接

https://arxiv.org/abs/2501.03936

項目倉庫

https://github.com/icip-cas/PPTAgent

演示視頻

在數字化時代,演示文稿(PPT)作為信息傳遞的重要媒介,其自動化生成需求愈發迫切。然而,一份優秀的演示文稿不僅需要引人入勝的故事線,還需要抓人眼球的視覺效果和內容的有效組織,這對創作者提出了極高的要求。針對這一挑戰,中國科學院軟件研究所中文信息處理實驗室提出了一種突破性的演示文稿自動生成框架 PPTAgent。

不同于傳統的端到端生成方法,PPTAgent 借鑒了人類創作 PPT 的過程,采用基于編輯的工作流程。正如經驗豐富的演講者往往會參考優秀的演示文稿來優化自己的作品,PPTAgent 也通過分析和編輯參考演示文稿來生成新的內容。

PPTAgent 設計的框架包含兩個關鍵階段:首先是“演示文稿分析”階段,系統會深入分析作為參考的演示文稿,提取每張幻燈片的語義信息。隨后在“演示文稿生成”階段,系統首先會基于文檔內容生成詳細的演示大綱,并為每張幻燈片分配合適的參考模板及相關文檔段落。對于待生成的每張幻燈片,PPTAgent 能夠根據輸入內容自動調整幻燈片參考模板中的文本和視覺元素,通過生成的代碼指令來完成元素的創建、編輯和刪除等操作。通過這種方式,PPTAgent 不僅確保了生成內容的連貫性,還保持了視覺設計的美觀度。

同時,我們還提出了首個全面的演示文稿評估框架 PPTEval,從內容、設計和結構連貫性三個維度評估演示文稿的質量,為自動化生成技術的改進提供了細粒度的反饋。實驗結果表明,PPTAgent 能夠生成高質量的演示文稿,在 PPTEval 的評估中取得了 3.67 的平均得分,并在來自不同領域的實驗數據上展現出了 97.8%的任務成功率。

PPTAgent

ef57fafa-d63c-11ef-9310-92fbcf53809c.png

階段一:演示文稿分析 在這個階段,PPTAgent 首先對參考演示文稿進行全面分析以提取其中包含的語義信息。具體來說:

根據功能將幻燈片分為兩大類:支持演示結構的幻燈片(如開場頁)和傳遞具體內容的幻燈片(如要點頁)。針對不同類型,PPTAgent 采用基于圖片相似度或大語言模型的方法對參考演示文稿中的幻燈片進行聚類,并利用大語言模型的上下文感知能力對該頁的功能進行描述。

考慮到現實世界中幻燈片內容的復雜性和碎片性,我們利用大語言模型進一步地提取幻燈片的內容模式(schema),包括幻燈片元素的類別、形式和具體內容。這些信息為后續的編輯過程提供了重要指導。

階段二:演示文稿生成

在生成階段,我們采用了基于編輯的生成范式,具體流程包括:

首先根據上一階段分析得到的幻燈片語義信息和輸入文檔生成結構化大綱,為新演示文稿中的每張幻燈片指定參考模板和輸入文檔中的相關內容。

基于我們設計的 API 接口,生成可執行的代碼指令來對幻燈片中的元素進行編輯修改。此外,我們還引入了實時的錯誤反饋機制,系統能夠根據執行過程中的錯誤反饋進行自我糾正,顯著提高了生成的穩定性。

PPTEval:基于 LLM-as-a-Judge 范式的幻燈片質量評估

此外,為了能夠有效和全面地評估生成幻燈片的質量,我們還開發了 PPTEval 評估框架,利用大語言模型來從三個維度對演示文稿進行全面評估:

內容(Content):評估幻燈片中文本和圖像的相關度、文本內容信息量和質量,確保傳達的信息簡潔、準確且具備實用性。

設計(Design):關注幻燈片的色彩搭配、視覺元素的使用和整體設計的專業性,確保視覺呈現和內容相輔相成。

連貫性(Coherence):評估幻燈片的邏輯結構和上下文信息的完整性,確保內容流暢且符合邏輯,觀眾易于理解。

ef81e6d0-d63c-11ef-9310-92fbcf53809c.png

實驗

數據集

為了全面評估 PPTAgent 的性能,我們首先構建了一個包含 10,448 份多領域演示文稿的數據集 Zenodo10K,這也是目前已知最大的幻燈片數據集。在此基礎上,我們在三個常用的大語言模型:GPT-4o、Qwen2.5-72B(Qwen2.5)和 Qwen2-VL-72B(Qwen2-VL)上進行了實驗。

efa3476c-d63c-11ef-9310-92fbcf53809c.png

實驗結果

超高的生成成功率:PPTAgent 展現出卓越的魯棒性,使用 GPT-4o 或 Qwen2.5+Qwen2-VL 組合時,均實現了超過 95%的生成成功率。這一成績遠超此前模板編輯任務僅有 10%的成功率。

全方位的質量提升:與基線方法相比,PPTAgent 在幻燈片的各個維度都取得了顯著進步:

設計維度得分提升 40%(3.24 vs 2.33)

連貫性維度提升 34%(4.39 vs 3.28)

內容質量提升 9%(3.25 vs 2.98)

開源模型的出色表現:值得一提的是,Qwen2.5 與 Qwen2-VL 的組合有效地克服了 Qwen2-VL 在語言處理方面的局限性,其整體表現也達到了與 GPT-4o 相當的水平,展現了開源大模型在專業領域的應用潛力。

efbb1cac-d63c-11ef-9310-92fbcf53809c.png

評估結果的可靠性驗證:為確保評估結果的可靠性,我們將 PPTEval 的評估結果與人工評估進行了一致性分析。分析結果表明,PPTEval 在三個維度上的平均皮爾遜相關系數為 0.71,顯示其能夠有效地代替人類評估幻燈片的質量。

總結

通過這項研究,我們將演示文稿的自動生成重新定義為一個基于編輯的兩階段任務。PPTAgent 充分利用了大語言模型對代碼的理解和生成能力,通過分析參考演示文稿的文本特征和布局模式,有效地組織和生成新的演示文稿。在多個領域的實驗驗證中,PPTAgent 都能夠魯棒地生成高質量幻燈片。同時,我們提出的 PPTEval 評估框架為演示文稿生成任務提供了可靠的評估手段,為該領域的未來發展奠定了重要基礎。 這項技術有望開創一種全新的無監督演示文稿生成范式,為未來研究提供了新的思路。通過這項技術,我們期待能夠幫助更多人高效地創作專業的演示文稿,讓信息傳遞變得更加便捷。最后,通過開源的 PPTAgent、PPTEval 和大規模幻燈片數據集 Zenodo10K,我們希望能夠推動整個領域的發展,激發更多創新性的研究成果。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • ppt
    ppt
    +關注

    關注

    1

    文章

    45

    瀏覽量

    17717
  • 大模型
    +關注

    關注

    2

    文章

    2524

    瀏覽量

    2989

原文標題:PPTAgent: 大模型驅動的PPT自動生成,解放打工人

文章出處:【微信號:gh_e5b9d8c5c1d4,微信公眾號:中科院軟件所中文信息處理實驗室】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    AN-715::走近IBIS模型:什么是IBIS模型?它們是如何生成的?

    電子發燒友網站提供《AN-715::走近IBIS模型:什么是IBIS模型?它們是如何生成的?.pdf》資料免費下載
    發表于 01-13 14:21 ?0次下載
    AN-715::走近IBIS<b class='flag-5'>模型</b>:什么是IBIS<b class='flag-5'>模型</b>?它們是如何<b class='flag-5'>生成</b>的?

    借助谷歌Gemini和Imagen模型生成高質量圖像

    在快速發展的生成式 AI 領域,結合不同模型的優勢可以帶來顯著的成果。通過利用谷歌的 Gemini 模型來制作詳細且富有創意的提示,然后使用 Imagen 3 模型根據這些提示
    的頭像 發表于 01-03 10:38 ?381次閱讀
    借助谷歌Gemini和Imagen<b class='flag-5'>模型</b><b class='flag-5'>生成</b>高質量圖像

    大語言模型優化生成管理方法

    大語言模型的優化生成管理是一個系統工程,涉及模型架構、數據處理、內容控制、實時響應以及倫理監管等多個層面。以下,是對大語言模型優化生成管理方
    的頭像 發表于 12-02 10:45 ?118次閱讀

    NVIDIA推出全新生成式AI模型Fugatto

    NVIDIA 開發了一個全新的生成式 AI 模型。利用輸入的文本和音頻,該模型可以創作出包含任意的音樂、人聲和聲音組合的作品。
    的頭像 發表于 11-27 11:29 ?406次閱讀

    如何自動生成verilog代碼

    介紹幾種自動生成verilog代碼的方法。
    的頭像 發表于 11-05 11:45 ?404次閱讀
    如何<b class='flag-5'>自動</b><b class='flag-5'>生成</b>verilog代碼

    火山引擎推出豆包·視頻生成模型

    在近期舉辦的2024火山引擎AI創新巡展上,火山引擎總裁譚待隆重推出了豆包·視頻生成模型,這一舉措標志著火山引擎在視頻內容生成領域邁出了重要一步。豆包模型憑借其獨特的技術優勢,吸引了業
    的頭像 發表于 09-25 14:11 ?341次閱讀

    TINA自動生成外形出錯怎么解決?

    我從TI官網下載了LM5145的PSPICE模型,想在TINA-TI中創建一個新宏,但是在自動生成外形的時候出錯了。請問這種問題怎么解決
    發表于 08-13 07:39

    聲智完成多項生成式算法和大模型服務備案

    2024年7月20日,北京聲智科技有限公司依據國家《生成式人工智能服務管理暫行辦法》,順利完成了壹元大模型生成式人工智能(大語言模型)服務上線備案。
    的頭像 發表于 07-23 15:25 ?683次閱讀
    聲智完成多項<b class='flag-5'>生成</b>式算法和大<b class='flag-5'>模型</b>服務備案

    AD8275 spice模型“AD8275.cir”自動生成了一個LTspice模型用來仿真,仿真時彈出圖片所示窗口如何處理?

    我用官網的AD8275 spice模型“AD8275.cir”自動生成了一個LTspice模型用來仿真,仿真時彈出圖片所示窗口,如何處理?
    發表于 06-04 12:27

    ISEDA首發!大語言模型生成的代碼到底好不好使

    在大模型席卷一切、賦能百業的浪潮里,“碼農”也沒能獨善其身。各種代碼自動生成的大模型,似乎描繪了一個人人都能像資深工程師一樣寫代碼的美好未來。 但在這個理想成為現實之前,有一個不能回避
    發表于 05-16 13:41 ?355次閱讀
    ISEDA首發!大語言<b class='flag-5'>模型</b><b class='flag-5'>生成</b>的代碼到底好不好使

    生成式 AI 進入模型驅動時代

    隨著ChatGPT和大型語言模型(LLM)呈現爆炸式增長,生成式人工智能(GenerativeAI)成為近來的一大熱詞。由此引發了一場爭論:哪種AI模型使用的訓練參數最多?與此同時,更多
    的頭像 發表于 04-13 08:12 ?563次閱讀
    <b class='flag-5'>生成</b>式 AI 進入<b class='flag-5'>模型</b><b class='flag-5'>驅動</b>時代

    聯想攜手京東,緊扣大模型生成式AI技術

    聯想與京東攜手,緊扣大模型生成式AI技術帶來的產業機遇,在多個領域展開深入合作。
    的頭像 發表于 04-12 10:27 ?662次閱讀

    上海人工智能實驗室發布自動駕駛視頻生成模型GenAD

    上海人工智能實驗室近日取得重大技術突破,聯合香港科技大學、德國圖賓根大學及香港大學共同研發并發布了大規模自動駕駛視頻生成模型——GenAD。這一創新模型通過精準預測和模擬真實世界場景,
    的頭像 發表于 03-26 10:40 ?548次閱讀

    KOALA人工智能圖像生成模型問世

    近日,韓國科學團隊宣布研發出名為 KOALA 的新型人工智能圖像生成模型,該模型在速度和質量上均實現了顯著突破。KOALA 能夠在短短 2 秒內生成高質量圖片,同時大幅降低了對硬件的需
    的頭像 發表于 03-05 10:46 ?821次閱讀

    自動駕駛數據集的生成模型之WoVoGen框架原理

    生成多攝像頭的街景視頻對于增加自動駕駛數據集至關重要,解決了對廣泛而多樣的數據的迫切需求。由于多樣性的限制和處理光照條件的挑戰,傳統的基于渲染的方法越來越多的被基于擴散的方法所取代。
    發表于 01-25 15:26 ?637次閱讀
    <b class='flag-5'>自動</b>駕駛數據集的<b class='flag-5'>生成</b><b class='flag-5'>模型</b>之WoVoGen框架原理
    主站蜘蛛池模板: 中文字幕成人在线观看| 午夜理论片YY4399影院| 小p孩玩成年女性啪啪资源| qovd伦理| 欧美精品一区二区三区四区| 2021国产精品国产精华| 麻豆成人啪啪色婷婷久久| 在线看无码的免费网站| 久久午夜夜伦鲁鲁片无码免费| 亚洲欧洲无码AV在线观看你懂的| 韩国演艺圈qvod| 一个人色导航| 免费国产足恋网站| 99热这里精品| 欧美影院在线观看完整版 mp4| 99久久久久国产精品免费| 男人都懂www深夜免费网站| YELLOW视频在线观看最新 | 亚洲男人天堂网| 精品极品三大极久久久久| 正在播放国产精品| 欧美xxxxx18| 国产精品7777人妻精品冫| 亚洲七七久久桃花综合| 老阿姨才是最有味的一区二区| 97公开超碰在线视频| 日本一区精品久久久久影院| 国产精品99亚发布| 妖精视频免费看| 嫩草亚洲国产精品| 国产高清美女一级毛片久久| 亚洲色欲国产AV精品综合| 久久99热只有频精品| 一本大道无码AV天堂欧美| 伦理片在线线手机版韩国免费观看 | 国产乱码精品一区二区三区四川| 亚洲AV无码国产精品色午夜情| 久久国产欧美日韩精品免费| 99免费精品| 我和黑帮老大第365天第2季在线 | 美女被触手注入精子强制受孕漫画 |