6月1日,“2023阿里云峰會·粵港澳大灣區”在廣州舉行,峰會上阿里云CTO周靖人登臺向業界宣布了阿里的AI新品的新產品“通義聽悟”正式上線開放公測。通義聽悟接入了通義千問大模型的理解與摘要能力,可成為用戶工作學習中的得力AI助手,幫助隨時隨地高效完成對音視頻內容的轉寫、檢索、摘要和整理,比如用大模型自動做筆記、整理訪談、提取PPT等。公測期間,用戶可領取100小時以上聽悟免費轉寫時長。
過去幾個月內國內非常多的大模型產品發布,阿里云也在4月7日向業界 宣布自研大模型“通義千問”,邀請用戶公測體驗。僅過去不到兩個月阿里云就再次發布大模型的迭代產品,產品進一步落地到更加專業的場景和應用。
(圖1:2023阿里云峰會CTO周靖人發布大模型通義聽悟 攝影:電子發燒友網)
阿里云CTO周靖人表示:“咱們換一種方式,讓音視頻可以被輕松閱讀、整理和分享。”他介紹,通義聽悟是一款工作學習AI助手,它瞄準具有高知識附加值的音視頻內容場景,比如開會、上課、訪談、培訓、面試、直播、看視頻、聽播客等,能通過大模型等最新AI技術快速提煉和沉淀知識。
?
圖2:阿里云通義聽悟的應用場非常豐富,幫助提升辦公效率 (攝影:電子發燒友網)
根據現場演示,聽悟融合了十多項AI功能,可以全面提升知識從音視頻向圖文形態轉化的效率。除了“聽力好”,能高準確度生成會議記錄、區分不同發言人,這個AI助手“悟性也極高”。大模型可以一秒給音視頻劃分章節并形成摘要、總結全文及每個發言人觀點、整理關注重點和待辦事項。
大模型一鍵提取PPT、針對多個音視頻內容向AI提問、概括特定段落等功能近期也將上線。
通義聽悟可自動為音視頻生成全文摘要、章節概括、發言總結
除此以外,通義聽悟據說還有一些非常細分場景的功能,例如用戶打開Chrome插件,外語學習者和聽障人士可以借助雙語懸浮字幕條隨時隨地看無字幕視頻。在日程沖突時,聽悟還可成為職場人士的“開會替身”,在靜音情況下入會AI可代為記錄會議、整理要點;轉寫結果可下載為字幕文件,方便新媒體從業者視頻后期制作;聽悟梳理的問答回顧可以讓記者、分析師、律師、HR等群體整理訪談更高效。
通義聽悟Chrome插件將在近期對所有用戶開放下載
另一顯著優勢是,聽悟與阿里云云盤打通,一鍵就能轉寫云盤上的音視頻內容,公測期間注冊的聽悟用戶后續還將獲得更大的阿里云盤存儲空間,在云盤內在線播放視頻時也可自動出字幕。這些都是大模型新用戶的福利。小編在此推薦朋友們去使用,在文章下面發表您使用的體驗反饋。
通義聽悟支持一鍵導入阿里云盤音視頻文件
當然,語音識別生成文字的大模型國內也還有其他的企業在做。我們看看阿里云通義聽悟與這類產品的主要區別。
圖:阿里云CTO周靖人
阿里云CTO周靖人介紹,聽悟集成了阿里非常先進的語音和語言技術。其內置阿里新一代工業級語音識別模型,識別準確率在多個權威中文數據集上名列第一;融合自研語音語義多模態說話人算法,能對10人以上說話場景進行角色區分;接入“通義千問”大模型后,能夠對上萬字的音視頻內容進行摘要總結,事實準確與要點完備性國內領先,支持跨多音視頻內容的精準問答理解。
繼史無前例的大降價后,阿里云再次送出人人都能用上的AI“大禮包”。此前國內語音廠商AI轉寫定價達19.8元每小時,而聽悟用戶可通過每日登陸等多種任務領取免費轉寫時長。公測期間,阿里云官方微博、微信及各大平臺社區還會發放大量20小時轉寫口令碼,用戶獲得的福利權益可累加,一年內有效,免費時長可高達100小時以上,市場價值上千元。
據了解,聽悟除個人版本外,還有企業應用。此前,聽悟企業版已在阿里集團內部被廣泛使用,幫助減少了大量會議記錄和整理的工作,受到好評。同時,聽悟的能力也可嵌進各類音視頻平臺,形成實時字幕、智能摘要等,典型應用如釘釘的“釘閃記”背后便集成了聽悟。未來聽悟還將在夸克APP、阿里云盤等端口提供服務。
“釘閃記”背后集成通義聽悟
雖然我們普通用戶沒有辦法去體會海外的相關版本,但是阿里云的AI大模型能夠在非常具體的辦公場景中使用人工智能來提升辦公的生產效率,相信未來不久國內的互聯網又會誕生新的超級應用APP產品出來。電子發燒友網在人工智能方面有專業的分析師跟進,緊跟行業帶來一手的資訊報道與分析。
-
AI
+關注
關注
87文章
31077瀏覽量
269412
發布評論請先 登錄
相關推薦
評論