人工智能為多媒體服務(wù)帶來了更多、更有價值的新功能,讓你的媒體、你的video更加智能化,幫助用戶獲取更好的體驗。微軟大中華區(qū)創(chuàng)新技術(shù)合作事業(yè)部 (CSE)資深技術(shù)顧問梁建為我們分享了人工智能與媒體服務(wù)的契合以及未來的發(fā)展方向。
大家好,我是來自微軟創(chuàng)新技術(shù)合作事業(yè)部的梁建,很高興接受LiveVideoStack的邀請,跟大家一同介紹和暢想媒體服務(wù)video在未來2018年可能的發(fā)展。
2017年,我們經(jīng)歷了整個媒體行業(yè)視頻服務(wù)、視頻處理的快速發(fā)展,與此同時人工智能和區(qū)塊鏈也是去年的熱點話題,那我們就一起來看下人工智能和我們的媒體服務(wù)如何進(jìn)行結(jié)合。
人工智能幫助我們實現(xiàn)更多場景
傳統(tǒng)的媒體服務(wù)都會做哪些事情?比如線上直播、編解碼、內(nèi)容保護(hù)等等的服務(wù),但隨著人工智能技術(shù)的發(fā)展,很多媒體行業(yè)或者媒體業(yè)務(wù)處理行業(yè)的朋友,也在探索如何將人工智能應(yīng)用到現(xiàn)在的媒體技術(shù)和行業(yè)發(fā)展上,包括視頻的發(fā)展上。
大家可以思考下在哪些場景上人工智能技術(shù)能幫助我們實現(xiàn)更多的場景?比如如何在越來越多的視頻中發(fā)現(xiàn)更好的、更需要的內(nèi)容;如何讓視頻內(nèi)容里人物之間產(chǎn)生關(guān)系;在視頻編輯和處理過程中,如何增加字幕的信息以及多語言的支持;如何讓視頻自動的增加評論,像大家熟知的視頻里中比較流行的彈幕;以及如何讓視頻里產(chǎn)生更多的價值,比如在視頻里如何更好的嵌入廣告,讓視頻自動的把對用戶的洞察力、想法展現(xiàn)出來。
人工智能讓媒體服務(wù)更“聰明”
這里我也想跟大家介紹在微軟的Azure云平臺上有一個Media Services媒體服務(wù),它不僅僅包括了傳統(tǒng)的視頻直播、Encode、Decode這種編解碼能力、內(nèi)容保護(hù)能力,以及多渠道、多設(shè)備的Player的能力。它還提供了Video AI的能力。也就是除了在這個傳統(tǒng)的Midea Services架構(gòu)上,我們可以能幫助大家產(chǎn)生支持多種設(shè)備的流媒體Streaming的格式。同時它還 提供了Media Analytics媒體分析,它能夠從視頻匯總產(chǎn)生一些洞察力,幫助大家降低人工成本,同時自動拿到更多的信息。
在微軟的Media Analytics服務(wù)中,它融入了非常豐富的人工智能技術(shù):Audio Transcript能夠通過語音視頻自動生成字幕信息;通過人臉檢測知道視頻中出現(xiàn)了哪些人物;通過視頻OCR把視頻中非數(shù)字的信息轉(zhuǎn)化為數(shù)字的文字信息;根據(jù)視頻中人臉的信息,選取人物自動增加人臉修正;通過Video summaries智能生成視頻的總結(jié)或片段,比如一個小時的視頻生成出一分鐘的預(yù)告或者介紹;Content moderation可以智能審核內(nèi)容信息,比如成人信息、用暴力等等;以及通過比較流行的DNN深度學(xué)習(xí)算法、神經(jīng)網(wǎng)絡(luò)來實現(xiàn)物體的識別。此外還有視頻的穩(wěn)定、情緒識等等。由此我們可以預(yù)見在2018年,除了傳統(tǒng)的視頻編解碼、視頻流以及最新的視頻格式外,人工智能技術(shù)會給我們產(chǎn)生更多的價值,同時幫助我們降低成本。除了以上介紹的10種AI服務(wù),我們也相信在2018年微軟還將提供更多的智能服務(wù),也歡迎大家持續(xù)關(guān)注微軟Azure Media Services平臺。
除了傳統(tǒng)服務(wù),微軟還提供了五大方面29類的認(rèn)知服務(wù),而這29類服務(wù)又分別都提供了自己相關(guān)的API,它不僅可以用在傳統(tǒng)的圖片、語音識別、知識搜索,你可以非常方便地將它應(yīng)用到自己的媒體服務(wù)中。特別的,我們還有一個最新的服務(wù)Video Indexer,我們前面提到的10種人工智能服務(wù)都包含其中,包括translater——無論文字或者語言的,這樣對于一個視頻,它就會自動根據(jù)你的需求去進(jìn)行說語音識別、人臉識別、字幕翻譯、多語言翻譯、視頻內(nèi)容總結(jié)、場景分析等等。那如果你希望視頻有更多的拓展,比如知識搜索就非常重要,你可以根據(jù)視頻去搜索相關(guān)的視頻、圖片,同樣的你還可以進(jìn)行新聞的搜尋。
這里我們還提供了Custom Services——從視覺、到語言理解、到語音服務(wù)、到搜索都有一個定制化的體驗。其實我們的API都是通用的,只不過定制化的場景、訓(xùn)練的數(shù)據(jù)是需要大家來提供。比如你希望在視頻服務(wù)中為用戶做更多的拓展搜索,但又并不希望進(jìn)行全網(wǎng)搜索找到一些不想要的信息,那么此時你就可以利用Custom Search定義相關(guān)的網(wǎng)站和希望的內(nèi)容,從而得到你規(guī)定的信息。語言理解上,大家可以很方便地把一些用戶在視頻聊天對話中,給他的關(guān)鍵詞、用戶所要的意圖、定義一些場景,通過自然語義理解抽取出來。包括我們說的Custom Vision可以通過frame這種方式把視頻中的一些場景、物體識別、場景給他抽取出來,讓我們的視頻不僅僅是傳統(tǒng)中的觀看、編碼、streaming,同樣的你也可以通過人工智能拿到更多的信息。
最后,我也希望在2018年有越來越多的媒體制作、開發(fā)的合作伙伴一定將人工智能技術(shù)用起來,讓你的媒體、你的video更加智能化,拿到更多的信息。同樣,我相信在2018年我們和LiveVideoStack音視頻技術(shù)社區(qū)會有非常多的合作,也特別希望把更多的人工智能技術(shù)、更多的Media Services的服務(wù)給大家介紹出來,幫助大家更好的工作,同時帶來更多的體驗。也預(yù)祝LiveVideoStack社區(qū)越辦越好,吸引更多的開發(fā)者,能夠匯集開發(fā)者、匯集我們這些做人工智能、做媒體服務(wù)的合作伙伴,謝謝大家!
-
CES
+關(guān)注
關(guān)注
4文章
1129瀏覽量
70881 -
人工智能
+關(guān)注
關(guān)注
1794文章
47642瀏覽量
239662 -
媒體
+關(guān)注
關(guān)注
1文章
65瀏覽量
14451
原文標(biāo)題:展望2018:人工智能為媒體服務(wù)賦能
文章出處:【微信號:livevideostack,微信公眾號:LiveVideoStack】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論