色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于深度學習的智能社會媒體挖掘

MqC7_CAAI_1981 ? 來源:cg ? 2018-12-14 14:15 ? 次閱讀

社會媒體的重要性眾所周知。全球人口中,一半人是網民,網民中的三分之二是社會媒體用戶。常見社會媒體包括Facebook,twitter,國內的微信和微博也是常用的社會媒體。我們在社會媒體能夠做各種各樣的事情,包括和親友交流溝通、獲取信息,分享或者表達我們的觀點。

從事社會媒體研究開發具有商業價值和社會價值。以各種媒體的廣告份額為例,電視媒體廣告的份額只有社會媒體廣告份額的一小部分,更何況是報紙和廣播等傳統媒體。因此從商業價值上社會媒體就是一個很值得我們研究的對象。這里我們可以用一個例子來展示:一個新浪微博用戶在頭天晚上晚上九點多發了條微博,表示想采購一款筆記本電腦,隔天早晨9點多就有促銷商要給他推銷產品了,可見從社會媒體上可以挖掘很多有價值的商業信息。統計結果表明,在社交媒體上的購買意向,最終轉化率超過了一半以上。社會媒體的社會價值更是毋庸置疑,以學術微博為例,學術研究人員可以在微博上推廣自己、結交朋友和獲取信息,政務微博的社會價值也是顯而易見。

下面從建模角度介紹如何對社會媒體進行描述。社會媒體可用一個異構網絡表示,異構網絡存在著兩種節點,一類是信息節點,實際上就是我們所發布的內容,比如文字、圖片、視頻音頻;另一類節點是用戶節點,也就是發表信息的人,從普通的用戶、網紅一直到更權威的媒體和機構。同時網絡中存在著三種異構的邊:信息之間是有關聯的,一條微博后面跟著很多評論,這是信息間的關系。用戶間存在社會關系,例如粉絲關系。人和信息之間也存在關系,一條信息可以艾特給特定用戶,用戶也可以發布微博,這樣就構成一個非常復雜的異構網絡,也就是計算機所處理的對象。

我們實驗室做的研究工作主要集中在社會媒體用戶行為理解和預測方面,我們在媒體上試圖給用戶建模,理解用戶行為,預測接下來會有什么樣的行為模式。

社交媒體上的用戶行為非常復雜,以歌手和影星林志穎為例,他的微博經常發布使用蘋果手機的體驗。如何理解他的行為呢?最表層的行為是,他在使用蘋果手機,往深里看,他是蘋果手機的粉絲,再往深看,他很可能是蘋果手機的代言人。所以我們要看用戶真正表達什么樣的內容。

用戶行為受到四個因素影響,第一是用戶發表內容,第二是用戶是處在什么樣的社交關系之間,第三是當前時刻有哪些熱點事件,第四是用戶發布這條微博處在什么時空環境。社會媒體用戶的建模和預測需要聽其言和觀其行。所謂聽其言,就是利用各種技術分析用戶發布的數據,主要是自然語言處理技術,也包括語音識別、圖像視頻處理等。所謂觀其行,就是要分析結構,利用社區分析技術,定位人物所在的社交圈;利用關系分析技術,分析人物的朋友圈及其疏密度,利用信息傳播分析技術,分析人物的社會影響力。

社會媒體上的行為非常豐富,具體則取決于不同媒體,但也大同小異,例如在facebook上可以發表帖子,可以表示喜歡,可以評論,可以分享;在Twitter上可以表示轉發,可以點贊。過去幾年我跟復旦大學的同事張奇、博士生丁卓冶、宮葉云、桂韜,碩士生黃浩然、馬仁峰,朱亮,在社會媒體挖掘方面做了一些工作,主要是用戶行為建模和預測,包括微博標簽推薦、艾特用戶(公司)推薦、轉發行為預測、用戶話題參與預測,以及如何在社會媒體挖掘中融入多模態信息。在研究方法上,早期主要采用主題模型和機器學習的方法,這幾年逐漸轉到深度學習之上。

我們做的第一塊工作是微博標簽推薦。新浪微博的標簽是用兩個#符號標記的詞語或者短語,可以認為就是微博的關鍵詞,用來對微博的上下文內容做出提示,便于我們在短時間了解微博的內容。微博標簽推薦任務就是為每一條微博去推薦少許關鍵詞。統計結果表明只有15%的微博包含關鍵詞,因此這樣一塊工作是有一定意義的。接下來介紹我們怎么樣做微博標簽推薦這件工作,主要介紹我們的研究思路,而不是具體的實現細節。給定一條微博,我們先要判斷這條微博中哪些詞有可能成為微博的關鍵詞,這種詞叫觸發詞。觸發詞的識別比較簡單,首先抓取大量微博,其中出現在微博標簽的詞語就是候選詞,也就是觸發詞。如何判斷微博中的哪些觸發詞可以推薦為微博標簽,還需要看觸發詞出現在微博的具體位置。同時考慮觸發詞和觸發詞的上下文,我們提出了一個雙通道的深度學習模型,一個通道抽取觸發詞特征,另一個通道抽取全局特征,然后結合兩部分特征,對標簽進行推薦。

眾所周知,深度學習在過去幾年是非常熱門的研究方法,所謂的深度學習,實際上就是多層的神經網絡,從06年開始被廣泛應用于計算機視覺,之后在語音識別中取得了長足的進步,從13、14年開始在自然語言處理領域得到廣泛運用。自然語言處理中的深度學習主要有兩類工作,第一類是表示學習,給定句子、篇章、微博,如何用一個低維稠密的向量去表達它,怎么從字詞表示通過組合方式得到整個微博的表示。另一類工作是如何利用語言文字天生具有的序列信息完成各種語言處理任務。

怎樣用深度學習來進行標簽推薦呢?我們在微博中尋找觸發詞,在局部通道中通過注意力機制判斷這些觸發詞是不是重要的詞語,通過全局通道得到微博的全局表示,利用卷積神經網絡融合局部和全部兩個通道的信息。為了評價標簽推薦的效果,我們使用精度、召回率和F值作為評價指標。精度就用來表示算法推薦的標簽中有多少是微博原作者給定的標簽,召回率表示微博原作者給定的標簽有多少比例被算法推薦,F值則是精度和召回率的調和平均。我們選取了11萬條帶有標簽的微博數據,隨機選取其中的1萬條作為測試。實驗結果表明雙通道模型的F值達到了40%,這是相當不錯的結果。

微博用戶行為建模僅僅考慮微博本身內容是不夠充分的,之前關于標簽推薦的研究工作主要只利用了微博本身的信息,未充分考慮微博作者的興趣特點。一個作者的興趣點是有限的,發文范圍也是有限的。標簽也是用戶的興趣體現,所以兩者也是緊密相關的。用戶興趣點可以從用戶歷史微博挖掘。我們采用記憶神經網絡存儲用戶的歷史微博。記憶神經網絡通過引入一個外部儲存器來對數據進行長時儲存、檢索與更新,已經被成功應用到不同的自然語言處理任務中。我們提出的層次記憶網絡模型將用戶歷史發文儲存在外部記憶儲存單元,利用層次化注意力機制構建用戶歷史興趣,輔助標簽推薦。記憶的查找過程中采用層次式的方式,首先考慮詞級別的相似程度,然后考慮句子級別的相似程度,之后獲得用戶興趣的表示,再和當前這條微博的表示進行匹配,從中可以發現當前微博中哪些詞適合表征用戶的興趣和微博的內容,并選擇作為標簽。實驗結果表明,記憶神經網絡獲得的精度和召回率都比僅考慮內容的模型有所提高。

接下來考慮艾特用戶推薦。在一些社交媒體,如Twitter、Facebook或微博中,用戶會發表推文并“@”他們的朋友或者名人,借以宣傳產品, 參與話題討論, 吸引注意力, 求助等。如何在發布微博的時候推薦合適的用戶?我們也采用神經網絡方法,綜合微博內容、歷史、作者、興趣等信息,在記憶模塊記錄用戶興趣和潛在可艾特的用戶。在推薦艾特用戶的時候,要考慮到用戶發帖的歷史,因此我們把用戶發布的微博歷史存于記憶網絡。同時用另外一個記憶模型存儲艾特用戶的發帖歷史,表明他們對什么事件關注。如果用戶發布的微博和艾特用戶發布的微博類似,說明他們可能關心同一個領域或事件,艾特給這樣的用戶就有可能得到正面的反饋。實驗結果表明,艾特用戶的推薦能夠達到80%以上的精度,推薦結果比微博標簽的結果高很多。這里的原因也是顯而易見的,因為用戶寫微博的時候,選擇哪些關鍵詞是一個開放集合,甚至是微博原文中沒出現的詞語,不太好做非常精確的判斷;當艾特用戶的時候,潛在的對象是個有限集,至少必須擁有微博賬號,所以就相對精確些。

接下來介紹如何預測用戶的轉發行為。普通用戶,即使以信息檢索領域國際專家酒井為例,他發布的帖子經常只有幾人轉發。另一位用戶,發了個帖子,只有一句話“給一起長大的你們”,就被轉發一百多萬次,原因是因為他是明星鹿晗。所以微博是否會被轉發不僅取決于微博本身的內容是否精彩,是否會引起別人興趣,也取決于發布微博的用戶是誰。為了預測用戶轉發行為,我們選擇200個用戶作為第一層種子節點,轉發帖子的8萬個用戶作為第二層節點,構建了含有8千多萬條微博的數據集。我們采取的方法也還是雙通道神經網絡方法,通過基于注意力的神經網絡對用戶歷史微博進行建模,通過神經網絡計算用戶興趣點以及待預測的目標微博之間的相似度。結合用戶、用戶歷史興趣點、興趣點與微博內容的相似度、待預測的微博內容、待預測微博的作者等信息對轉發行為進行預測。根據這樣的一個模型,我們在精度、召回率和F值都達到70%以上性能,相當不錯。我們還注意到,偶爾轉發微博的用戶不太愿意轉發,但是對于經常轉發微博的用戶,我們能夠做出更加精確的估計。

下面一塊工作關注于用戶話題預測問題的研究。我們想要預測在一些社交媒體,如Twitter、Facebook或微博中,哪一些話題是一個用戶會去參與的。和別的一些微博推薦任務、熱點檢測任務不同的是,在這個任務中,我們關注的是預測用戶和話題之間的關系。因此,我們將其轉換成了匹配問題,并提出了一種匹配模型去解決它。我們提出了一個高效的基于卷積神經網的網絡模型,并且在模型中引入了記憶儲存器,利用注意力機制進行更好的匹配建模。在這個框架中,用戶發文興趣、用戶話題參與歷史兩種信息被充分利用,分別和話題相關的文本等信息進行興趣匹配建模。為了訓練與評估我們的模型,我們利用Twitter構建了一個超過一千四百萬條tweets的數據集,并對比了多種推薦方法,實驗結果表明我們的模型在該任務上都比之前的方法取得了很大的提升。

除了以上的推薦任務,我們還關注對于多模態推文的推薦。如一個用戶發布了關于mac的微博,如果只看作者的推文,我們可能誤以為作者買了一臺MAC電腦,但結合了圖片的信息,我們可以知道,作者其實是買了一個MAC化妝品牌的口紅。為了處理多模態信息,我們將其轉換成了匹配問題,并提出了一種匹配模型去解決。我們在模型中引入了記憶儲存器,利用注意力機制進行更好的匹配建模。在匹配框架中利用了用戶多模態歷史發文和作者多模態歷史發文兩種信息,分別和待進行艾特推薦的多模態推文進行興趣匹配建模。實驗結果表明多模態信息能更好地提高艾特推薦的效率,并且我們的模型在該任務上都比之前的方法取得了很大的提升。

我們還可以綜合利用推文中文字跟圖片信息去判斷某個用戶是不是有抑郁傾向。比如某個用戶發了條微博,文字內容是“每個人這么快樂,看上去很快樂”,但她配了張很抑郁的圖片。我們在做抑郁檢測的時候,不僅要看用戶說了什么,還要看她發了什么樣的圖片。我們所提出的模型也是考慮到多模態信息,一個通道是文字信息,另一個通道是圖片信息,結合文字跟圖片,取得了較為滿意的預測精度。

經常有人跟我探討,女性是不是適合做人工智能,是不是適合做深度學習。實際上有些女性對于研究深度學習有一定壓力,因為有很多數學公示要推導,需要寫很多代碼。但實際上我們有很多開源工具可以使用,對于編程能力要求并不是非常高,數學方面,像梯度計算、優化計算都可以用開源工具來做。所以我們女性不要有太大壓力。另一方面,我們也有自己的優點。女性非常細致和敏感,會很細致地去發現和分析問題,會很細致地研究實驗結果,然后去看這個結果中間有什么是我們所不滿意的,分析錯誤可能來源于什么地方。女性的語文文字能力和表達也有優勢。也因此,在人工智能領域,活躍著許多女科學工作者,也有了咱們今天的人工智能女科技工作者專題論壇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1796

    文章

    47643

    瀏覽量

    240223
  • 異構網絡
    +關注

    關注

    0

    文章

    19

    瀏覽量

    9252
  • 深度學習
    +關注

    關注

    73

    文章

    5512

    瀏覽量

    121521

原文標題:CIIS2018演講實錄丨黃萱菁:基于深度學習的智能社會媒體挖掘

文章出處:【微信號:CAAI-1981,微信公眾號:中國人工智能學會】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    NPU在深度學習中的應用

    隨著人工智能技術的飛速發展,深度學習作為其核心驅動力之一,已經在眾多領域展現出了巨大的潛力和價值。NPU(Neural Processing Unit,神經網絡處理單元)是專門為深度
    的頭像 發表于 11-14 15:17 ?868次閱讀

    GPU深度學習應用案例

    GPU在深度學習中的應用廣泛且重要,以下是一些GPU深度學習應用案例: 一、圖像識別 圖像識別是深度學習
    的頭像 發表于 10-27 11:13 ?497次閱讀

    AI大模型與深度學習的關系

    AI大模型與深度學習之間存在著密不可分的關系,它們互為促進,相輔相成。以下是對兩者關系的介紹: 一、深度學習是AI大模型的基礎 技術支撐 :深度
    的頭像 發表于 10-23 15:25 ?1211次閱讀

    深度學習算法在嵌入式平臺上的部署

    隨著人工智能技術的飛速發展,深度學習算法在各個領域的應用日益廣泛。然而,將深度學習算法部署到資源受限的嵌入式平臺上,仍然是一個具有挑戰性的任
    的頭像 發表于 07-15 10:03 ?1682次閱讀

    深度學習中的時間序列分類方法

    時間序列分類(Time Series Classification, TSC)是機器學習深度學習領域的重要任務之一,廣泛應用于人體活動識別、系統監測、金融預測、醫療診斷等多個領域。隨著深度
    的頭像 發表于 07-09 15:54 ?1153次閱讀

    深度學習與nlp的區別在哪

    深度學習和自然語言處理(NLP)是計算機科學領域中兩個非常重要的研究方向。它們之間既有聯系,也有區別。本文將介紹深度學習與NLP的區別。 深度
    的頭像 發表于 07-05 09:47 ?1058次閱讀

    深度學習中的模型權重

    深度學習這一充滿無限可能性的領域中,模型權重(Weights)作為其核心組成部分,扮演著至關重要的角色。它們不僅是模型學習的基石,更是模型智能的源泉。本文將從模型權重的定義、作用、優
    的頭像 發表于 07-04 11:49 ?1910次閱讀

    人工智能、機器學習深度學習是什么

    在科技日新月異的今天,人工智能(Artificial Intelligence, AI)、機器學習(Machine Learning, ML)和深度學習(Deep Learning,
    的頭像 發表于 07-03 18:22 ?1423次閱讀

    人工智能深度學習的五大模型及其應用領域

    隨著科技的飛速發展,人工智能(AI)技術特別是深度學習在各個領域展現出了強大的潛力和廣泛的應用價值。深度學習作為人工智能的一個核心分支,通過
    的頭像 發表于 07-03 18:20 ?4920次閱讀

    深度學習常用的Python庫

    深度學習作為人工智能的一個重要分支,通過模擬人類大腦中的神經網絡來解決復雜問題。Python作為一種流行的編程語言,憑借其簡潔的語法和豐富的庫支持,成為了深度學習研究和應用的首選工具。
    的頭像 發表于 07-03 16:04 ?716次閱讀

    深度學習與卷積神經網絡的應用

    隨著人工智能技術的飛速發展,深度學習和卷積神經網絡(Convolutional Neural Network, CNN)作為其中的重要分支,已經在多個領域取得了顯著的應用成果。從圖像識別、語音識別
    的頭像 發表于 07-02 18:19 ?1044次閱讀

    TensorFlow與PyTorch深度學習框架的比較與選擇

    深度學習作為人工智能領域的一個重要分支,在過去十年中取得了顯著的進展。在構建和訓練深度學習模型的過程中,深度
    的頭像 發表于 07-02 14:04 ?1063次閱讀

    深度學習與傳統機器學習的對比

    在人工智能的浪潮中,機器學習深度學習無疑是兩大核心驅動力。它們各自以其獨特的方式推動著技術的進步,為眾多領域帶來了革命性的變化。然而,盡管它們都屬于機器
    的頭像 發表于 07-01 11:40 ?1533次閱讀

    深度解析深度學習下的語義SLAM

    隨著深度學習技術的興起,計算機視覺的許多傳統領域都取得了突破性進展,例如目標的檢測、識別和分類等領域。近年來,研究人員開始在視覺SLAM算法中引入深度學習技術,使得
    發表于 04-23 17:18 ?1376次閱讀
    <b class='flag-5'>深度</b>解析<b class='flag-5'>深度</b><b class='flag-5'>學習</b>下的語義SLAM

    為什么深度學習的效果更好?

    導讀深度學習是機器學習的一個子集,已成為人工智能領域的一項變革性技術,在從計算機視覺、自然語言處理到自動駕駛汽車等廣泛的應用中取得了顯著的成功。深度
    的頭像 發表于 03-09 08:26 ?685次閱讀
    為什么<b class='flag-5'>深度</b><b class='flag-5'>學習</b>的效果更好?
    主站蜘蛛池模板: 亚洲AV无码偷拍在线观看 | 一区二区三区无码被窝影院 | 国产成年人在线观看 | 国产偷国产偷亚州清高 | bbbbbxxxxx肥胖 | 熟女少妇内射日韩亚洲 | 小小水蜜桃视频高清在线播放 | 无码欧美毛片一区二区三在线视频 | 国产高潮国产高潮久久久久久 | 欧美97色伦影院在线观看 | 国产香蕉尹人视频在线 | 久久re这里精品23 | 国产中文字幕一区 | 麻豆区蜜芽区 | 色综合久久88色综合天天提莫 | 成人在免费视频手机观看网站 | 被送到黑人性奴俱乐部 | 亚洲一区二区三区乱码在线欧洲 | 久久综合色一综合色88中文 | 男人电影天堂手机 | 亚洲精品AV无码重口另类 | 日韩欧美国产免费看清风阁 | 二级毛片免费观看全程 | 亚洲AV久久无码精品热九九 | 亚洲欧美日韩在线码不卡 | 亚洲色图在线观看视频 | 囯产愉拍亚洲精品一区 | 秋霞电影院午夜伦高清 | 草莓AV福利网站导航 | 一二三四在线高清中文版免费观看电影 | 久久久亚洲国产精品主播 | 亚洲国产在线观看免费视频 | 良家人妻无码专区九色颜射 | jizz中国女人 | 无码成A毛片免费 | 嫩小幼处在线 | 娇小老少配xxxxx | 亚洲精品网址 | 一本久道久久综合婷婷五月 | 国产精品96久久久久久AV网址 | 色偷偷91综合久久噜噜 |