色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種為小樣本文本分類設(shè)計的結(jié)合數(shù)據(jù)增強的元學習框架

深度學習自然語言處理 ? 來源:南大NLP ? 作者:孫鵬飛 ? 2021-05-19 15:54 ? 次閱讀

01

研究背景及動機

近些年,元學習已經(jīng)成為解決小樣本問題的主流技術(shù),并且取得不錯的成果。然而,由于現(xiàn)有的元學習方法大多數(shù)集中在圖像分類上,而對文本分類上的關(guān)注比較少。與圖像不同,同一類別中文本具有多種表達方式,這使得當前元學習方法的性能更容易受到每個類別樣本數(shù)(即shot的數(shù)量)的影響。因此,現(xiàn)有的元學習方法很難在小樣本文本分類上取得令人滿意的結(jié)果。

為了解決這個問題,我們在元學習中引入了數(shù)據(jù)增強,它帶來的好處是我們可以產(chǎn)生增強樣本以增加新類別的樣本數(shù)量,并使訓練樣本多樣化。然而,這帶來了一個新的挑戰(zhàn),如何在小樣本的情況下產(chǎn)生置信度高的樣本?

為此,我們提出了一種新穎的數(shù)據(jù)增強方法,稱為Ball generator,圖1給出了一個簡單的例子。首先,我們計算支持集的最小包圍球,并在該球中合成樣本。我們認為該球中的樣本具有較高的置信度,因為所有支持集樣本都包含在該球中,并且它們與球心的最遠距離最小。

其次,為避免合成樣本偏差的影響,我們引入了變換模塊,以使合成樣本靠近自己的球心,并遠離其他球心。此外,我們還提出了一個新的基于數(shù)據(jù)增強的元學習框架(MEta-Learning with Data Augmentation,MEDA),以聯(lián)合訓練ball generator和meta-learner,使二者協(xié)同進化。與普通元學習相比,通過增加新類別的樣本數(shù)量,有效地提高了meta-learning在小樣本情況下的泛化能力。

950a13b4-b4a6-11eb-bf61-12bb97331649.png

圖1:Ball generator示例

02

MEDA

MEDA的框架如圖2所示。它是兩模塊組成:一個是ball generator模塊,它負責利用支持集生成增強支持集,并得到擴展支持集。另一個模塊是meta-learner,它在給定了擴展支持集的條件下計算每個查詢實例在類別上的概率分布,表示為。而不同的meta-learner的區(qū)別在于如何實現(xiàn)。這里我們選擇原型網(wǎng)絡(luò)和關(guān)系網(wǎng)絡(luò)作為MEDA的meta-learner。

9536f29e-b4a6-11eb-bf61-12bb97331649.png

圖2: MEDA

其中,ball generator是一種特征空間數(shù)據(jù)增強方法。它的核心思想是在特征空間中進行樣本的合成,并對合成的樣本進行調(diào)整。因此,整個ball generator由兩個子模塊組成:合成模塊和變換模塊。

合成模塊利用空間采樣算法獲得相應(yīng)的合成樣本。具體是將采樣空間限制為支持集的最小包圍球,這里是球心,是半徑。然后,通過如下公式計算得到合成樣本:

95bedefc-b4a6-11eb-bf61-12bb97331649.png

這里,和。

變換模塊,它是為了進一步避免合成樣本偏差的影響,在特征空間中對合成的樣本進行變換操作,使合成樣本更接近自己類別的球心,而遠離其他球心。因此,我們將變換操作寫成函數(shù),該函數(shù)以合成樣本作為輸入,產(chǎn)生一個增強樣本作為輸出。

03

實驗

本文的實驗是在SNIPS和ARSC數(shù)據(jù)集上進行的。我們將MEDA與三組baseline模型進行了比較。第一組是數(shù)據(jù)增強的模型;第二組是傳統(tǒng)的元學習模型;第三組是最新的小樣本文本分類的SOTA模型。實驗結(jié)果如表1和2所示。

表1:SNIPS實驗結(jié)果

9634ec8c-b4a6-11eb-bf61-12bb97331649.png

表2: ARSC實驗結(jié)果

967c6e36-b4a6-11eb-bf61-12bb97331649.png

從實驗結(jié)果上來看,由于通過數(shù)據(jù)增強獲得更多的訓練樣本,使得MEDA在兩個數(shù)據(jù)集上都取得一致且顯著的提升。

為了更進一步說明模型的shot數(shù)量對模型的影響,我們設(shè)計相應(yīng)的實驗。如圖3所示,我們可以觀察到MEDA在所有設(shè)置中都取得了最好的表現(xiàn)。特別地,MEDA的準確率隨著shot數(shù)量的減少而增加(間距變大),這表明當shot數(shù)相對較小時,模型效果的提升更明顯。

96bf7cc6-b4a6-11eb-bf61-12bb97331649.png

圖3: 不同shot數(shù)量對模型準確率的影響

此外,我們還研究了模型的準確性如何隨著增強樣本數(shù)量的變化而變化。我們畫出不同模型在SNIPS數(shù)據(jù)集上的準確率變化情況。如圖4所示:

970f03f4-b4a6-11eb-bf61-12bb97331649.png

圖4: 不同模型的平均準確率隨增強樣本數(shù)量的變化而變化

可以看到,隨著增強樣本數(shù)量的增加,模型的準確率有所提高。同時,我們比較5-shot和10-shot的實驗設(shè)置,我們發(fā)現(xiàn)通過模型增強5個樣本與使用5個真實樣本的效果幾乎相同,這意味著我們的MEDA不是簡單地復(fù)制樣本,而是為模型生成有意義的樣本。

04

總結(jié)

在本文中,我們提出了一種新穎的數(shù)據(jù)增強方法,稱為ball generator,以增加新類別的樣本數(shù)量。此外,我們還提出了一個新的框架MEDA,該框架聯(lián)合優(yōu)化了ball generator和meta-learner,從而使ball generator可以學習生成最適合meta-learner的增強樣本。更多的細節(jié)、結(jié)果以及分析請參考原論文。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7230

    瀏覽量

    90465
  • 函數(shù)
    +關(guān)注

    關(guān)注

    3

    文章

    4359

    瀏覽量

    63504

原文標題:IJCAI2021論文:MEDA:一種為小樣本文本分類設(shè)計的結(jié)合數(shù)據(jù)增強的元學習框架

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 0人收藏

    評論

    相關(guān)推薦

    如何使用自然語言處理分析文本數(shù)據(jù)

    媒體、新聞報道、用戶評論等)收集你感興趣的文本數(shù)據(jù)數(shù)據(jù)清洗 :去除無關(guān)字符(如HTML標簽、特殊符號等),確保文本數(shù)據(jù)干凈且致。 2. 預(yù)處理 分詞 :將
    的頭像 發(fā)表于 12-05 15:27 ?940次閱讀

    一種面向飛行試驗的數(shù)據(jù)融合框架

    天地氣動數(shù)據(jù)一致性,針對某外形飛行試驗數(shù)據(jù)開展了典型對象的天地氣動數(shù)據(jù)融合方法研究。結(jié)合數(shù)據(jù)挖掘的隨機森林方法,本文提出了
    的頭像 發(fā)表于 11-27 11:34 ?527次閱讀
    <b class='flag-5'>一種</b>面向飛行試驗的<b class='flag-5'>數(shù)據(jù)</b>融合<b class='flag-5'>框架</b>

    HarmonyOS NEXT應(yīng)用服務(wù)開發(fā)Intents Kit(意圖框架服務(wù))習慣推薦方案概述

    、習慣推薦是HarmonyOS學習用戶的行為習慣后做出的主動預(yù)測推薦。 1.開發(fā)者將用戶在應(yīng)用/服務(wù)內(nèi)的使用行為向HarmonyOS共享,使得HarmonyOS可以基于共享的數(shù)據(jù)
    發(fā)表于 11-19 17:59

    HarmonyOS NEXT應(yīng)用服務(wù)開發(fā)Intents Kit(意圖框架服務(wù))本地搜索方案概述

    本地搜索”特性例,當用戶在使用音樂應(yīng)用/服務(wù)產(chǎn)生行為時,應(yīng)用/服務(wù)可以將音樂的數(shù)據(jù)通過意圖框架API接口共享到HarmonyOS。這里的音樂數(shù)
    發(fā)表于 11-06 10:59

    雷達的基本分類方法

    電子發(fā)燒友網(wǎng)站提供《雷達的基本分類方法.pdf》資料免費下載
    發(fā)表于 09-11 09:09 ?6次下載

    利用TensorFlow實現(xiàn)基于深度神經(jīng)網(wǎng)絡(luò)的文本分類模型

    要利用TensorFlow實現(xiàn)個基于深度神經(jīng)網(wǎng)絡(luò)(DNN)的文本分類模型,我們首先需要明確幾個關(guān)鍵步驟:數(shù)據(jù)預(yù)處理、模型構(gòu)建、模型訓練、模型評估與調(diào)優(yōu),以及最終的模型部署(盡管在本文
    的頭像 發(fā)表于 07-12 16:39 ?1141次閱讀

    增強現(xiàn)實是虛實結(jié)合嗎為什么

    增強現(xiàn)實(Augmented Reality,簡稱AR)是一種將虛擬信息與現(xiàn)實世界相結(jié)合的技術(shù),它通過計算機生成的圖像、聲音、觸覺等感官信息,增強用戶對現(xiàn)實世界的感知和理解。
    的頭像 發(fā)表于 07-08 10:58 ?686次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)在文本分類領(lǐng)域的應(yīng)用

    在自然語言處理(NLP)領(lǐng)域,文本分類直是個重要的研究方向。隨著深度學習技術(shù)的飛速發(fā)展,卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡稱CNN)在圖像識
    的頭像 發(fā)表于 07-01 16:25 ?948次閱讀

    基于助聽器開發(fā)的一種高效的語音增強神經(jīng)網(wǎng)絡(luò)

    受限的微控制器單元(microcontroller units,MCU)上,內(nèi)存和計算能力有限。在這項工作中,我們使用模型壓縮技術(shù)來彌補這差距。我們在HW上對RNN施加約束,并描述了一種方法來滿足它們
    發(fā)表于 06-07 11:29

    PMG1S3如何收集數(shù)據(jù),并使用Modustoolbox將其輸入文本文件?

    如何收集數(shù)據(jù),例如 trng 數(shù)據(jù)(隨機數(shù)),并使用 Modustoolbox 將其輸入文本文件? 請告知。 注: 我使用的是 PMG1S3。
    發(fā)表于 06-04 08:37

    基于神經(jīng)網(wǎng)絡(luò)的呼吸音分類算法

    。噪聲分類器是一種稱為NRNN的堆疊RNN,它預(yù)測樣本中每幀的噪聲標簽。NRNN優(yōu)化訓練期間每個輸出計算的交叉熵損失 然后,預(yù)測噪聲標
    發(fā)表于 05-31 12:05

    基于深度學習的鳥類聲音識別系統(tǒng)

    模型被用于對鳥類聲音數(shù)據(jù)進行高精度的分類。然而,現(xiàn)有的大多數(shù)鳥類聲音識別模型的泛化能力較差,并且采用復(fù)雜的算法來提取鳥類聲音特征。為了解決這些問題,本文構(gòu)建了個包含264
    發(fā)表于 05-30 20:30

    基于毫米波的人體跟蹤和識別算法

    了RadHAR,這是一種使用稀疏和非均勻點云執(zhí)行精確HAR的框架。RadHAR利用滑動時間窗口來累積毫米波雷達的點云,并生成體素化表示,作為分類器的輸入。 我們在收集的具有5不同活動
    發(fā)表于 05-14 18:40

    一種利用光電容積描記(PPG)信號和深度學習模型對高血壓分類的新方法

    高血壓,因為這種情況的初期癥狀并不明顯。高血壓階段的分類也很有用,這樣個人就可以根據(jù)他所處的階段進行以下生活方式的改變。 光電體積描記法(PPG)是一種檢測血液循環(huán)變化的光學方法。它主要是表示血容量隨時
    發(fā)表于 05-11 20:01

    助聽器降噪神經(jīng)網(wǎng)絡(luò)模型

    本文介紹了一種用于實時語音增強的雙信號變換LSTM 網(wǎng)絡(luò) (DTLN),作為深度噪聲抑制挑戰(zhàn) (DNS-Challenge) 的部分。該方法將短時傅立葉變換 (STFT) 和
    發(fā)表于 05-11 17:15
    主站蜘蛛池模板: 成人手机在线观看 | 国产午夜精品理论片免费观看 | 国产精品日本不卡一区二区 | 在线成 人av影院 | 国产成人亚洲综合无 | 久久妇女高潮几次MBA | 一区二区三区无码高清视频 | 亚洲电影第1页 | 我的好妈妈8高清在线观看WWW | 俄罗斯17vidio | 9477小游戏| 国产精品在线手机视频 | 快插我我好湿啊公交车上做 | 亚洲黄色大片 | 在线 | 果冻国产传媒61国产免费 | 一个人的视频在线观看免费观看 | 天天噜日日噜夜夜噜 | 无限资源在线观看播放 | 无码中文字幕热热久久 | 小莹的性荡生活45章 | 男女作爱在线播放免费网页版观看 | 4480YY无码午夜私人影院 | 九九黄色大片 | 处破女免费播放 | 中文字幕免费视频精品一 | 最新老头恋老OLDMAN | 60岁老年熟妇在线无码 | 国语自产视频在线 | 99热国产这里只有精品免费 | 内射白嫩少妇超碰 | 国产乱子影视频上线免费观看 | 91国内精品久久久久免费影院 | 久久涩视频 | 亚洲AV国产国产久青草 | 99久久综合精品免费 | 中文字幕免费在线视频 | 墨西哥美女主播 | 国产免费人成在线看视频 | 97超碰97资源在线观看 | 青青草原网址 | 快播在线电影网站 |