色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

CRSLab對話推薦系統開源庫 相關代碼和對應論文目前已經開源

深度學習自然語言處理 ? 來源:深度學習自然語言處理 ? 作者:RUC AI Box ? 2021-01-07 14:20 ? 次閱讀

隨著對話系統和推薦系統的快速發展,新方向——對話推薦系統(Conversational Recommender System,簡稱CRS)也開始了蓬勃發展,其關注于如何通過基于自然語言的對話來獲得用戶的意圖和偏好,以實現精準推薦。但是現有的CRS相關數據集和模型在建模場景、最終目標和使用技術等方面存在一定差異,使得研究者們很難對這些模型進行統一的評測對比。對于科研新手來說,更是難以在這些模型和數據集中抉擇并快速搭建CRS系統。

為幫助各位道友“快樂+快速”上手研究對話推薦任務,我們(中國人民大學AI BOX團隊)推出了開源項目CRSLab——一個用于構建對話推薦系統(CRS)的開源工具包,在這里我們致力于幫您實現一鍵復現,快速開發,自動評測的一條龍服務,相關代碼和對應論文目前也已經開源。

目前為止,我們支持以下幾大功能,還有更多好玩的功能正在路上!

便捷的使用方法:新手別害怕,CRSLab提供了簡單而靈活的配置,快速調用分分鐘的事;

6個數據集和18個模型:各種數據預處理已幫您完成,各種新模型也適配完畢,任君取用;

多樣的評測方式:各個自動的評測指標都已經幫您實現,甚至還有人機交互的接口哦;

通用和可擴展的框架:還不滿意?框架給您搭好,函數接口給您安排上,想怎么玩就怎么玩;

論文地址:https://arxiv.org/pdf/2101.00939.pdf

項目GitHub地址:https://github.com/RUCAIBox/CRSLab

懶人一鍵安裝:pip install crslab

2af7ba6e-5036-11eb-8b86-12bb97331649.png

特性介紹

CRSLab完全基于 PyTorch 實現、主要面向研究者使用,其具有以下四大特性。

通用和可擴展的結構

我們設計了通用和可擴展的結構來統一各種對話推薦數據集和模型,并集成了多種內置接口和函數以便于快速開發。其具體框架如下所示:

2b077904-5036-11eb-8b86-12bb97331649.png

圖片: CRSLab 的總體架構

其中Configuration模塊提供了針對用戶的接口,用戶可以通過簡單的命令行操作或修改給出的config文件,即可實現快速調用不同的CRS模型!Data,Model和Evaluator模塊中集成了多個現有的數據集,模型和評測方案,省去了用戶自行復現的時間。Utilities中集成了多個常用的功能函數,可以幫助用戶快速從新搭建一個新的對話推薦系統!

全面的基準模型和數據集

在CRSLab中,我們集成了常用的 6 個數據集和 18 個模型。這6個數據集均為常用的人工標注數據集,但是其在任務定義、領域等方面存在差異。我們對其進行了預處理以得到統一的格式,并努力使其支持更多的先進模型,這些預處理包括:推薦商品抽取、實體鏈接、BPE分詞等。我們提供了預處理后數據的下載鏈接以方便用戶使用,如下為這些數據集的統計數據:

ReDial 10,006 182,150 Movie -- DBpedia ConceptNet
TG-ReDial 10,000 129,392 Movie Topic Prediction CN-DBpedia HowNet
GoRecDial 9,125 170,904 Movie Action Prediction DBpedia ConceptNet
DuRecDial 10,200 156,000 Movie, Music Goal Planning CN-DBpedia HowNet
INSPIRED 1,001 35,811 Movie Strategy Prediction DBpedia ConceptNet
OpenDialKG 13,802 91,209 Movie, Book Path Generation DBpedia ConceptNet
Dataset Dialogs Utterances Domains Task Definition Entity KG Word KG

我們將對話推薦任務主要拆分成三個子任務:推薦任務(生成推薦的商品),對話任務(生成對話的回復)和策略任務(規劃對話推薦的策略)。其中所有的對話推薦系統都具有對話和推薦任務,它們是對話推薦系統的核心功能,而策略任務是一個輔助任務,其致力于更好的控制對話推薦系統,在不同的模型中的實現也可能不同(如TG-ReDial采用一個主題預測模型,DuRecDial中采用一個對話規劃模型等)

在CRSLab中,我們實現了18 個模型,覆蓋CRS、推薦、對話和策略模型四種類別,其中CRS模型是指同時對推薦和對話任務(甚至策略任務)進行建模的融合模型,其可以利用這些任務以相互增強彼此的表現;而其他模型則只針對于某一個子任務。這些模型中還包括一些已經在CRS任務上表現較好的前沿模型,如圖神經網絡(GCN)和預訓練模型(BERT 和 GPT-2)。下表為這些模型的相關信息

CRS 模型 ReDial
KBRD
KGSF
TG-ReDial
×


×
×
×
×
推薦模型 Popularity
GRU4Rec
SASRec
TextCNN
R-GCN
BERT
×
×
×
×

×
×
×
×
×
×
對話模型 HERD
Transformer
GPT-2
×
×
×
×
×
策略模型 PMI
MGCG
Conv-BERT
Topic-BERT
Profile-BERT
×
×
×
×
×
×
×


類別 模型 Graph Neural Network Pre-training Model

多樣的標準評測

我們支持一系列被廣泛使用的評估方式來測試和比較不同的 CRS。針對對話推薦中包含的各個子任務(推薦,對話,策略),我們分別設計了對應的評測方法,供直接用戶使用,如下表所示:

推薦任務 Hit@{1, 10, 50}, MRR@{1, 10, 50}, NDCG@{1, 10, 50}
對話任務 PPL, BLEU-{1, 2, 3, 4}, Embedding Average/Extreme/Greedy, Distinct-{1, 2, 3, 4}
策略任務 Accuracy, Hit@{1,3,5}
類別 指標

這里的推薦任務的若干指標均為常用的基于排序的指標;對話任務的指標包括評估概率分布(PPL),關聯度(BLEU,Embedding)和多樣性(Distinct)的指標;由于對話推薦系統中的策略往往不盡相同,這里我們采用常用的Accuracy和Hit來進行評估。

此外,我們還提供了人機交互接口,用戶可以直接通過特定的接口函數和命令和自己搭建的對話推薦系統進行交互,進而分析其中的的bad case等,也可以幫助初學者掌握系統的運行流程。

便捷的使用方法

我們為新手提供了簡單而靈活的配置,以快速啟動集成在 CRSLab 中的模型。對于已經集成的模型和數據集,可以直接使用命令行進行調用,使用以下命令,系統將依次完成數據的預處理,以及各模塊的訓練、驗證和測試,并得到指定的模型評測結果:

pythonrun_crslab.py--configconfig/kgsf/redial.yaml

如果您希望保存數據預處理結果與模型訓練結果,可以使用如下命令:

pythonrun_crslab.py--configconfig/kgsf/redial.yaml--save_data--save_system

總的來說,run_crslab.py有如下參數可供調用:

--config 或 -c:配置文件的相對路徑,以指定運行的模型與數據集。

--save_data 或 -sd:保存預處理的數據。

--restore_data 或 -rd:從文件讀取預處理的數據。

--save_system 或 -ss:保存訓練好的 CRS 系統。

--restore_system 或 -rs:從文件載入提前訓練好的系統。

--debug 或 -d:用驗證集代替訓練集以方便調試。

--interact 或 -i:與你的系統進行交互的對話。

如果希望調節模型或數據集的參數設置,可以直接對yaml文件進行更改,其提供了相比較于命令行更方便的編輯功能,具體的各項參數定義在文檔中已經給出。

安裝與使用

CRSLab 可以在以下幾種系統上運行:

Linux

Windows 10

macOS X

CRSLab 需要在 Python 3.6 或更高的環境下運行。CRSLab 要求 torch 版本在 1.4.0 及以上,如果用戶想在 GPU 上運行 CRSLab,請確保你的 CUDA 版本或者 CUDAToolkit 版本在 9.2 及以上。

提醒:因為用戶可能會因為未正確配置PyTorch,PyTorch Geometric等環境而導致無法使用,這里我們提供了詳細的從零開始的安裝流程,確保大家能夠順利安裝。

安裝 PyTorch

使用 PyTorch 本地安裝命令或者先前版本安裝命令安裝 PyTorch,比如在 Linux 和 Windows 下:

#CUDA10.1 pipinstalltorch==1.6.0+cu101torchvision==0.7.0+cu101-fhttps://download.pytorch.org/whl/torch_stable.html #CPUonly pipinstalltorch==1.6.0+cputorchvision==0.7.0+cpu-fhttps://download.pytorch.org/whl/torch_stable.html

安裝完成后,如果你想在 GPU 上運行 CRSLab,請確保如下命令輸出True:

$python-c"importtorch;print(torch.cuda.is_available())" >>>True

安裝 PyTorch Geometric

確保安裝的 PyTorch 版本至少為 1.4.0:

$python-c"importtorch;print(torch.__version__)" >>>1.6.0

找到安裝好的 PyTorch 對應的 CUDA 版本:

$python-c"importtorch;print(torch.version.cuda)" >>>10.1

安裝相關的包:

pipinstalltorch-scatter-fhttps://pytorch-geometric.com/whl/torch-${TORCH}+${CUDA}.html pipinstalltorch-sparse-fhttps://pytorch-geometric.com/whl/torch-${TORCH}+${CUDA}.html pipinstalltorch-cluster-fhttps://pytorch-geometric.com/whl/torch-${TORCH}+${CUDA}.html pipinstalltorch-spline-conv-fhttps://pytorch-geometric.com/whl/torch-${TORCH}+${CUDA}.html pipinstalltorch-geometric

其中${CUDA}和${TORCH}應使用確定的 CUDA 版本(cpu,cu92,cu101,cu102,cu110)和 PyTorch 版本(1.4.0,1.5.0,1.6.0,1.7.0)來分別替換。比如,對于 PyTorch 1.6.0 和 CUDA 10.1,輸入:

pipinstalltorch-scatter-fhttps://pytorch-geometric.com/whl/torch-1.6.0+cu101.html pipinstalltorch-sparse-fhttps://pytorch-geometric.com/whl/torch-1.6.0+cu101.html pipinstalltorch-cluster-fhttps://pytorch-geometric.com/whl/torch-1.6.0+cu101.html pipinstalltorch-spline-conv-fhttps://pytorch-geometric.com/whl/torch-1.6.0+cu101.html pipinstalltorch-geometric

安裝 CRSLab

gitclonehttps://github.com/RUCAIBox/CRSLab&&cdCRSLab pipinstall-e.

快速測試

從 GitHub 下載 CRSLab 后,可以使用提供的腳本進行簡單的測試:

pythonrun_crslab.py--configconfig/kgsf/redial.yaml

系統將依次完成數據的預處理,以及各模塊的訓練、驗證和測試,并得到指定的模型評測結果。

結果展示

我們在 TG-ReDial 數據集上對模型進行了訓練和測試,并記錄了在三個任務上的評測結果。其中效果最好的模型是基于圖神經網絡的KGSF和基于預訓練的TG-ReDial模型。

推薦任務

SASRec 0.000446 0.00134 0.0160 0.000446 0.000576 0.00114 0.000445 0.00075 0.00380
TextCNN 0.00267 0.0103 0.0236 0.00267 0.00434 0.00493 0.00267 0.00570 0.00860
BERT 0.00722 0.00490 0.0281 0.00722 0.0106 0.0124 0.00490 0.0147 0.0239
KBRD 0.00401 0.0254 0.0588 0.00401 0.00891 0.0103 0.00401 0.0127 0.0198
KGSF 0.00535 0.0285 0.0771 0.00535 0.0114 0.0135 0.00535 0.0154 0.0259
TG-ReDial 0.00793 0.0251 0.0524 0.00793 0.0122 0.0134 0.00793 0.0152 0.0211
Model Hit@1 Hit@10 Hit@50 MRR@1 MRR@10 MRR@50 NDCG@1 NDCG@10 NDCG@50

生成任務

HERD 0.120 0.0141 0.00136 0.000350 0.181 0.369 0.847 1.30 0.697 0.382 0.639 472
Transformer 0.266 0.0440 0.0145 0.00651 0.324 0.837 2.02 3.06 0.879 0.438 0.680 30.9
GPT2 0.0858 0.0119 0.00377 0.0110 2.35 4.62 8.84 12.5 0.763 0.297 0.583 9.26
KBRD 0.267 0.0458 0.0134 0.00579 0.469 1.50 3.40 4.90 0.863 0.398 0.710 52.5
KGSF 0.383 0.115 0.0444 0.0200 0.340 0.910 3.50 6.20 0.888 0.477 0.767 50.1
TG-ReDial 0.125 0.0204 0.00354 0.000803 0.881 1.75 7.00 12.0 0.810 0.332 0.598 7.41
Model BLEU@1 BLEU@2 BLEU@3 BLEU@4 Dist@1 Dist@2 Dist@3 Dist@4 Average Extreme Greedy PPL

策略任務

MGCG 0.591 0.818 0.883 0.591 0.680 0.683 0.591 0.712 0.729
Conv-BERT 0.597 0.814 0.881 0.597 0.684 0.687 0.597 0.716 0.731
Topic-BERT 0.598 0.828 0.885 0.598 0.690 0.693 0.598 0.724 0.737
TG-ReDial 0.600 0.830 0.893 0.600 0.693 0.696 0.600 0.727 0.741
Model Hit@1 Hit@10 Hit@50 MRR@1 MRR@10 MRR@50 NDCG@1 NDCG@10 NDCG@50

未來展望

對話推薦系統在未來肯定還會有更多工作,而且我們的CRSLab也有許多需要繼續完善的地方。我們AI BOX團隊將會持續開發維護CRSLab,保持版本穩定,并不斷加入更多更新的模型和數據集。期待各位讀者能夠提供寶貴意見。

責任編輯:xj

原文標題:CRSLab:可能是最適合你的對話推薦系統開源庫

文章出處:【微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 開源
    +關注

    關注

    3

    文章

    3398

    瀏覽量

    42652
  • 深度學習
    +關注

    關注

    73

    文章

    5512

    瀏覽量

    121426
  • 對話系統
    +關注

    關注

    0

    文章

    7

    瀏覽量

    2193

原文標題:CRSLab:可能是最適合你的對話推薦系統開源庫

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    開源AI模型是干嘛的

    開源AI模型是指那些公開源代碼、允許自由訪問和使用的AI模型集合。這些模型通常經過訓練,能夠執行特定的任務。以下,是對開源AI模型的詳細
    的頭像 發表于 12-14 10:33 ?244次閱讀

    開源能帶我們走向何方

    開源大模型、開源數據、開源框架、開源硬件......近些年,這些詞匯不絕于耳。雷軍說,好的代碼
    的頭像 發表于 12-06 17:09 ?509次閱讀

    芯原股份與開源圖形LVGL達成戰略合作

    芯原股份 (芯原,股票代碼:688521.SH) 今日宣布與嵌入式系統領域領先的開源圖形LVGL達成戰略合作,在LVGL中支持芯原的低功
    的頭像 發表于 11-29 09:20 ?404次閱讀

    科技云報到:假開源真噱頭?開源大模型和你想的不一樣!

    科技云報到原創。 25年前,著名的計算機程序員、開源軟件運動旗手Eric S·Raymond出版了《大教堂與集市》一書,首次提出了開放源代碼(Open Source)的概念,提倡軟件源代碼能被任何人
    的頭像 發表于 11-03 10:46 ?260次閱讀

    “小滿”V24.10源代碼在AtomGit開源

    近日,由中國汽車工業協會指導,普華基礎軟件股份有限公司主辦的“小滿”安全車控操作系統開源發布會暨共建計劃說明會成功舉行。普華基礎軟件宣布將安全車控操作系統“小滿”(簡稱“小滿”)V24.10源
    的頭像 發表于 10-27 14:41 ?491次閱讀

    人民郵電報:“開源”到底是什么?為啥熱度越來越高?

    ? ? ? 本文轉載自人民郵電報 這些年,“開源”這個詞越來越火,開源AI大模型、開源數據、開源框架、
    的頭像 發表于 10-17 14:21 ?577次閱讀
    人民郵電報:“<b class='flag-5'>開源</b>”到底是什么?為啥熱度越來越高?

    開放原子開源數據生態論壇成功舉辦

    以“開源生態筑基礎,數字經濟鑄未來”為主題的2024全球數字經濟大會——開放原子開源數據生態論壇在北京成功舉辦。開放原子開源基金會副秘書長辛曉華出席并致辭,北京市經濟和信息化局信息化
    的頭像 發表于 09-24 10:36 ?496次閱讀

    Matepad pro12.2 已上市半個月,但是還沒有在開源網站看到該項目的開源信息,違背開源精神

    任何該項目的開源計劃,違背開源精神 按照開源社區 licsence和公共開源licsence要求,對應
    發表于 08-27 17:25

    阿里云與中興通訊達成開源數據合作

    近日,阿里云與中興通訊宣布達成開源數據領域的深度合作。中興通訊正式加入PolarDB開源社區,并榮任首屆理事會成員單位,這一舉措標志著兩大科技巨頭在數據領域的合作邁向新的高度。
    的頭像 發表于 05-17 10:47 ?602次閱讀

    阿里云與中興通訊達成開源數據合作,助推國產數據發展

    據悉,阿里云與中興通訊于5月16日公布了開源數據合作事宜。中興通訊正式宣布加入PolarDB開源社區,并擔任首屆理事會成員單位。
    的頭像 發表于 05-16 16:34 ?506次閱讀

    開源鴻蒙】下載OpenHarmony 4.1 Release源代碼

    本文介紹了如何下載開源鴻蒙(OpenHarmony)操作系統 4.1 Release版本的源代碼,該方法同樣可以用于下載OpenHarmony最新開發版本(master分支)或者4.0 Release、3.2 Release等發
    的頭像 發表于 04-27 23:16 ?1021次閱讀
    【<b class='flag-5'>開源</b>鴻蒙】下載OpenHarmony 4.1 Release源<b class='flag-5'>代碼</b>

    打造開源鴻蒙生態,國產操作系統迎“轉折之戰”?| 深圳衛視獨家對話深開鴻王成錄

    作為正在崛起的國產操作系統開源鴻蒙到底有哪些優勢?深圳衛視《大灣區會客廳》主持人何嘉琪獨家對話深開鴻CEO王成錄博士。探究為什么發展自主操作系統勢在必行?
    的頭像 發表于 04-20 08:32 ?548次閱讀
    打造<b class='flag-5'>開源</b>鴻蒙生態,國產操作<b class='flag-5'>系統</b>迎“轉折之戰”?| 深圳衛視獨家<b class='flag-5'>對話</b>深開鴻王成錄

    SDK5開源高頻注入的頭文件怎么沒有?

    ST SDK5開源,高頻注入的頭文件怎么沒有?只有。c文件。怎么能夠獲得?
    發表于 04-17 07:37

    谷歌大型模型終于開放源代碼,遲到但重要的開源戰略

    在人工智能領域,谷歌可以算是開源的鼻祖。今天幾乎所有的大語言模型,都基于谷歌在 2017 年發布的 Transformer 論文;谷歌的發布的 BERT、T5,都是最早的一批開源 AI 模型。
    發表于 02-22 18:14 ?487次閱讀
    谷歌大型模型終于開放源<b class='flag-5'>代碼</b>,遲到但重要的<b class='flag-5'>開源</b>戰略

    一個成熟且可靠的開源實時操作系統

    市場上有許多專有和開源實時操作系統(RTOS)。ThreadX已經以其對小代碼大小和高性能的關注而聞名。然而,它的競爭優勢遠遠超出了這些屬性。
    的頭像 發表于 02-20 12:26 ?934次閱讀
    主站蜘蛛池模板: 成人a视频在线观看 | 欧美人与善交大片 | 伦 乱真实故事 | 7756短视频| 国产精品久久久久久无码专区 | 99久久精品免费精品国产 | 热中文热国产热综合 | 男人都懂www深夜免费网站 | 日韩一区二区在线免费观看 | 精品无码国产自产在线观看水浒传 | 全黄h全肉细节文在线观看 全黄H全肉细节文短篇 | 中文字幕视频在线免费观看 | 蜜桃精品成人影片 | 鸡鸡插屁股| 秋霞三级理伦免费观看 | 亚洲色综合狠狠综合区 | 国产美女又黄又爽又色视频网站 | 狠狠人妻久久久久久综合九色 | 国产一区免费在线观看 | 欧美人妇无码精品久久 | 午夜在线视频国产极品片 | 国产精品高清视亚洲一区二区 | 成人高清护士在线播放 | 亚洲精品天堂在线 | 亚洲色爽视频在线观看 | 亚洲mv在线观看 | 日韩欧美群交P内射捆绑 | 双性h浪荡受bl | 好姑娘BD高清在线观看免费 | 她也色在线视频站 | 麒麟色欧美影院在线播放 | 翘臀少妇被扒开屁股日出水爆乳 | 亚洲高清国产品国语在线观看 | 国产精品久AAAAA片 | 67194在线入口免费 | 扒开粉嫩的小缝末成年小美女 | 天堂精品国产自在自线 | 亚洲成人免费在线 | 妹妹好色网 | 阴茎插入阴道 | 久热在线这里只有精品7 |