色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

自制Word2Vec圖書推薦系統,幫你找到最想看的書!

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-09-25 08:53 ? 次閱讀

最近有開發者自制了一套圖書推薦系統,使用Word2Vec算法將書目表示為向量,可以同時獲得幾種書籍的推薦結果,并獲得書籍的TSNE圖及相似度最高的推薦。圖書數據來自GoodReads上的評價最高的前10000本書。開發者表示,采用較小的batchsize和長度可變的窗口可提升推薦相似度。

近日,有開發人員自制了一套圖書推薦系統,使用Word2Vec算法將書目表示為向量,可以同時獲得幾種書籍的推薦,并獲得書籍的TSNE圖以及相似度最高的推薦信息。訓練數據來自GoodReads上的評價最高的前10000本書。

作者將這一系統在Reddit論壇上進行了算法介紹和推薦效果圖分享,引發廣泛討論。我們不妨來看看這個自制薦書系統是怎么做的。

以下是作者自己給出的系統展示和介紹,最后是技術實現環節的相關討論。

下面的圖片來自兩個2D TSNE生成的圖書嵌入圖。第一部分是數據中最常出現的3000本書的TNSE(已經過10000本書的數據訓練),第二部分是全部10000本書的TSNE。

我做了兩個TSNE圖,因為隨著書籍書目的增加,推薦的準確度趨于下降,所以我想查看最常出現的書籍的分布圖,然后再處理其余的書。

首先最常出現的3000本書的TSNE圖,先給出幾個局部放大圖,最后放上全圖。

下圖為作于最近30-40年間的奇幻/古典奇幻類書

中間的部分大部分是漫畫書,周圍是一些科學類書籍

宇宙科幻類:

喜劇類(主要是電視劇)

全圖

然后是全部10000本書的TSNE圖,同樣先給出幾個局部圖,最后是全圖。

歷史類書籍。圖左半部為美國史,右半部為世界通史

宇宙史和起源理論

兒童經典書目

食品科學和新聞類

Word2Vec薦書系統的技術實現

下面是一些技術上的實現要點,對機器學習感興趣的小伙伴們可以關注一下。

1、使用較小的batch size

訓練中使用batch size較?。?2和64)對于確保所有書籍向量的穩健性非常重要。在更高的batch size(128、256和512)下,大多數向量具有相當的相似性,但似乎總是有一些書的向量不具備相似性。

以《哈利·波特》2-7部的推薦結果為例,如果直接查看數據,很容易知道與這些書相似度最高的書應該是該系列中的其他《哈利·波特》書,但最初推薦模型給出的相似圖書結果并非如此。但是,在把batch size設置為64后,推薦結果的相似度很快得到明顯改善。

由于平均窗口大小為112,并在20到200之間變化(取決于用戶閱讀的書籍數量),因此像《哈利·波特》這樣的系列叢書中的一些書,很可能會與其他書籍匹配為相似了。

假設某系列叢書中共有7本書,并且用戶對所有7本書都進行了評分,該用戶還評價了112本其他書,那么,其中一本《哈利·波特》書與另一本《哈利·波特》在該用戶的標簽下實現配對的概率是6/112。

在這種情況下,由于word2vec試圖一次性優化多個嵌入,因此對于窗口大小很小且恒定的情況,更高的batch size會比word2vec算法的應用對結果優化造成更加明顯的阻礙。

2、Softmax嵌入向量算術

到目前為止,上面的所有矢量算術示例都是我在書籍輸入嵌入上執行加法和/或減法,然后針對softmax嵌入對結果矢量執行相似性結果的情況。比結果向量與輸入嵌入進行比較要穩健得多。

3、可變長度窗口(VLW)

最初的Word2Vec Cbow算法使用固定的窗口大小的單詞用作特定目標的輸入。比如,如果窗口大小是目標詞左側和右側的2個單詞,那么在這句“The cat in the hat”中,如果目標詞(標簽)是“in”,那么單詞'The ','cat','the'和'hat'將各自向量進行平均,并將得到的結果向量作為輸入。

而在這個薦書系統中,窗口大小不可能是固定的。對于特定數據點(輸入),由用戶輸入的所有對全部書籍的評價都可能作為潛在的輸入,而且每個用戶瀏覽過的書籍數量彼此存在很大差異,因此窗口大小不可能恒定。

盡管窗口大小不是恒定的,但是平均輸入向量的數量是保持不變的。所有提供的數據都使用兩個平均向量作為輸入,這樣向量的算術屬性的穩健性是最高的。改變輸入平均向量的數量,在相似性推薦屬性方面并沒有表現出明顯優勢。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4646

    瀏覽量

    93746
  • 機器學習
    +關注

    關注

    66

    文章

    8460

    瀏覽量

    133436

原文標題:【Reddit今日最火】Lit2Vec圖書推薦系統,自動推薦適合你的AI好書!

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    74LVC2G00雙路2輸入與非門規格

    電子發燒友網站提供《74LVC2G00雙路2輸入與非門規格.pdf》資料免費下載
    發表于 02-13 17:14 ?0次下載
    74LVC<b class='flag-5'>2</b>G00雙路<b class='flag-5'>2</b>輸入與非門規格<b class='flag-5'>書</b>

    74LVC2G38雙2輸入與非門規格

    電子發燒友網站提供《74LVC2G38雙2輸入與非門規格.pdf》資料免費下載
    發表于 02-12 15:17 ?0次下載
    74LVC<b class='flag-5'>2</b>G38雙<b class='flag-5'>2</b>輸入與非門規格<b class='flag-5'>書</b>

    74LVC2G86-Q100雙2輸入異或門規格

    電子發燒友網站提供《74LVC2G86-Q100雙2輸入異或門規格.pdf》資料免費下載
    發表于 02-11 14:14 ?0次下載
    74LVC<b class='flag-5'>2</b>G86-Q100雙<b class='flag-5'>2</b>輸入異或門規格<b class='flag-5'>書</b>

    Spire.Cloud.Word云端Word文檔處理SDK介紹

    Spire.Cloud.Word 是一款專業的云端 Word 文檔處理 SDK,開發人員使用它在云端創建、讀取、編輯、轉換和保存 Word 文檔。作為一款完全獨立的組件,運行環境無需安裝
    的頭像 發表于 02-11 11:11 ?159次閱讀
    Spire.Cloud.<b class='flag-5'>Word</b>云端<b class='flag-5'>Word</b>文檔處理SDK介紹

    二維碼掃描頭嵌入在圖書自助管理設備中的應用案例

    在當今數字化時代,二維碼掃描技術已廣泛應用于各行各業,其中,在圖書自助管理設備中的嵌入應用尤為引人注目。這不僅極大地提升了圖書館的服務效率與用戶體驗,還實現了圖書管理流程的智能化與自動化。以下將詳細
    的頭像 發表于 12-19 16:22 ?257次閱讀
    二維碼掃描頭嵌入在<b class='flag-5'>圖書</b>自助管理設備中的應用案例

    如何保障圖書館用電安全?——安科瑞 丁佳雯

    一、圖書館的安全挑戰? 圖書館作為公共場所,其電氣系統復雜且龐大,包括照明、空調、電腦、電子閱讀設備等眾多用電設備。這些設備在長時間運行過程中,可能會因老化、接觸不良或設計缺陷等原因產生故障電弧
    的頭像 發表于 12-13 14:34 ?235次閱讀
    如何保障<b class='flag-5'>圖書</b>館用電安全?——安科瑞 丁佳雯

    智慧圖書館能耗監測優化管理系統方案

    優化管理系統方案,旨在通過智能化手段實現對圖書館能耗的全面監測、精準分析與高效管理,有效減少能耗成本并提高能源利用效率。 通過在圖書館各區域配電室內部署物通博聯工業智能網關,實時采集智能電表數據,如電量、電壓
    的頭像 發表于 09-11 13:41 ?547次閱讀

    聚徽-什么是智能圖書

    智能圖書館(Intelligent Library,簡稱 IL)是把智能技術運用在圖書館建設之中形成的一種現代化建筑,是智能建筑與高度自動化管理的數字圖書館的有機結合和創新。它應同時具備兩者的設計思想、基本要求、特征和功能。智能
    的頭像 發表于 08-05 09:51 ?357次閱讀

    nlp自然語言處理模型有哪些

    : 詞嵌入(Word Embedding) 詞嵌入是將詞匯映射到高維空間的向量表示,使得語義相近的詞在向量空間中的距離更近。常見的詞嵌入模型有: Word2Vec:由Mikolov等人于2013年提出
    的頭像 發表于 07-05 09:57 ?978次閱讀

    雷拓科技云廣播助力江西省蘆溪縣新圖書館打造沉浸式觀展體驗!

    ?蘆溪縣圖書館新館位于江西省萍鄉市蘆溪縣古城山公園袁河西路,占地8畝,建筑面積1.1萬平方米,嚴格按照國家一級圖書館標準設計,集智能化、數字化、平臺化為一體,設立了自助辦證、借還一體機、智能書架
    的頭像 發表于 07-01 09:59 ?394次閱讀
    雷拓科技云廣播助力江西省蘆溪縣新<b class='flag-5'>圖書</b>館打造沉浸式觀展體驗!

    iPad版微軟Word新增頁面邊框功能,提升文檔美觀度

    微軟公司今日宣布,啟動 Microsoft 365 Insider 項目的 iPad 版 Word 應用程序的新功能測試活動——頁面邊框功能開發完成。此項便利有用的功能有助于提升文檔整體美感。
    的頭像 發表于 05-18 14:05 ?677次閱讀

    觸控屏密封試驗儀幫你找到產品漏點

    在現代電子設備中,觸控屏的應用日益廣泛,從智能手機、平板電腦到各種智能穿戴設備,都離不開觸控屏的支持。然而,觸控屏的密封性能對其使用壽命和穩定性有著至關重要的影響。密封性不佳可能導致水分、灰塵等雜質進入,影響觸控屏的使用效果甚至導致損壞。為了確保觸控屏的密封性能,采用觸控屏密封試驗儀進行檢測顯得尤為重要。本文將重點介紹如何使用觸控屏密封試驗儀對產品進行精準檢
    的頭像 發表于 05-15 11:36 ?382次閱讀
    觸控屏密封試驗儀<b class='flag-5'>幫你</b><b class='flag-5'>找到</b>產品漏點

    名單公布!【書籍評測活動NO.32】硬核科普《計算》,豆瓣評分9.8,榮膺圖書界至高獎項

    ,它還被中國開發者評選為 2023年年度IT圖書 ! 此外,本書在豆瓣上也收獲了大家眾多好評,獲得豆瓣評分9.8的高分! 這到底是怎樣的一本,如此備受專家和讀者共同推崇呢? 我們為什么需要《計算
    發表于 05-08 13:59

    如果通過物聯網技術提升學校圖書館管理水平

    、圖書借還情況和庫存情況,以確保安全和資源管理。 2.智能圖書定位與管理:在每本書上附加RFID標簽,通過RFID讀寫器實時跟蹤圖書位置和移動,提高
    的頭像 發表于 03-22 14:36 ?789次閱讀

    RFID智能書架:圖書館智能化管理的新趨勢

    智能書架,顧名思義,是一種集成了RFID技術的創新型書架。實現了圖書快速借還、快速盤點、查找、亂架圖書整理等功能,以RFID電子標簽作為信息存儲媒介并粘貼在圖書上,在RFID芯片中存儲該圖書
    的頭像 發表于 03-20 16:53 ?720次閱讀
    主站蜘蛛池模板: 国产精品99精品无码视亚 | 国产永不无码精品AV永久 | 日本特交大片免费观看 | 男人吃奶摸下挵进去啪啪 | 精品国产免费第一区二区 | 日本特交大片免费观看 | 真人做受120分钟免费看 | 人妻免费久久久久久久了 | 免费亚洲视频在线观看 | 国产麻豆91网在线看 | qovd电影| 久久99re6热在线播放 | 国产嫩草在线观看 | 奇米色偷偷 | 大桥未久电影在线观看 | 亚洲另类欧美综合在线 | 中文字幕在线永久 | www色视频在线观看 WWW色视频片内射 | 精品午夜久久影视 | 国产精品免费一区二区三区视频 | 御姐被吸奶 | 色翁荡息又大又硬又粗又爽电影 | 韩国伦理电影在线神马网 | a亚洲在线观看不卡高清 | 在线观看免费国产成人软件 | 国产精品爽爽久久久久久蜜桃网站 | 国产精品永久免费视频 | 办公室韩国电影免费完整版 | 99久久蜜臀亚洲AV无码精品 | 一二三四中文字幕在线看 | 色在线视频亚洲欧美 | a亚洲在线观看不卡高清 | 欧美午夜精品一区二区蜜桃 | 国产精品无码AV天天爽人妻蜜桃 | 国产精品亚欧美一区二区三区 | 亚洲美女视频高清在线看 | 玩弄放荡人妻一区二区三区 | 日韩高清特级特黄毛片 | 成年女人免费播放影院 | 欧美亚洲综合另类无码 | 久久久91精品国产一区二区 |