基于用戶畫像,根據每個用戶使用路徑與個人偏好推薦內容已經成為內容類產品常見的功能模式,也是提升活躍度與轉化率最有效的方式之一。
在之前的課程中,我們介紹了用戶畫像的定義、標簽體系與創建過程,本期課程則重點介紹幾種不同的推薦模式與優缺點。
常見的推薦邏輯
根據用戶信息進行推薦,用戶進入產品后需要完善個人信息及選擇興趣標簽,系統根據用戶的個人信息(年齡、性別、地域)及所選興趣標簽與內容匹配,推薦內容標簽匹配度高的內容。
這種推薦模式的優點在于技術門檻低,由產品經理自己設計一套推薦規則就可以實現。但缺點也很明顯,一方面用戶會不停收到相似的內容,很難拓展新的關注點,另一方面,內容生產商會根據推薦機制針對性設置內容的標簽、關鍵字等信息,將低質量的內容推薦給用戶,造成用戶流失。
基于大數據的推薦模式
該模式的核心在于,通過建立較復雜用戶畫像模型,收集各種途徑收集用戶行為數據。根據用戶業務數據生成用戶畫像,計算用戶畫像相似度,對用戶畫像進行分組。通過內容標簽與用戶畫像標簽離線計算推薦內容。
該推薦模式主要包含用戶畫像建模、用戶畫像聚類、內容標簽、內容推薦四個階段。
用戶畫像建模
1、分析業務模型, 建立標簽體系, 確定標簽取值范圍
2、分析標簽值的數據來源, 按需收集數據, 計算標簽值
3、存儲用戶畫像數據, 并及時更更新
用戶畫像最終的結果是往往是?張表,每行為一個用戶的用戶畫像,存儲了用戶對應的每個標簽值。
例子:
用戶畫像聚類
選擇合適的聚類算法, 計算每個用戶畫像的相似度, 為用戶分組
常見的聚類算法:
層次化: 最近鄰方法, 最遠鄰方法, 組內聚類法, 組間聚類法, Ward聚類法, 正?進制法, 粗聚類算法
劃分式: 圖論算法, K均值算法, 模糊C均值
基于密度和網格: GDILC 算法, SGC算法, GCHL算法, TFCTMO算法, ST-DBSCAN
其它: ACODF
該部分內容由算法經理主導,作為產品經理不用參與。
內容標簽
為了能把內容推薦給用戶, 需要為每個內容打上相應的標簽, 把內容標簽化。
與用戶畫像類似, 需要根據業務目標來給內容打標簽。
內容推薦
主要有三種推薦方法。
1、協同過濾推薦方法
基于用戶的協同過濾: 用戶A喜歡A內容, 那么跟用戶A類似的用戶B也喜歡A內容
基于內容的協同過濾: 用戶A喜歡A內容, 那么同樣喜歡A內容的用戶B喜歡的內容B?用戶A也喜歡。
優勢:
有效的使?用其它用戶的反饋信息, 提高準確度
基于用戶相似推薦可以發現?用戶的潛在興趣, 增加推薦的多樣性
劣勢:
用戶和物品存在冷啟動問題, 新?用戶新內容沒有行為數據, 所以無法做出推薦,可解釋性不穩定, 因為不對內容做分析, 所以無法根據深層特征和修改來推薦。
相關算法:
關系矩陣及矩陣計算:用戶關系 U-U 矩陣、內容關系 V-V 矩陣、用戶-內容 U-V 矩陣
基于記憶的協同過濾算法
基于模型的協同過濾算法:基于隱因子模型的推薦算法、基于樸素貝葉斯分類的推薦算法。
2、基于內容的推薦方法:
用戶喜歡內容A , 那么跟內容A 類似的內容B 用戶也喜歡
優勢:
用戶間相互獨立獨立, 只依賴單人偏好
因為內容類似, 所以推薦的內容直觀上很容易解釋
新內容不存在冷啟動問題, 因為只要內容相似就能被推薦
劣勢:
對內容標簽要求高
不利于挖掘用戶的潛在興趣
存在新用戶冷啟動問題
3、基于知識的推薦方法:
用大量的數據, 訓練專家模型, 用專家來對用戶偏好推薦
混合推薦方法: 根據業務場景, 將以上方法進行混合, 優化推薦結果。
并行:
加權式——對多個結果加權計算獲得最終結果
切換式——根據場景使用不同的方法
混雜——同時用以上兩種
串行:
層疊式——基于?個推薦結果再做?次推薦
級聯式——將?種推薦學習到的模型作為另?推薦的輸入
小結
基于大數據的推薦模式,可以有效實現"千人千面"的推薦模式,為用戶不斷輸送感興趣的內容,并挖掘用戶潛在興趣點。
對于沒有使用的記錄的新用戶,則采用常規推薦模式,當有了記錄后根據用戶行為進行大數據推薦。
具體采用怎樣的推薦模式,則需要產品經理根據產品特性結合企業的實際技術能力進行選擇。
-
大數據
+關注
關注
64文章
8905瀏覽量
137638
發布評論請先 登錄
相關推薦
評論