我們和大家分享了哪些問題適合于用機(jī)器學(xué)習(xí)來(lái)解決。在明確了問題之后我們就需要來(lái)解決問題,本文要描述的是產(chǎn)品經(jīng)理在開發(fā)機(jī)器學(xué)習(xí)產(chǎn)品時(shí)所需要的能力。
第一部分提到產(chǎn)品經(jīng)理的核心能力并不會(huì)因?yàn)閼?yīng)用到機(jī)器學(xué)習(xí)技術(shù)而改變,而只是在某些方面需要有所加強(qiáng)。產(chǎn)品經(jīng)理一般需要五種核心能力,包括客戶共情/設(shè)計(jì)分解,溝通、合作、商業(yè)策略和技術(shù)理解力。在機(jī)器學(xué)習(xí)領(lǐng)域需要增強(qiáng)的可能是技術(shù)方面的理解能力,因?yàn)楫a(chǎn)品經(jīng)理需要理解機(jī)器學(xué)習(xí)系統(tǒng)的操作才能做出較好的產(chǎn)品決策。你可以向工程師學(xué)習(xí)也可以通過(guò)書本和網(wǎng)絡(luò)教程充電。但如果你對(duì)機(jī)器學(xué)習(xí)系統(tǒng)的運(yùn)行沒有很好的理解,那么你的產(chǎn)品很可能會(huì)遇到很多問題。
算法的局限性
機(jī)器學(xué)習(xí)使用的每一個(gè)算法都基于特定的任務(wù)進(jìn)行優(yōu)化,無(wú)法覆蓋真實(shí)情況下每一個(gè)細(xì)微的差別。理解算法的能力和局限將會(huì)幫助你把握住用戶體驗(yàn)中存在的差距,并且通過(guò)優(yōu)化產(chǎn)品設(shè)計(jì)或算法來(lái)解決。這是作為產(chǎn)品經(jīng)理必須要掌握的能力。關(guān)于算法的不足我們用幾個(gè)例子來(lái)說(shuō)明。
數(shù)據(jù)中的偏差
機(jī)器學(xué)習(xí)算法從數(shù)據(jù)中學(xué)習(xí)模式,所以數(shù)據(jù)的質(zhì)量決定了算法的表現(xiàn)。機(jī)器學(xué)習(xí)產(chǎn)品需要面對(duì)的第一個(gè)挑戰(zhàn)便是這些數(shù)據(jù)要能夠充分代表你的用戶。有一個(gè)很負(fù)面的例子,就是google將黑人兄弟識(shí)別成了大猩猩。
所以保證數(shù)據(jù)代表你所有的用戶是產(chǎn)品成功的關(guān)鍵。有時(shí)候偏差的存在并不是來(lái)自于數(shù)據(jù)收集的錯(cuò)誤,而是數(shù)據(jù)固有的特性。就像IBM沃森利用俚語(yǔ)的都市字典進(jìn)行訓(xùn)練后會(huì)輸出惡毒的語(yǔ)言一樣。我們期待的是輸出禮貌的語(yǔ)言,但機(jī)器學(xué)習(xí)卻學(xué)到了語(yǔ)言集中不好的部分。所以在精訓(xùn)練的時(shí)候需要對(duì)數(shù)據(jù)進(jìn)行一定的清晰。
另一個(gè)例子,一般發(fā)達(dá)國(guó)家的互聯(lián)網(wǎng)人數(shù)相較于發(fā)展中國(guó)家多。如果你基于搜索次數(shù)對(duì)搜索習(xí)慣進(jìn)行建模的話,就會(huì)得到發(fā)達(dá)國(guó)家更多的結(jié)果,那么建模就不能準(zhǔn)確的反映各國(guó)人民的上網(wǎng)習(xí)慣了,例如非洲的用戶。對(duì)于數(shù)據(jù)偏差的審視將幫助你意識(shí)到產(chǎn)品不希望出現(xiàn)的用戶體驗(yàn)。
精度和召回率的權(quán)衡
例如兩個(gè)團(tuán)隊(duì)利用相同的預(yù)測(cè)產(chǎn)品預(yù)測(cè)有害行為,但團(tuán)隊(duì)的目標(biāo)卻各不相同。一個(gè)團(tuán)隊(duì)僅僅想要識(shí)別出有害行為的人,而不管行為良好的人,他們希望每個(gè)良好行為的人都來(lái)用這個(gè)產(chǎn)品,所以精度對(duì)于這個(gè)團(tuán)隊(duì)就十分重要。而另一個(gè)各團(tuán)隊(duì)則僅僅只讓行為良好的人使用,即使限制了少數(shù)行為良好的人也在所不辭,所以他們更注重的是召回率。精確率和召回率是兩個(gè)此消彼長(zhǎng)的指標(biāo)。你需要針對(duì)用戶需求的實(shí)際情況來(lái)確定有限考慮哪一個(gè)指標(biāo)。下面的曲線反應(yīng)了召回率和精度的關(guān)系。
根據(jù)不同的問題,可以通過(guò)調(diào)節(jié)是的模型具有不同的召回率和精度分布。同時(shí)使用不同類型的模型也可以改變曲線的分布情況。
冷啟動(dòng)
冷啟動(dòng)是來(lái)自于汽車發(fā)動(dòng)機(jī)的一個(gè)術(shù)語(yǔ),發(fā)動(dòng)機(jī)需要預(yù)熱后才能達(dá)到較好的表現(xiàn)。這對(duì)于機(jī)器學(xué)習(xí)來(lái)說(shuō)也是一樣的,當(dāng)機(jī)器學(xué)習(xí)面對(duì)新用戶或者新數(shù)據(jù)時(shí)也需要一個(gè)預(yù)熱過(guò)程來(lái)達(dá)到較優(yōu)的表現(xiàn)。
從用戶出發(fā):這樣的情況一般發(fā)生在新用戶第一次使用產(chǎn)品的時(shí)候,模型對(duì)于用戶還沒有任何的了解。例如網(wǎng)站一般都能像用戶推薦一些喜歡的內(nèi)容,但第一次使用網(wǎng)站時(shí)網(wǎng)站并不知知道你的喜好所以算法很難給出個(gè)性化的推薦。這樣的情況一般通過(guò)下面三種方法解決:
1.給用戶從隨機(jī)推薦的數(shù)據(jù)中做出預(yù)先的偏好選項(xiàng);
2.根據(jù)地理位置等基本信息為用戶分類,并基于人群偏好給出推薦;
3.用戶手動(dòng)設(shè)置自己的偏好類型。
從實(shí)例出發(fā):這樣的情況一般發(fā)生在某個(gè)新產(chǎn)品第一次上線的時(shí)候,例如商品、電影等。例如Netflix上新上線的電影很難做出向哪類用戶推薦的選擇,特別是在電影元數(shù)據(jù)缺失的情況下。和用戶出發(fā)的解決方式相同,主要有兩種方法:
1.人工標(biāo)注,請(qǐng)專家分類并補(bǔ)充電影元數(shù)據(jù),這樣就能想匹配的人群推薦;
2.基于算法,用算法記錄對(duì)新產(chǎn)品感興趣的用戶,并根據(jù)這些信息不斷收縮用戶范圍。
反饋閉環(huán)
由于算法并不完美,可能會(huì)得出錯(cuò)誤的預(yù)測(cè)或者識(shí)別結(jié)果。這就需要我們?yōu)楫a(chǎn)品設(shè)計(jì)一種反饋機(jī)制來(lái)對(duì)算法提供反饋,這樣就可以使得算法隨著時(shí)間不斷改進(jìn)。反饋的形式多種多樣,可以簡(jiǎn)單的記錄下負(fù)樣本的信號(hào),例如記錄下用戶滾動(dòng)頁(yè)面的速度或者閱讀停留時(shí)長(zhǎng)。更為精確的方法是設(shè)計(jì)在算法失效的時(shí)候讓用戶主動(dòng)介入的機(jī)制,例如給出差評(píng)或者忽略預(yù)測(cè),當(dāng)算法給出好結(jié)果時(shí)給予好評(píng)。
充分利用/探索新世界
我們用信息分發(fā)推薦業(yè)務(wù)作為例子。如果網(wǎng)站算法發(fā)現(xiàn)我比較喜歡足球,那么在給我推薦電影或者相關(guān)文章的時(shí)候就會(huì)主要推薦與足球相關(guān)的內(nèi)容。這時(shí)候網(wǎng)站就充分利用了我喜歡足球這一特征,不斷的給我推薦相關(guān)內(nèi)容。但這種方式的弊端在于,我還有其他感興趣的內(nèi)容,但算法把我和他們隔絕開來(lái)了。大家可能還記得以前新聞app總是給你推薦看過(guò)內(nèi)容類似的新聞,甚至有時(shí)候負(fù)新聞不絕于耳,這意味著算法出現(xiàn)了較大的偏差,這樣的filter bubble在媒體行業(yè)中很常見。
那么為了解決這一狀況需要給用戶以探索新內(nèi)容的機(jī)會(huì),給用戶周期性的呈現(xiàn)隨機(jī)的探索內(nèi)容,并根據(jù)用戶的喜好來(lái)糾正用戶偏好模型。
以上對(duì)于算法局限性的闡述并不完全,由于新的算法不斷產(chǎn)生,可能會(huì)不斷產(chǎn)生新的問題。我們?nèi)绾尾拍馨l(fā)現(xiàn)算法的這些問題和局限呢?下面為產(chǎn)品經(jīng)理總結(jié)了三個(gè)有用的tips:
1.為工程師團(tuán)隊(duì)提供清晰的用戶使用場(chǎng)景。與工程師團(tuán)隊(duì)一起討論,并讓他們明白期待的用戶體驗(yàn)是什么樣的。用戶樣例不僅需要包含主要和次要的用戶,更需要包括反面用戶。當(dāng)模型準(zhǔn)備好后,需要針對(duì)這些用戶樣例進(jìn)行評(píng)估。
2.關(guān)注數(shù)據(jù)的收集過(guò)程。對(duì)數(shù)據(jù)的清洗和組織方式保持清醒,并確保數(shù)據(jù)能夠代表你的用戶。
3.利用產(chǎn)品方案縮小差距。如果模型達(dá)不到期望的數(shù)據(jù),我們需要考察是否能夠改進(jìn)模型的能力,或者用新的用戶樣例增強(qiáng)模型的表示,隨后創(chuàng)建新的產(chǎn)品解決方案來(lái)彌補(bǔ)這一差距。
-
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8438瀏覽量
132938
原文標(biāo)題:想要參與開發(fā)一款機(jī)器學(xué)習(xí)產(chǎn)品,你需要get哪些技能?
文章出處:【微信號(hào):thejiangmen,微信公眾號(hào):將門創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論