在 PC 時(shí)代以及移動(dòng)互聯(lián)網(wǎng)時(shí)代之后,人工智能正在成為人類下一個(gè)發(fā)展階段的主旋律。但隨著時(shí)代的更迭,人機(jī)交互的方式也在悄然發(fā)生著變化。
PC 時(shí)代的主角是鼠標(biāo)鍵盤,移動(dòng)互聯(lián)網(wǎng)時(shí)代是觸控,到了人工智能時(shí)代,語(yǔ)音和視覺則成為了一條全新的路徑,這同時(shí)也意味著人機(jī)交互的發(fā)展正在向著“以人為核心”的方向發(fā)生轉(zhuǎn)變。
從 2014 年成立至今,小魚在家已經(jīng)走過(guò)了四個(gè)年頭。在過(guò)去的幾年里,以人為核心的家庭應(yīng)用場(chǎng)景一直是其堅(jiān)持去做的事情,而陪伴、記錄以及助手這三個(gè)功能也始終貫穿在小魚在家各個(gè)產(chǎn)品中。
今年一月份,在美國(guó)舉辦的 CES 展會(huì)上,小魚在家聯(lián)合百度正式發(fā)布了擁有遠(yuǎn)程視頻通話以及語(yǔ)音交互功能的 VS1 智能視頻音箱。它不僅讓人機(jī)交互這件事情變得更加簡(jiǎn)單,同時(shí)也為家庭使用場(chǎng)景提供了更多的可能性。
那么,在人工智能時(shí)代,小魚在家是如何去思考人機(jī)交互這件事情的?新技術(shù)的應(yīng)用,又將為產(chǎn)品端帶來(lái)哪些全新的可能性?在極客公園舉辦的 Rebuild 2018 大會(huì)上,小魚在家創(chuàng)始人&CEO 宋晨楓給出了他的答案。
以下是小魚在家創(chuàng)始人&CEO 宋晨楓在極客公園 Rebuild 2018 科技商業(yè)峰會(huì)上的演講實(shí)錄
十年前我離開了微軟回到國(guó)內(nèi),第一次創(chuàng)業(yè),做的第一個(gè)公司是 3D 虛擬世界平臺(tái),這家公司在 2011 年的時(shí)候賣給 YY。2014 年我離開了 YY,創(chuàng)辦了小魚在家,希望用人工智能改變家庭生活。我們用了四年的時(shí)間,三個(gè)城市二百多號(hào)人,融資超過(guò)了 10 億元。今年我們跟百度推出了新產(chǎn)品,進(jìn)入到了現(xiàn)在的智能音箱市場(chǎng)。
隨著人工智能技術(shù)的不斷推演,我們實(shí)際上不斷重新定義我們這個(gè)產(chǎn)品,尋找真正能夠落地家庭的品類。我們篤定家庭這個(gè)場(chǎng)景,實(shí)際上有兩個(gè)最核心的原因。
第一個(gè)原因是中國(guó)家庭的問(wèn)題多、機(jī)會(huì)大,像我們 70、80、90 這一代獨(dú)生子女,大部分不和父母生活在一起,因?yàn)楹苊?,也沒有太多的時(shí)間陪伴孩子。實(shí)際上每個(gè)家庭都需要一個(gè)靠譜的家庭助手,最終形態(tài)可能就是機(jī)器人。大家在科幻作品里看到,不論是《鋼鐵俠》中的賈維斯,還是《西部世界》里的接待員,我愿意去相信,這個(gè)就是我們的未來(lái)。當(dāng)然還需要很多的時(shí)間和路徑實(shí)現(xiàn)它。
第二個(gè)原因,正是技術(shù)的進(jìn)步在給我們機(jī)會(huì)去重新定義產(chǎn)品,去重塑用戶體驗(yàn),再開創(chuàng)新的品類,技術(shù)才是這一切的根本驅(qū)動(dòng)力。過(guò)去的幾年,語(yǔ)音、語(yǔ)義、機(jī)器人視覺都有巨大的飛躍,我相信科技還會(huì)持續(xù)的以指數(shù)級(jí)的速度去發(fā)展。今天人工智能在算法、在算力、在數(shù)據(jù),都在快速演進(jìn)著。
創(chuàng)業(yè)公司要看五年,想三年,好好做好一兩年。我們希望我們進(jìn)入這個(gè)市場(chǎng)領(lǐng)域,發(fā)展到五年的時(shí)候,能進(jìn)入到爆發(fā)期。三年的時(shí)候已經(jīng)開始高速發(fā)展,這樣能夠讓我們提前兩年去探索、去驗(yàn)證,等機(jī)會(huì)來(lái)臨的時(shí)候,我們已經(jīng)準(zhǔn)備好了。
小魚在家用了三年的時(shí)間,做了 2.5 代的產(chǎn)品去驗(yàn)證,去理解用戶的需求,去提升我們的認(rèn)知,去補(bǔ)充我們的能力。在第三代產(chǎn)品的時(shí)候,小度在家?guī)林悄芤粝浒l(fā)布之后,我們基本上踩對(duì)了點(diǎn)。但這這個(gè)過(guò)程中,我們也犯過(guò)錯(cuò),我想把我們?nèi)绾嗡伎籍a(chǎn)品規(guī)劃和技術(shù)路線規(guī)劃的一些想法,分享給大家。
以用戶需求為導(dǎo)向,尋找差異化價(jià)值
先說(shuō)說(shuō)產(chǎn)品路線,一路走來(lái)我們都在行業(yè)的最前沿,沒有別人成功的經(jīng)驗(yàn)可以借鑒,只好被逼著去思考產(chǎn)品的最核心邏輯,要從用戶出發(fā),去考慮我們?cè)谀睦锟梢匀ソㄔO(shè)差異化的價(jià)值,并且還能夠遠(yuǎn)遠(yuǎn)超過(guò)用戶的預(yù)期。
第一代產(chǎn)品我們定位是家庭智能陪伴機(jī)器人,這代產(chǎn)品我們選的這個(gè)點(diǎn),就是一個(gè)一呼即通的家庭陪伴體驗(yàn),能夠讓在外的家人,通過(guò)他的手機(jī),三秒回到家里陪伴他的老人和孩子。第一代產(chǎn)品里面的助手,是一個(gè)非常輔助的功能,當(dāng)時(shí)的技術(shù)并不成熟,體驗(yàn)還非常的糟糕。我們的第一代產(chǎn)品,用戶的口碑非常好,但實(shí)際上銷量并沒有達(dá)到預(yù)期,后來(lái)我們總結(jié)有兩個(gè)錯(cuò)誤:
第一,我們沒有考慮成本,把產(chǎn)品做得太貴了,當(dāng)時(shí)賣 3000 多塊錢。
第二,就是這個(gè)品類的定位,我們一味的去追求實(shí)現(xiàn)我們作為產(chǎn)品經(jīng)理的一些想法,沒有考慮供應(yīng)鏈,結(jié)果就是把受眾縮小了。同時(shí),我們給用戶設(shè)置了非常高的心理預(yù)期,卻沒有達(dá)到。
第二代產(chǎn)品分身魚主要是解決我們的成本和定位的問(wèn)題。首先成本降了一半,然后我們嘗試了兩個(gè)定位,一個(gè)就是陪伴孩子,另外一個(gè)就是視頻通話。但我們最后還是放棄了這個(gè)產(chǎn)品。首先是孩子的留存比較難,其次是公司的資源有限,我們沒有辦法去拓展那么多的產(chǎn)品線。
通過(guò)前兩代產(chǎn)品,我們總結(jié)了三點(diǎn)經(jīng)驗(yàn):
第一,用戶對(duì)語(yǔ)音交互給他們帶來(lái)的便利性,其實(shí)是非常的認(rèn)可的。尤其是老人和孩子,他們?cè)诩依飼?huì)非常自然地開始和一個(gè)設(shè)備進(jìn)行語(yǔ)音對(duì)話。
第二,家庭場(chǎng)景里面的這種內(nèi)容消費(fèi)需求是巨大的,而電視和平板電腦其實(shí)只滿足了他們的部分需求。誰(shuí)能夠在家庭的場(chǎng)景下,能夠更加便捷地把家人所需要的內(nèi)容,更加快速準(zhǔn)確地推送,實(shí)際上有可能成為在家庭場(chǎng)景下,用戶消費(fèi)內(nèi)容的一個(gè)新寵。
第三,用戶最關(guān)注的價(jià)值,正是我們第一個(gè)產(chǎn)品做的「家庭的陪伴」。分離其實(shí)幾乎是中國(guó)家庭的常態(tài)了,能夠三秒鐘回到家里,完全顛覆了之前這種靠打電話然后等待接聽的這種體驗(yàn)。
我們?cè)谧龅谌a(chǎn)品的時(shí)候,其實(shí)語(yǔ)音技術(shù)已經(jīng)是相對(duì)成熟了,我們也看到在中國(guó)的市場(chǎng),智能音箱這個(gè)品類已經(jīng)有快速發(fā)展的苗頭,于是順勢(shì)進(jìn)入到這個(gè)平臺(tái)里面去。
小度在家是個(gè)百倍易用的帶屏智能音箱,在它身上語(yǔ)音交互、屏幕輔助,加上攝象頭的識(shí)別,這些能力組合產(chǎn)生了化學(xué)作用。它不但可以一目了然地把用戶詢問(wèn)的答案展示在他的面前,還可以把語(yǔ)音回答和屏幕展示動(dòng)態(tài)配合,比如說(shuō)你聽歌的時(shí)候可以滾動(dòng)歌詞,比如說(shuō)介紹一個(gè)人物的時(shí)候,顯示他的圖片。比如說(shuō)他念字發(fā)音的時(shí)候,把這個(gè)字的筆順顯示出來(lái)等,還可以告訴你有什么功能,接下來(lái)你可以怎么向它發(fā)問(wèn),去探索更加豐富的內(nèi)容和服務(wù)。我們這一次其實(shí)和百度的深度合作,也引入了非常有價(jià)值的內(nèi)容和服務(wù),比如說(shuō)百度搜索、百度地圖、百度百科、圖片等等。
小度在家還是一個(gè)智能小電視,我們可以完全用語(yǔ)音操控,想看什么片子直接說(shuō)就行了,再也不用搖控器。我們讓視頻通訊更加便捷,可以語(yǔ)音操控,你可以語(yǔ)音去撥打和接聽,當(dāng)然依然支持多方高清視頻同話,還有一叫即通的功能,顛覆了家庭之間陪伴的體驗(yàn)。我們更可以隨意擺放,比如說(shuō)在廚房邊做飯邊追劇,在餐桌邊吃早飯邊看新聞,放在書桌上面邊寫郵件邊看世界杯。
在我看來(lái),智能音箱的市場(chǎng)戰(zhàn)爭(zhēng),不僅僅是產(chǎn)品比拼,而是包括品牌、渠道、內(nèi)容以及服務(wù)在內(nèi),整個(gè)生態(tài)的比拼。
在技術(shù)發(fā)展路線上的思考
接下來(lái)說(shuō)一下我們?cè)诩夹g(shù)發(fā)展路線上的思考。我們所在的這個(gè)領(lǐng)域,語(yǔ)音和語(yǔ)義是改變智能交互的核心技術(shù)。其實(shí) 2014 年之前,做語(yǔ)音技術(shù)的公司不多,而深度學(xué)習(xí)把大家都拉回到了同一個(gè)起跑線上。
其實(shí)通過(guò)和百度的深度合作,在包括小度在家甚至更早的小魚在家這些產(chǎn)品上,我們已經(jīng)打造了非常好的語(yǔ)音交互體驗(yàn)。而解決語(yǔ)義理解,成為了未來(lái)發(fā)展的核心。
前邊我曾經(jīng)講到,小魚在家向來(lái)是以用戶為導(dǎo)向,如果在某些方向上我們做不到最好,但是對(duì)用戶體驗(yàn)非常有幫助,那么我們會(huì)努力去和能夠做到最好的廠商合作。
因?yàn)楹芏噙@些技術(shù),未來(lái)可能都會(huì)變成一些開放的基礎(chǔ)能力,如果我們做的沒有別人好,反而會(huì)變成前進(jìn)道路上的包袱。我們只有專注用戶價(jià)值,擴(kuò)大用戶規(guī)模,在用戶體驗(yàn)遇到問(wèn)題的點(diǎn)上,去找到技術(shù)突破的方向才是更好的選擇。
對(duì)于一家做硬件產(chǎn)品的公司而言,其實(shí)最終還是需要去看產(chǎn)品的出貨量。從小魚在家的角度來(lái)講,能夠順利通過(guò)做硬件的雷區(qū)走到今天,其實(shí)本身就是一個(gè)巨大的壁壘。
“多模態(tài)交互體驗(yàn)”是人工智能落地最高效的一種模式
最后,說(shuō)一下我們?cè)诙嗄B(tài)方向的探索。記得 2016 年在美國(guó)做演示的時(shí)候,當(dāng)時(shí)吳恩達(dá)說(shuō)過(guò)這樣一句話:人和機(jī)器交流最高效的方式是通過(guò)語(yǔ)言,而機(jī)器跟人信息傳達(dá)最高效的方式是通過(guò)語(yǔ)音和視覺的輔助。
我們?cè)谶^(guò)去 3.5 代產(chǎn)品的時(shí)候做了 4 次大的迭代,F(xiàn)ish UI 4.0 的實(shí)際上是一個(gè)巨大的革新。我們把語(yǔ)音交互變成了設(shè)備最主要的交流方式,而觸屏變成了完全的輔助功能。
毫無(wú)疑問(wèn),多模態(tài)交互是人工智能落地的更加高效的形態(tài)。在小度在家的產(chǎn)品發(fā)布會(huì)上,李彥宏將現(xiàn)在的無(wú)屏音箱比作了收音機(jī),而帶屏智能音箱則是電視。我們相信,隨著整個(gè)的生態(tài)、內(nèi)容服務(wù)的演進(jìn),以帶屏智能音箱為代表的多模態(tài)交互,會(huì)是未來(lái)人工智能交互的主流交互形態(tài)。
今天人工智能依舊處于向前發(fā)展的時(shí)代,技術(shù)的進(jìn)步會(huì)持續(xù)的推動(dòng)著我們?nèi)ブ厮苡脩趔w驗(yàn),重新定義品類。我們認(rèn)為,人類對(duì)智能音箱這個(gè)品類的認(rèn)知,在未來(lái)會(huì)發(fā)生很大的改變。
而人工智能落地家庭,會(huì)帶來(lái)巨大的、原生的新的平臺(tái)機(jī)會(huì)。多模態(tài)的交互給所有在座的開發(fā)者,都提供了一個(gè)非常巨大的發(fā)展空間和舞臺(tái)。改變世界的不僅僅是技術(shù),更有技術(shù)背后的價(jià)值觀、使命和愿景。最后希望我們一起打造人工智能落地家庭的未來(lái)。
?
評(píng)論
查看更多