12 月 7-8 日在北京舉辦的 ArchSummit 全球架構師峰會上,微軟 Principal Software Manager 李想老師分享了微軟小冰實時感官系統與未來發展趨勢。以下為演講內容,部分有刪減。李想老師首先介紹了什么是微軟小冰,然后從全雙工語音感官和實時視覺感官這兩個方面,來展望了微軟小冰的未來發展趨勢。
什么是微軟小冰?
目前,微軟小冰已經上線四年了,存在于五個國家、數十款產品之中,有著上億用戶。小冰產品大致可以分為三類:
Content Provider,即內容提供商。小冰逐漸有了它自己的社會化角色,不僅可以用非常接近人類的聲音唱歌,還可以寫詩,甚至還可以講兒童故事。
Solutions,即解決方案。比如,小冰不僅可以在一些新聞客戶端給新聞做一些評價,帶動新聞的整體流量,增加整體活躍性,還可以幫一些商業機構發布商業簡報等等。
2
小冰的情商
下面主要討論的是小冰的 Chat Bot(聊天機器人)。
四年中,小冰研發團隊在和同行業者朝著相似的目標以截然相反的路線前進。對于智能機器人,傳統想法是要讓人類更加接受它們,就必須讓它們變得很有用,能夠幫助人們去完成一個任務、十個任務,甚至更多。但是,小冰團隊認為,在變得有用的更底端,其實還有一層“情商”,以此為基礎再去一層一層完成任務就會變得更自然。
下面以狼和哈士奇為例來說明一下這個問題。狼其實是一種非常強的生物,但是在以人為本位的群體中,有些種族卻瀕臨滅絕。而哈士奇卻可以整天什么活都不干,就能夠很好地融入人類中去。為什么呢?因為人其實是一種以情感為基礎的生物,我們嘗試賦予與之能夠進行情感交流的對方,予以平等的權利。我們把生物能夠運用的這種權利稱之為情商。以情商為基礎再去完成任務就會變得更加自然。比如哈士奇可以幫你開燈關燈了,你一定會把它捧到天上去。
對于小冰來說,情商高意味著什么呢?意味著它在聊天過程中很有趣嗎?其實不止如此。情商高,在交互中主要體現為控制全程對話的能力。
傳統的智能語音助手不會去過度關注對話的全程,而更加關注對話中的每一個細節。它會把每一句話都優化得特別好,甚至把對話形式分為:面向任務型的對話、面向知識型對話、無意義的閑聊。
那么這真的是無意義的閑聊嗎?也不盡然。
我們知道,小冰背后是大數據,有著 Bing 搜索。從大數據的分析來看,其實人與人的對話 / 人與人工智能的對話,就如同河流一般奔涌向前,任何一句看似無意義的閑聊,都可能在十幾輪甚至幾十輪的迭代之后產生一個非常重要的結果。小冰可以不停地去迭代,去改變對話的走向,去改變對話的長度。它關注的是整個對話的全局,而不是一城一地的得失,正如古人所言,“不謀全局,則不足以謀一隅”,這就是所謂的控制整個對話全程的能力。
12 月 7-8 日在北京舉辦的 ArchSummit 全球架構師峰會上,微軟 Principal Software Manager 李想老師分享了微軟小冰實時感官系統與未來發展趨勢。以下為演講內容,部分有刪減。李想老師首先介紹了什么是微軟小冰,然后從全雙工語音感官和實時視覺感官這兩個方面,來展望了微軟小冰的未來發展趨勢。
-
微軟
+關注
關注
4文章
6627瀏覽量
104367 -
微軟小娜
+關注
關注
0文章
3瀏覽量
1365
發布評論請先 登錄
相關推薦
評論