10月30日消息,剛剛結束的李佳琦直播間里,剁手黨通過阿里語音機器人首次實現與主播的實時互動。直播過程中,數十萬用戶同時用語音回答李佳琦的提問,最終機器人在50毫秒內就完成了語音識別和語音反饋全過程,反應速度是傳統語音的20倍。
淘寶直播間觀眾用語音與李佳琦互動
今年雙11期間,淘寶直播間推出 “語音猜價格”功能,觀眾在直播間也能實現語音交互,例如動動嘴就可以響應主播發出的猜產品價格任務。語音機器人成為決定這一互動過程能否順暢的關鍵。
據介紹,一場淘寶直播的觀眾數量可達百萬甚至千萬,并且用戶分布在全國各地,口音差異較大,目前主流的語音技術方案很難做到短時間內快速響應如此體量的用戶語音,例如類似Siri識別用戶語音的響應時長就在1秒以上,無法滿足直播場景強互動的要求。
此次淘寶直播間采用了達摩院最新的移動端離線端到端語音識別技術。基于全新的網絡結構和語音識別框架,即便在低配手機上,也能在50毫秒內完成語音交互過程,速度是傳統語音識別的20倍;此外,該技術還解決了快語速、重口音等問題,高難度場景中的語音識別錯誤率降低近三成。
達摩院語音實驗室技術專家萬玉龍表示,“在實時性要求極高的場景,傳統的云端語音方案無法滿足需求,這套語音技術的創新在于同時實現了識別速度和準確度的提升,語音AI模型部署在每個用戶的淘寶直播APP上,即便直播間有千萬級別的用戶,AI也不會漏聽慢判。”
過去幾年,阿里語音AI在基礎研究和應用上取得了一系列突破。2019年,阿里語音AI入選《麻省理工評論》“全球十大突破性技術”,是唯一上榜的中國科技公司;今年7月IDC發布的《中國AI云服務市場半年度研究報告》顯示,阿里語音AI以44%的市場份額,在云上語音AI市場中位居第一。
責任編輯:PSY
-
機器人
+關注
關注
211文章
28618瀏覽量
207925 -
語音識別
+關注
關注
38文章
1742瀏覽量
112802 -
Siri
+關注
關注
4文章
206瀏覽量
37084 -
阿里
+關注
關注
6文章
441瀏覽量
32870
發布評論請先 登錄
相關推薦
評論