在本月上旬舉辦的 2020 小米開發者大會上,小米發布發布小愛同學 5.0 版本。
小米集團副總裁、集團技術委員會主席崔寶秋此前表示,小愛同學將從過去的語音助手升級為智能生活助手。
IT之家了解到,今日上午,小米創辦人,董事長兼 CEO 雷軍發文表示,小愛同學激活的設備數已經達到達 2.28 億,月活已經達到 7840 萬,累計喚醒 617 億次,“小愛同學也成為目前行業內唯一一個擁有大規模落地場景的語音助手”。
以下為《雷軍:小愛同學 5.0 背后的人工智能》全文:
在月初舉辦的 MIDC 開發者大會上,我們發布了最新一代的小愛同學——小愛同學 5.0。全新的小愛同學帶來了五大升級,覆蓋了囊括影音娛樂、生活服務、信息查詢、出行路況等 8 大領域 1400 + 技能,成為大家生活中離不開的智能生活助手。
從 2017 年 3 月 21 日,“小愛同學”第一次與大家見面,到現在僅僅 4 年時間,小愛同學激活的設備數已經達到達 2.28 億,月活已經達到 7840 萬,累計喚醒 617 億次,小愛同學也成為目前行業內唯一一個擁有大規模落地場景的語音助手。
新一代小愛同學 全新五大升級
新一代小愛同學的 5 大升級包括:全場景智能協同、對話式主動智能、定制化情感聲音、多模態融合交互和智慧學習好助手。
小愛同學 5.0 全場景智能協同
目前,擁有 5 件及以上連接小米 AIoT 平臺的設備用戶已達 560 萬。隨著用戶家中的智能設備越來越多,使用和操作也變得更加復雜。全場景智能協同就是讓小愛同學 5.0 成為控制家中眾多 IoT 設備的大腦,當你發出一條需求指令時,小愛同學會進行統一決策,家中多個設備進行協同配合,達到 “再多設備,都能化繁為簡”的效果,是當之無愧的 “智能生活助手”。
想要達到智能協同,這其中需要解決的問題非常復雜。不僅要根據設備距離、活躍狀態、形態等綜合條件判斷,自主選擇出設備能力最能滿足當前語義需求的設備,甚至還需要預測用戶潛在的設備控制需求,適時主動的作出提醒和建議。
截止 2020 年 6 月,使用協同喚醒的總用戶數已達 94.4 萬,同時喚醒的攔截次數已達 9.4 億。
小愛同學 5.0 對話式主動智能
有別于傳統移動互聯網 APP 或信息流被動猜測用戶的形式,對話式主動智能產品形態是小愛同學以自己的方式和節奏與用戶互動溝通,像人一樣發起問題來增進對用戶的了解。
主動對話本身就是高級智能的體現,它意味著人工智能不僅僅存在于與用戶互動的短暫過程中,而是在更長的時間內不斷的進行思考和計算,需要像人一樣,擁有 “記憶”。
小愛同學 5.0 通過強大的自然語言處理技術,主動學習其中關于用戶的知識,從而建立記憶。這有賴于小米自然語言處理技術(MiNLP)的深厚積累,MiNLP 目前已迭代到 3.0 版本,支持 30 多個業務場景,日調用次數達 80 億。
在記憶的存儲方面,小愛同學云端大腦會為用戶建立多維度的個人畫像,實現全設備個人信息互聯互通。小愛同學的所有功能,會對內共享這些關于用戶的 “記憶”,每次交互結合個人畫像進行計算,產生出面向用戶個人的個性化結果。
小愛同學 5.0 定制化情感聲音
為了滿足用戶提出的,可以跨越地理、時間阻礙,隨時隨地就可以得到陪伴感的 “情感訴求”,小愛同學定制聲音項目應運而生。
定制化情感聲音的實現,不是僅依靠常規聲音處理技術就可以做到的。首先需要能夠對用戶音頻數據進行預處理。然后是提取關鍵聲學特征,區別不同音色在頻譜上的表現。最后是通過定制合成音庫訓練的基礎模型,進行自適應學習,最終才能可實現只需少量的用戶錄音,就能取得很好的合成效果。
除了定制聲音功能以外,小愛同學 5.0 針對粵語也進行了深度的優化,并在 8 月份開啟了粵語在音箱上的內測。本月中旬,我們已正式啟動在手機及電視上小愛同學粵語功能的內測,預計在月內,小愛同學粵語功能將陸續開放到所有音箱上。
小愛同學 5.0 智慧學習好助手
小愛同學 5.0 將學習作為一個重要的升級模塊,整合了海量的優質的 K12 網課資源,精選 1000 + 網課視頻資源,與讀書郎、義方教育等 35 家優質資源方達成了合作,并拉通了電視 / 音箱 / 手機教育會員同步。
課程表是學生學習中最基本的一個工具類需求。我們把課程表與小愛同學結合在一起,打造了一個擁有國內首發 AI 拍照導入課程功能等先進人工智能技術加持的 AI 課程表。
另外一大工具,就是翻譯。為了讓翻譯更高效、更精準,小愛同學團隊在文本前處理模塊進行了優化,包括基于語言規則和模型的文本順滑技術、融合上文內容的實時文本糾錯算法、基于多語言預訓練模型的實時語義斷句算法等。
小愛同學 5.0 多模態融合交互
為了讓小愛同學與用戶之間進行更自然的溝通,我們做了更智能的多模態融合交互,可以通過聲音、肢體語言、信息載體(文字、圖片、音頻、視頻)、環境等多種方式與智能設備進行交流。打破了傳統 PC 式的鍵盤輸入和智能手機的點觸式交互,定義了下一代智能產品和人的專屬交互模式。
新一代小愛同學背后 是小米 AI 能力的長期積累
小米集團擁有非常豐富的業務線,包含了硬件產品、電商和新零售以及互聯網業務。小米的人工智能不僅僅體現在小愛同學上,還擁有非常廣泛的應用領域,比如計算機視覺技術、計算機語音技術和機器學習技術等。經過這幾年的努力,我們的 AI 已經建立了比較完整的能力圖譜和小米的 AI 能力平臺,在此基礎上打造了小米的相關應用,包括智能相機、小愛同學、機器翻譯等等。強大的智能硬件生態為 AI 能力的快速提升建立了基礎,同時 AI 能力又反過來,全面賦能了小米各個業務線。
比如在計算機視覺技術方面,我們做了大量的工作,包括超級分辨率、文檔模式 / OCR、魔法換天、魔法分身等。今年,我們的 HDR(高動態范圍拍照)也助力小米 10 Pro / 至尊紀念版相機成功獲得 DXOMARK 評測世界第一。
我們在計算機語音、機器學習等很多方面也都做了大量的工作,整個集團在人工智能領域的投入,可能遠遠超過大家的想象。截止 2019 年 12 月 31 日,小米集團共提交專利申請 33000 余件,其中 AI 領域專利申請數量已進入全球互聯網企業第一陣營。包括端到端語音識別、就近喚醒、分布式放音、離線翻譯等在內的多項技術處于行業一流水平。
同時,我們也在積極引入全球頂尖的研發人才,比如我們成功邀請到了人工智能領域的頂尖專家 Daniel Povey 加入小米。
未來,小米的人工智能會進一步打造核心技術,推進各項 AI 技術的業務落地,給用戶打造更好的體驗。同時,也會更加的開放,繼續加強和高等院校科研院及其企業的合作,將更多更好的 AI 技術開放給社會,為每一個人帶來更美好的和智能的生活。
責任編輯:haq
-
AI
+關注
關注
87文章
31490瀏覽量
269978 -
人工智能
+關注
關注
1795文章
47642瀏覽量
239765 -
小米
+關注
關注
70文章
14384瀏覽量
144708
發布評論請先 登錄
相關推薦
評論