2022年7月28日,“三芯起 萬物聲”啟英泰倫第三代語音芯片發布會如約而至。歷經三年潛心研發,啟英泰倫正式推出全新第三代智能語音芯片,相較上一代產品,這款芯片創下算力更高、高度集成和算法新高的“三高”記錄,全面覆蓋高性能、低成本端側語音和端云融合語音等應用。
離線語音AI芯片的“先行者”
近年來,隨著5G、AIoT等技術的快速發展與應用融合,人工智能產業及相關業務越來越受政府和產業界的關注與支持,在國家的“十四五”規劃中,人工智能技術已被列為前沿科技領域的“最高優先級”,宏觀環境不斷向好發展。
在各類人工智能技術中,語音識別、自然語義理解(NLP)、機器學習居于重要地位,是人機交互技術的基礎,其中,語音識別、NLP兩項均與語音交互密切關聯。作為人機交互中最符合人類日常交流形態的技術,語音交互方式更加自然,也更為便利。
從產業發展的角度看,技術突破和政策利好有效刺激了智能語音行業的發展。不過,從更底層的邏輯出發,人機語音交互體驗的持續改善才是市場的核心推動力。更長遠來看,智能語音的本質其實是實現人機之間的語音自由交互。
在智能語音識別發展早期,由于語音識別對算力的要求高,企業都是通過云端進行智能語音識別處理。然而,在主流方向如此明晰的情勢下,啟英泰倫卻選擇另辟蹊徑,率先選擇了離線語音AI芯片的方向。
那么,啟英泰倫為何作出這一選擇呢?對此,啟英泰倫創始人兼CEO何云鵬表示,這一選擇的出發點是基于對用戶真實需求的深入思考。首先,離線語音是不依賴網絡和云中心的真智能,既能給用戶帶來即時的靈敏響應,也能更好地保護用戶的隱私。此外,出于對用戶權益的考量,離線語音能確保用戶擁有完整的、自主的智能設備使用權和控制權。最后,除用戶體驗外,還需考慮更廣泛的用戶的成本承受能力,不僅是讓用戶體驗更好,也能用得起。
近年來,隨著智能語音技術不斷發展和應用的不斷拓展,云端處理在響應可靠性、隱私保護、成本等方面的弊端逐步暴露出來。在端云融合的趨勢之下,啟英泰倫的這一選擇也愈發凸顯出其先見之明的一面。
BNPU 3.0將語音識別推向新高點
從實際應用場景來看,智能語音的需求大致可以概括為語義理解、特征識別、語音處理、實時交互四個方面。為了更好地滿足上述用戶需求,啟英泰倫在算法攻關和芯片研發兩個方面同時發力,埋頭攻克一個又一個業內難題。發展至今,啟英泰倫自研技術平臺BNPU(腦神經網絡處理器)已迭代三次,從BNPU1.0、BNPU2.0,一直到今天推出的BNPU3.0版本。
每一代BNPU的問世,都是離線語音芯片和算法的一次突破和語音應用的助推。何云鵬介紹道,第一代BNPU實現的是端側語音識別,是行業首款集成神經網絡處理器的語音AI芯片,也是離線語音產業應用興起的標志。二代系列芯片CI1102/CI1103及CI1122芯片則集成了第二代BNPU,不僅實現了離線語音識別功能,還能實現離線聲紋識別和命令詞自學習等個性化的功能。如今,第三代芯片又將把整個語音識別應用推向新的高點。
從芯片算力方面看,三代13系列芯片內置BNPU 3.0和支持DSP指令擴展的RISC CPU兩大內核,主頻高達240MHz,并具有640KB系統SRAM。
何云鵬指出,在實際應用中,用戶對智能語音的要求極高,對于一個能聽會說的設備,常以機器人,甚至超人的標準對待。比如,在人耳也不易聽清的嘈雜環境中,會希望語音設備能聽清;人耳很難同時聽懂兩個以上人說話,但要求語音設備能聽懂。此外,很少有人能聽懂各地的方言口音,但各地方的人會要求設備聽得懂該地方言,甚至土話。
為了滿足上述苛刻要求,第三代BNPU作了大量技術迭代。除繼承第二代的語音識別、聲紋識別外,還支持了基于深度學習的降噪技術(深度降噪),人聲分離技術(深度分離),命令詞自學習2.0版本技術,以及行業首次突破性的離線NLP技術。
此前,業界普遍認為只有云端才能實現NLP,而啟英泰倫最新的技術已經可以采用端側智能語音芯片實現NLP,將語音處理放在端側,既保障了用戶的體驗感,又能降低云端搭建和運營成本,降低網絡帶寬消耗,也能提升用戶使用的安全性。
為了幫助下游客戶實現敏捷開發、快速落地的目標,啟英泰倫還推出了語音AI平臺。該平臺支持10000用戶同時開發,即時生成NLP模型,提供更自然的語音交互能力。
為用戶打造專屬守護精靈
隨著互聯網、5G和Wi-Fi等技術的快速發展,智能行業正從“單點智能”走向“情景智能”,專業的智能語音芯片技術在這一轉變中扮演著至關重要的角色。
由于智能語音技術和NLP技術不斷加速發展,智能語音的市場空間不斷打開。目前,智能語音已在2C消費級的智能家居、智慧生活、智慧辦公、智能駕駛;2B企業級的智慧醫療、智能客服等多個領域實現場景應用。據IDC的統計數據,2021年中國智能家居設備市場出貨量已超2.2億臺,2022年中國智能家居設備市場出貨量則將突破2.6億臺,同比增長為17.1%。
經過長達近7年的發展后,啟英泰倫積累的B端客戶已超過5000名,平臺開發者則超過了1萬名,使用啟英泰倫智能語音平臺的在校AI學員則超過10萬名。離線語音方案的年裝機量則超過2000萬,并正快速向上億年裝機量發展。
啟英泰倫的終極目標是打造跨設備、跨時空,用戶專屬,終身守護的守護精靈。何云鵬將這一目標劃分為三個階段,第一步是讓人機交互更自然,更具普適性;然后通過更多的數據,讓機器更理解人、更主動地為人類服務;最終目標是打造專屬的守護精靈,它將是用戶全方位的生活管家、健康安全衛士、百科知識導師和給與心靈陪伴的知己朋友。
為了更快地實現自身目標,啟英泰倫正加強生態建設,提升應用開發平臺,和合作伙伴們一切推動生態建設,努力降低AI語音應用的門檻。對于啟英泰倫的理想,何云鵬感慨道“那些站在民族和人類立場的美好愿望,一個人的力量是微薄的,但多一份總會更好!一個人這么想,就會有更多人這么想,最終匯聚成浩浩蕩蕩一往無前的力量!”
-
語音
+關注
關注
3文章
385瀏覽量
38099 -
AI芯片
+關注
關注
17文章
1904瀏覽量
35162 -
啟英泰倫
+關注
關注
1文章
49瀏覽量
1488
發布評論請先 登錄
相關推薦
評論