隨著移動互聯網紅利日漸式微,一個更具備顛覆性、更具備革命性的王朝正悄然來臨——人工智能(AI)。在下一個十年里,圖像識別、語音交互、機器學習、AI芯片等相關產業將以迅猛的勢頭持續占領市場份額,為人工智能無孔不入地滲透進各行各業打下堅實基礎。
隨著技術與算法的發展,人工智能也在進行著從“軟”到“硬”的拓展。正如PC芯片時代造就了英特爾,智能手機芯片時代造就了高通,隨著人工智能時代大幕拉開,人工智能芯片產業也正涌現出一大批入場玩家,這其中不僅有海內外一眾科技巨頭高歌進軍的身影,其他大大小小的創業公司們也都競相上陣,市場風起云涌,好不熱鬧。
這種熱鬧既體現在AI芯片芯片陸續涌現上,又體現在資本市場的持續關注上——最近,一家名為啟英泰倫的成都公司剛剛完成三千萬元的A輪融資。智東西在上周專程來到位于成都高新區的啟英泰倫公司,與董事長兼CTO何云鵬進行了一場一對一的深入對話。
與市面上大多數AI芯片公司不同,啟英泰倫選擇了家電產品語音控制作為核心應用場景,不僅在今年1月就成功量產了語音AI芯片CI1006,搭載專用神經網絡處理單元;還憑借耐高溫、耐高濕、低成本、低功耗等工業化特性,成功打入了長虹、美的等一眾我們耳熟能詳的老牌家電廠商的產品中,使得用戶能夠離線語音控制空調、浴霸、微波爐等電器。
一、年初量產第一代語音AI芯片
啟英泰倫成立于2015年11月,專注于語音識別AI芯片、語音識別應用方案,目前團隊約有50人。不久前,啟英泰倫剛剛完成三千萬元的A輪融資,由灃揚資本領投。此前的一千多萬元天使輪融資則由Roobo智能管家領投。
啟英泰倫于2016年6月推出、2017年1月量產了第一代語音AI芯片CI1006。CI1006封裝后尺寸大約為9mm x 9mm,能夠作為MCU微處理單元集成在家電內部的電路板上。下圖右邊就是搭載CI1006的單麥克風解決方案,最中間標有“ChipIntelli”的黑色小方塊就是CI1006芯片,家電廠商可以將這個黑色小方塊放到自己產品內部的電路板上。
(搭載CI1006的單麥克風解決方案)
之所以將CI1006稱為AI語音芯片,就是因為其中搭載了專門用于AI語音識別計算加速的硬件模塊。下圖是CI1006芯片的內部結構。圖中灰色方框里的ASR硬件加速引擎能夠為家用電器提供語音識別功能。
(CI1006)
我們可以看到,ASR模塊里分三個部分,VAD、FE、DNN。
VAD(Voice Activity Detection,語音激活檢測)是芯片里的語音檢測模塊,可以監測輸入的這段聲音是噪聲還是語音,同時可以檢測它的開始和結束點。
FE(Feature Extraction,特征提取)是芯片里的特征提取模塊,可以提取語音數據的目標特征。
DNN(Deep Neural Networks)則是深度神經網絡模塊,能夠進行語音的識別。
簡單來說,這塊芯片能夠將你說的話“翻譯”成機器能夠理解的命令,而且不需要連接網絡,可以在本地離線執行。比如你直接對著臺燈說“打開臺燈”、直接對著微波爐說“微波爐,加熱”等命令時,這些家用電器就能應聲而動。
目前,長虹、美的、海爾、TCL等老牌家電廠商都陸續采用了啟英泰倫的產品,根據何云鵬介紹,目前有六七十家合作伙伴的項目已經落地啟動,如果加上排隊項目與渠道商對接的項目的話,總計有超過五百個合作伙伴。目前啟英泰倫的雙麥克風解決方案售價低于100元/套,單麥克風解決方案則更低。
除了提供芯片外,啟英泰倫還會配合廠家提供芯片模塊參考設計、語音識別引擎、語音軟件設計等全鏈條服務。廠家提出他們想要什么樣的喚醒詞、什么樣的命令語句,由啟英泰倫提供CI1006芯片模塊,并提供芯片模塊參考設計(如何將CI1006最高效地集成在這款家電的電路板上),并且會根據廠家需求打造配套可用的系統軟件。最后,廠家將這個芯片焊在自家產品的電路板上,這款產品(電飯鍋、洗衣機、燈泡)就能夠具備語音控制功能。
據何云鵬介紹,雖然各個家電廠家的需求不同,但是啟英泰倫內部已經形成了一套標準化、流程化的合作模式,推進速度非常快,現在一款搭載CI1006芯片的智能家電打造時間最快一個多月,最慢不超過三個月。像美的、長虹這種大公司,現在已經有十多個產品項目在同時推進當中。
除了CI1006外,啟英泰倫還將會在2018上半年里陸續推出兩三款不同的AI芯片,主打麥克風陣列拾音或是其他成本更低、功耗更低的新品。
二、中科院半導體技術出身,十六年芯片經驗
一家公司的氣質、定位、市場打法,往往都與創始人的個人經歷息息相關。在何云鵬身上,我們不難發現他與啟英泰倫的共享基因。
2001年年底,一架跨洋飛機將何云鵬從新加坡帶回到了祖國大陸上,彼時的何云鵬有著中科院半導體所半導體碩士和新加坡國立大學光電子碩士的學術背景,并且有著新加坡和美國的工作經歷。
回國后,何云鵬加入了剛剛成立不久的海信專用集成電路設計中心,負責高清電視主控芯片的技術研發,同時參與團隊籌建、立項、項目開發等。
不知道大家還記不記得,二十一世紀初期的中國正經歷著改革開放的快速經濟發展階段。以制造業為例,截至2004年底,我國有彩電生產企業68家,彩電年產量7328.8萬臺,實際銷量占全球銷量的55%,已經成為世界上最大的電視生產國。
然而,這7000多萬臺電視機中所使用的核心視頻處理芯片均為進口,沒有一片來自我國企業自行研發。高額的上游利潤都被國外企業所賺走,而國內制造業只能賺加工的錢,以價格戰、低成本廝殺,賺取產業鏈中的微利。
經過四年的潛心研究,在2004年,何云鵬及其團隊終于研發出了國內第一款高清晰高畫質數字視頻媒體處理芯片——海信“信芯”( hiview),采用當時國際先進的0.18微米工藝,年底一次流片成功。到了次年5月,海信正式舉辦發布會,宣告該款芯片在海信彩色電視全線量產應用。這事在當時引發了不小的震動,不僅獲得了新華社、人民網的報道,總理、政府常委等也紛紛題詞、寫信祝賀。
此后的幾年間,何云鵬又在海信參與了好幾代“信芯”芯片的研發量產過程,一直到了2011年中,他決定辭任海信技術副總,回到成都老家,加入長虹芯片部門擔任技術總監。
2012年的冬天,計算機視覺識別領域一年一度的“奧林匹克” ImageNet計算機識別挑戰賽在眾人的屏息凝神、翹首以待中公布了最終結果——來自多倫多大學的Geoffrey Hinton教授帶領團隊使用深度學習技術,首次將機器圖像識別技術的錯誤率陡降到15.3%,一舉奪冠。此事成為圖像識別學科歷史上的一個重要節點,人工智能從此迎來二十一世紀的第一抹朝陽。
此后,深度學習技術不斷發展,不僅在圖像方案取得不俗成果,在語音識別上也是成績斐然。2015年,運用深度神經網絡(DNN)進行語音識別的準確率已經達到了90%以上。
深耕家電芯片十多年的何云鵬既看到了家電行業對語音交互技術的迫切需求,又看到了深度神經網絡的快速發展,再加上深知傳統CPU、DSP芯片方案在AI應用上存在性能與功耗的缺陷。在2015年年底,他決定辭職創業,11月,啟英泰倫成立。
何云鵬告訴智東西,圖像場景的AI芯片前期投入非常大,不適宜一般初創企業進軍。但隨著啟英泰倫的業務不斷發展,下一步他們也會在芯片中加入圖像處理模塊,并逐步將業務線拓展到車載、機器人等場景中。
三、家電存量市場飽和,智能化迫在眉睫
目前,我國家用電器的存量市場已經接近飽和,在消費升級的大環境下,智能、健康、個性化已經逐漸成為家電高端市場增長的重要因素,用戶不再滿足于平常的洗衣、照明等功能,轉而更加在意消費體驗的升級。
“家電市場對于智能化的需求非常強烈,”何云鵬說,“過去十幾年里,手機發展得太快了,尤其是在從按鍵機向觸屏機轉變之后,各類手機應用開始大爆發,而家電產品幾乎沒什么變化,難道是家電廠商們沒有想法、沒有研究嗎?”
不是的。想法有,特色的功能也有,可增加功能必然意味著用戶交互手段的復雜化——更多按鈕、更多選項、更多設定——用戶并不喜歡。
因此,語音識別控制技術并不只是給家電增加了一個“功能”,而是一個橋梁,讓家電廠商通過這個橋梁,將自己十幾年來的積累的想法、創新的功能逐一實現。
在過去3-4年間,傳統家電其實智能化過程中經歷了好幾段發展路徑:間接控制-WiFi模塊控制-(以WiFi模塊+智能音箱為代表的)語音控制-內置AI芯片控制。
間接控制是最早出現的一種后裝解決方案,通過一個可以連接網絡的智能插座,插上它之后,用戶可以聯網控制最簡單的家電開/關。
WiFi模塊控制是小米、海爾等廠家使用的方式,通過在自己的產品中即成了WiFi控制模塊,用戶可以通過手機APP連接該模塊,聯網控制家電的開關、調節溫度等。
(以WiFi模塊+智能音箱為代表的)語音控制是隨著這兩年來智能音箱興起而出現的控制方式,用戶需要通過智能音箱來語音控制家電,不過這要求智能音箱跟家電都連接網絡。
最后一種就是啟英泰倫現在采用的這種,通過內置語音AI芯片,使得家電產品不需要聯網就能具備語音控制功能。
由此可以看到,啟英泰倫在改變家電產業的核心路徑是通過與家電企業合作,置入AI語音芯片后,讓傳統家電產品能夠以一種非常簡單直接的方式實現語音控制,這同現在小米、海爾等推行的讓家電通過加入WiFi模塊實現遠程控制的方式相比,擺脫了家電智能化聯網和控制標準的屏障;同時,不可聯網的特性也讓控制的多樣玩法、不同設備的聯動沒那么方便,使用哪種方式更合適取決于家電企業對使用場景的判斷。
四、家電芯片需要工業級別可靠性
其實,除了啟英泰倫之外,不少語音軟硬件也都公司看好了家居語音這塊蛋糕——從小型創業公司到大型家電廠商都有——語音交互技術也在幾年前就能基本實現了,可市場一直沒有進入爆發,直到今年才在智能音箱這種新銳產品中展露頭角。
這其中的原因很多,一方面,前幾年語音交互技術還不夠成熟,用戶體驗不夠好;另一方面,家用電器已經發展得非常成熟,對于成本、功耗、耐高溫等工業特性有著嚴格的要求。
拿功耗舉例,一般家電強制待機功耗只有1W,可是一般語音AI解決方案功耗動則好幾W,一加上去這個機器沒法轉。又比如,在家用電器里,耐高溫、耐高濕這種是芯片的基本要求,但實驗級、消費級的語音AI芯片往往不能達到這種要求。
(啟英泰倫的降噪芯片+CI1006解決方案)
目前,啟英泰倫的其單麥克風解決方案工作功耗小于100毫瓦,雙麥克風解決方案功耗小于300毫瓦,待機狀態下的功耗只有約30毫瓦。
結語:推進語音交互在家用電器中的應用
在近年來,云計算所帶來的帶寬、隱私、穩定性等問題催生了端智能的快速發展,人工智能技術也不斷成熟,從軟件應用逐步走向了硬件落地,AI芯片應運而生。
在這樣的背景下,啟英泰倫先人一步將語音識別技術固化到了芯片上,并通過創始人經驗積累+團隊合作研發,將芯片做到了低功耗、低成本、高穩定性的工業級別優勢,能夠幫助推進語音交互在智能家電中的鋪展應用,受到了不少家電廠商的歡迎。
不過,藍海畢竟存在期限,最近大大小小的公司都陸續推出或正在推出相應的AI芯片,初創企業需要提高警惕,在技術領先的紅利期加速奔跑,才能保持優勢,不至于被大型公司或是傳統家電廠商以資源優勢后期反超。
評論
查看更多