2018年人工智能(AI)行業(yè)成為了最受關(guān)注的熱點之一,不同場景的AI芯片層出不窮,成為了智能時代的“入場券”,大多數(shù)業(yè)者稱“得芯者得天下”,將2018年定義為“芯片元年”。
語音垂直應(yīng)用領(lǐng)域,“造芯”似已成為云知聲、出門問問、Rokid 、思必馳、科大訊飛從算法出發(fā)“軟硬兼施”一條必走之途,但也顯得語音AI市場變得異常競爭激烈。
在此背景下,2018年5月,云知聲推出首款物聯(lián)網(wǎng)AI芯片——雨燕(Swift),通過“唯快不破”的發(fā)展思路,很快在語音識別風(fēng)口中和科大訊飛比肩,并完成C輪1億美元的融資躋身國內(nèi)眾多AI獨角獸榜單中的一員。
而在2019年開年之際,云知聲繼續(xù)搶跑,于1月2日召開了“2019云知聲多模態(tài)AI芯片戰(zhàn)略發(fā)布會”,會上正式公布了其多模態(tài)AI技術(shù),以及正在研發(fā)中的多款定位不同場景的AI芯片,包括實用性更廣的超輕量級物聯(lián)網(wǎng)語音芯片雨燕(Lite)、可面向智慧城市場景提供對語音和圖像等多模態(tài)計算支持的海豚(Dolphin),以及面向智慧出行場景的車規(guī)級芯片雪豹(Leopard)。以上三款芯片計劃于2019年啟動量產(chǎn)。
AIoT下的多模態(tài)演變之路
云知聲創(chuàng)始人兼CEO黃偉認(rèn)為,5G與人工智能的結(jié)合將真正促使萬物智聯(lián)(AIoT)的落地與實現(xiàn)。可以預(yù)見的是,未來巨量的多維數(shù)據(jù)(如語音、圖像、視頻等)集中處理與邊緣式分布計算的需求,勢必將進一步挑戰(zhàn)AI底層支持硬件——芯片的計算能力。
與此同時,AI應(yīng)用對于端云互動有著強需求。強大的云會讓端能力更強,而強大的端則可提升數(shù)據(jù)處理的實時性和有效性,進而增強云的能力。二者需要緊密結(jié)合,這要求對芯片設(shè)計和云端架構(gòu)進行統(tǒng)一考量。傳統(tǒng)的通用方案架構(gòu)由于在高實時性、高智能化場景中的算力有限,且無法平衡好成本、功耗、安全性等諸多現(xiàn)實需求,因此具備多維度AI數(shù)據(jù)集中處理能力的多模態(tài)AI芯片將成必由之路。
為實現(xiàn)多模態(tài)AI芯片的戰(zhàn)略落地,目前云知聲已在加速技術(shù)布局,并在機器視覺方面取得飛速進展。其中,面向機器視覺的輕量級圖像信號處理器已可實現(xiàn)在不依賴外部內(nèi)存的情況下,在30 fps的速率下實時對傳感器的圖片進行預(yù)處理,以進一步提高后續(xù)機器視覺處理模塊的處理速度和效果。借助基于人臉信息分析的多模態(tài)技術(shù),已可實現(xiàn)人臉/物體識別、表情分析、標(biāo)簽化、唇動狀態(tài)跟蹤等功能,可為產(chǎn)品交互和用戶體驗提供更多的可玩性和靈活性。
此外,云知聲發(fā)布多模態(tài)人工智能核心IP——DeepNet2.0,可兼容LSTM/CNN/RNN/TDNN等多種推理網(wǎng)絡(luò),支持可重構(gòu)計算與Winograd處理,最高可配置算力達4T。目前云知聲DeepNet2.0已在FPGA上得到驗證,將在2019年落地的全新多模態(tài)AI芯片海豚(Dolphin)上落地。
直面思必馳、科大訊飛垂直領(lǐng)域競爭
語音識別與語義分析,這是人們比較能理解的人工智能應(yīng)用領(lǐng)域。雖然在這條起跑線上,云知聲后來追上,但不難發(fā)現(xiàn),與其業(yè)務(wù)重合度較高的莫過于思必馳和科大訊飛兩家公司。
梳理之下可以看出,在產(chǎn)品線競爭上,云知聲圍繞智能家居、智能車載、機器人、智慧醫(yī)療和智慧教育等的五大領(lǐng)域四面受敵。
云知聲產(chǎn)品線中的智能家居方案、智能車載方案和機器人方案,直面與思必馳構(gòu)成業(yè)務(wù)重疊,競爭態(tài)勢強烈。據(jù)思必馳CMO龍夢竹曾介紹,思必馳車載語音在智能車載后裝市場占據(jù)約60%的份額,在智能后視鏡領(lǐng)域約為70%,HUD領(lǐng)域已高達80%。
在智慧醫(yī)療與智慧教育領(lǐng)域里,科大訊飛仍是擺在眼前的不小阻力。除了雙方均大力布局將語音轉(zhuǎn)成結(jié)構(gòu)化電子病歷系統(tǒng)與智能口語評測外,科大訊飛還在醫(yī)學(xué)影像輔助診斷和基于認(rèn)知計算的輔助診療系統(tǒng)方面有所布局,并且根據(jù)科大訊飛2017年財報表示,其智慧教育產(chǎn)品已經(jīng)覆蓋全國15000余所學(xué)校,深度用戶超過1500萬,占總主營業(yè)務(wù)收入的25.54%。
因此,對于云知聲而言,面對行業(yè)里既有科大訊飛這樣的“老大”,又有不斷加碼人工智能投入的BAT等巨頭,由應(yīng)用場景來定義AI芯片的研發(fā)與產(chǎn)品形態(tài)無疑是其獨立發(fā)展的最佳路徑。
以語音病歷系統(tǒng)為例。醫(yī)生在說話時,能輕松地與電腦、iPad、移動查房設(shè)備等建立聯(lián)系;說話的內(nèi)容會被轉(zhuǎn)錄成文字并顯示在醫(yī)院專門的HIS、PACS、CIS等系統(tǒng)中。但是在醫(yī)療這個專業(yè)性非常強的領(lǐng)域,常規(guī)語音識別系統(tǒng)并不能完美勝任。
為此,云知聲針對醫(yī)院不同科室的業(yè)務(wù)進行了梳理,整理了超過30GB的醫(yī)療文本資料,并對這些資料進行分類、檢索等處理,使得定制語音模型覆蓋各個科室常用病癥、藥品名稱、操作步驟等關(guān)鍵信息,使語音識別準(zhǔn)確率超過95%。同時,針對醫(yī)生的口音問題,云知聲提出了無監(jiān)督自適應(yīng)技術(shù),提高對醫(yī)生口語的識別率。
所以,在這一輪人工智能風(fēng)潮的到來,最重要的是芯片定位。云知聲的做法是,針對細(xì)分客戶的需求做極致化服務(wù),從算法公司的角度出發(fā)做芯片,軟硬結(jié)合打造出一個好用的芯片,欲成為語音交互佼佼者,同時希望推出語音AI芯片打造生態(tài),從而實現(xiàn)價值的提升。
-
語音交互
+關(guān)注
關(guān)注
3文章
287瀏覽量
28066 -
AI芯片
+關(guān)注
關(guān)注
17文章
1904瀏覽量
35179
原文標(biāo)題:“聲”勢驚人 AI語音交互芯片 啟動新一輪垂直領(lǐng)域戰(zhàn)場
文章出處:【微信號:DIGITIMES,微信公眾號:DIGITIMES】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論