如今我國人口結(jié)構(gòu)正在變化,人口紅利逐年下降,在“機(jī)器換人”的趨勢下,我國智能機(jī)器人產(chǎn)業(yè)規(guī)模迅速增長,毫無疑問,中國在未來有很大紀(jì)律成為是全球最大的機(jī)器人市場。然而,智能機(jī)器人核心技術(shù)一直以來都是歐美廠商占絕對主導(dǎo)地位。那么,智能機(jī)器人要想突破必須解決哪三大核心技術(shù)問題?
智能機(jī)器人三大核心技術(shù):人機(jī)交互及識別模塊、環(huán)境感知模塊、運(yùn)動(dòng)控制模塊。
1.交互模塊包括語音識別、語義識別、語音合成、圖像識別等,相當(dāng)于人的大腦;感知模塊借助于各種傳感器、陀螺儀、激光雷達(dá)、相機(jī)、攝像頭等,相當(dāng)于人的眼、耳、鼻、皮膚等;運(yùn)控模塊包括舵機(jī)、電機(jī)、芯片等。在各個(gè)細(xì)分模塊中,語音模塊重要性和成熟度均最高,語義模塊是目前突破重點(diǎn),運(yùn)控模塊相對重要性最弱。
從目前我國智能機(jī)器人產(chǎn)業(yè)技術(shù)儲(chǔ)備上看,語音和OCR領(lǐng)域具備一定的成熟度,到目前已發(fā)展接近20年,在某些特定場景和行業(yè)已經(jīng)有了一些數(shù)據(jù)基礎(chǔ)。其他的技術(shù)包括圖像識別、語義分析都還在很早期的階段。
2、智能機(jī)器人多場景特征,多模態(tài)交互融合是關(guān)鍵
什么是多模態(tài)交互?多模態(tài)融合了視覺、聽覺、觸覺、嗅覺等交互方式,其表達(dá)效率和表達(dá)的信息完整度要由于傳統(tǒng)單一的交互模式。人機(jī)交互是服務(wù)機(jī)器人場景化不可或缺的環(huán)節(jié)。傳統(tǒng)的交互模式中,大多是單一單向的交互方式。人機(jī)對話中,尤其是多輪人機(jī)對話,涉及到語音理解、語義分析、情感分析、動(dòng)作捕捉等多個(gè)維度。
從第一代以鼠標(biāo)和鍵盤的交互方式為特點(diǎn)的PC互聯(lián)網(wǎng),到第二代以觸屏、GPS等交互方式為特點(diǎn)的移動(dòng)互聯(lián)網(wǎng),再到今天以多模態(tài)人機(jī)交互方式為特點(diǎn)的第三代互聯(lián)網(wǎng),服務(wù)機(jī)器人產(chǎn)業(yè),底層的邏輯就是人機(jī)交互方式的發(fā)展和演變。
隨著語音交互、視覺圖像交互、動(dòng)作交互、腦電波交互等多模態(tài)人機(jī)交互技術(shù)的逐步發(fā)展和成熟,這些第三代人機(jī)交互方式將會(huì)深層次地改變我們?nèi)粘I畹膽?yīng)用場景;同時(shí),一場第三代互聯(lián)網(wǎng)的主流終端模式和服務(wù)內(nèi)容入口的競爭也在同步進(jìn)行。
-
傳感器
+關(guān)注
關(guān)注
2552文章
51382瀏覽量
755765 -
機(jī)器人
+關(guān)注
關(guān)注
211文章
28632瀏覽量
207972 -
圖像識別
+關(guān)注
關(guān)注
9文章
521瀏覽量
38329
發(fā)布評論請先 登錄
相關(guān)推薦
評論