服務機器人想要達到智能化程度,定位導航、人機交互及環境交互這三大通用底層技術必不可少,上一篇對于定位導航技術我們已做出詳細講解,感興趣的小伙伴可點擊在百度搜索:《智能機器人三大核心技術(一)》進行查看。在擁有基礎的自主定位導航技術后,機器人想要進一步發揮自身作用,還需要擁有人機交互能力。人機交互技術可讓機器人進一步了解人類,了解用戶訴求,從而為用戶提供更個性化的服務。
從第一代以鍵盤鼠標為交互方式的PC互聯網時代,到第二代以觸屏為主的移動互聯網時代,再到今天以多模態人機交互方式的第三代互聯網,人機交互形式發生了巨大的變化。
目前,人機交互技術主要包含語音識別、語義理解、人臉識別、圖像識別、體感/手勢交互等技術。通過語音識別、合成、理解等技術,實現更精準的營銷和專屬服務。通過人臉識別,可幫助商家精準的識別用戶,并主動與用戶打招呼,提升用戶體驗……。這些交互方式的改變將會深層次的影響我們日常生活的應用場景。
基于語音的人機交互是當前人機交互技術中最為主要的表現形式,語音人機交互過程中包含信息輸入和輸出的交互、語音處理、語義分析、智能邏輯處理以及知識和內容的整合。結合語音人機交互過程,在人機交互中的關鍵技術中包含了自然語音處理、語義分析和理解、知識構建和學習體系、語音技術、整合通信技術以及云計算處理技術。
自然語音處理技術:包括中文分詞、詞性標注、實體識別、句法分析、自動文本分類等技術。
語義分析和理解:包括知識表示、本體理論、分領域的語義網絡、機器推理等。
知識構建和學習體系:包括搜索技術、網絡爬蟲、數據挖掘、知識獲取、機器學習等技術。
語音技術:包括語音識別、語音合成和聲紋識別等。
整合通信技術:包括跨平臺即時通訊整合技術、超大負載消息集群處理技術、移動客戶端開發技術。
云計算技術:包括海量數據分布式存儲、統計和分析技術。
經過科研人員的不斷努力,目前語音交互技術已成功進入商用門檻,如今在智能手機、智能音箱、智能臺燈等設備中大多采用了語音人機交互技術,隨著語音人機交互技術應用價值的逐漸顯現,眾多企業紛紛布局語音人機交互領域,如科大訊飛、谷歌、捷通華聲等企業。隨著布局企業的不斷增多,語音人機交互的產業規模也在不斷擴大,并帶動了機器人、家電、汽車等相關產業的發展。
除了語音人機交互,基于視覺的人機交互技術也是目前研究的一大熱點,對于一個人來說最為主觀的就是看臉部表情,未來機器人也需要理解人的感情,這當中就會涉及到人臉識別技術,包括特征提取及分類,目前在該技術中,對于人類基本的七種表情識別率可達到百分之八十左右,當然目前還是一些比較明顯的表情,如在高興或者發怒的情況下,但在人的自然交流過程中,人的表情還是比較平淡的,對于機器人來說,目前還難以達到準確的分辨效果,這些過程是需要進行一些更加復雜的特征來提取。
當然,除了對臉部表情的理解,手勢也是人最為直接的表現形式,通過一些手勢也可以達到很多的命令,不同的手勢形狀可以構成不同的動作指令。雖然手勢有很多種,但可以找到比較容易記憶的手勢,然后進行交互。
手勢識別是人機交互的重要手段之一,通過手部的動作直接控制計算機,相比傳統的鍵盤、鼠標等控制方式,具有自然直觀和便于學習等優點。
目前常用的手勢識別方法主要包括基于神經網絡的識別方法、基于隱馬爾可夫模型的識別方法和基于幾何特征的識別方法。基于神經網絡的手勢識別方法,具有抗干擾、自組織、自學習且抗 噪聲能力等優點,但訓練時需要采集的樣本量大,且對時間序列的處理能力不強。基于隱馬爾可夫模型的識別方法,能夠細致的描述手勢信號,但拓撲結構一般,計算量相對較大。基于幾何特征的識別方法,是根據手的區域及邊緣 幾何特征關系進行手勢識別,該方法無需對手勢進行時間上的分割,計算量小,
隨著移動機器人和手勢識別的發展,人機交互技術也在不斷更新,自從微軟推出Kinect體感外設以來,自然的人機交互成為當前的研究熱點,通過Kinect外設,可以解除人們受鍵盤、鼠標等傳統交互方式的束縛,具有重要的意義。
-
智能機器人
+關注
關注
17文章
868瀏覽量
82315
發布評論請先 登錄
相關推薦
評論