色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

SLAM的歷史、理論以及實現的方式

ml8z_IV_Technol ? 來源:未知 ? 作者:李倩 ? 2018-11-19 14:42 ? 次閱讀

到目前為止,室內的視覺SLAM仍處于研究階段,遠未到實際應用的程度。一方面,編寫和使用視覺SLAM需要大量的專業知識,算法的實時性未達到實用要求;另一方面,視覺SLAM生成的地圖(多數是點云)還不能用來做機器人的路徑規劃,需要科研人員進一步的探索和研究。以下,我會介紹SLAM的歷史、理論以及實現的方式,且主要介紹視覺(Kinect)的實現方式。

??

1.前言

開始做SLAM(機器人同時定位與建圖)研究已經近一年了。從一年級開始對這個方向產生興趣,到現在為止,也算是對這個領域有了大致的了解。然而越了解,越覺得這個方向難度很大。總體來講有以下幾個原因:

入門資料很少。雖然國內也有不少人在做,但這方面現在沒有太好的入門教程。《SLAM for dummies》可以算是一篇。中文資料幾乎沒有。

SLAM研究已進行了三十多年,從上世紀的九十年代開始。其中又有若干歷史分枝和爭論,要把握它的走向就很費工夫。

難以實現。SLAM是一個完整的系統,由許多個分支模塊組成。現在經典的方案是“圖像前端,優化后端,閉環檢測”的三部曲,很多文獻看完了自己實現不出來。

自己動手編程需要學習大量的先決知識。首先你要會C和C++,網上很多代碼還用了11標準的C++。第二要會用Linux。第三要會cmake,vim/emacs及一些編程工具。第四要會用openCV, PCL, Eigen等第三方庫。只有學會了這些東西之后,你才能真正上手編一個SLAM系統。如果你要跑實際機器人,還要會ROS

當然,困難多意味著收獲也多,坎坷的道路才能鍛煉人(比如說走著走著才發現Linux和C++才是我的真愛之類的。)鑒于目前網上關于視覺SLAM的資料極少,我于是想把自己這一年多的經驗與大家分享一下。說的不對的地方請大家批評指正。

這篇文章關注視覺SLAM,專指用攝像機,Kinect等深度像機來做導航和探索,且主要關心室內部分。到目前為止,室內的視覺SLAM仍處于研究階段,遠未到實際應用的程度。一方面,編寫和使用視覺SLAM需要大量的專業知識,算法的實時性未達到實用要求;另一方面,視覺SLAM生成的地圖(多數是點云)還不能用來做機器人的路徑規劃,需要科研人員進一步的探索和研究。以下,我會介紹SLAM的歷史、理論以及實現的方式,且主要介紹視覺(Kinect)的實現方式。

2.SLAM問題

SLAM,全稱叫做Simultaneous Localization and Mapping,中文叫做同時定位與建圖。啊不行,這么講下去,這篇文章肯定沒有人讀,所以我們換一個講法。

3.小蘿卜的故事

從前,有一個機器人叫“小蘿卜”。它長著一雙烏黑發亮的大眼睛,叫做Kinect。有一天,它被邪惡的科學家關進了一間空屋子,里面放滿了雜七雜八的東西。

小蘿卜感到很害怕,因為這個地方他從來沒來過,一點兒也不了解。讓他感到害怕的主要是三個問題:

1.自己在哪里?

2.這是什么地方?

3.怎么離開這個地方?

在SLAM理論中,第一個問題稱為定位(Localization),第二個稱為建圖(Mapping),第三個則是隨后的路徑規劃。我們希望借助Kinect工具,幫小蘿卜解決這個難題。各位同學有什么思路呢?

4.Kinect數據

要打敗敵人,首先要了解你的武器。不錯,我們先介紹一下Kinect。眾所周知這是一款深度相機,你或許還聽說過別的牌子,但Kinect的價格便宜,測量范圍在3m-12m之間,精度約3cm,較適合于小蘿卜這樣的室內機器人。它采到的圖像是這個樣子的(從左往右依次為rgb圖,深度圖與點云圖):

Kinect的一大優勢在于能比較廉價地獲得每個像素的深度值,不管是從時間上還是從經濟上來說。OK,有了這些信息,小蘿卜事實上可以知道它采集到的圖片中,每一個點的3d位置。只要我們事先標定了Kinect,或者采用出廠的標定值。

我們把坐標系設成這個樣子,這也是openCV中采用的默認坐標系。

o’-uv是圖片坐標系,o-xyz是Kinect的坐標系。假設圖片中的點為(u,v),對應的三維點位置在(x,y,z),那么它們之間的轉換關系是這樣的:

左側的s為尺度因子,表示從相機光心出去的射線都會落在成像平面的同一個點上。如果我們不知道該點的距離,那么s就是一個自由變量。但在RGB-D相機中,我們在Depth圖中知道了這個距離,它的讀數dep(u,v)與真實距離相差一個倍數。如果也記作s,那么:

后一個公式給出了計算三維點的方法。先從深度圖中讀取深度數據(Kinect給的是16位無符號整數),除掉z方向的縮放因子,這樣你就把一個整數變到了以米為單位的數據。然后,x,y用上面的公式算出。一點都不難,就是一個中心點位置和一個焦距而已。f代表焦距,c代表中心。如果你沒有自己標定你的Kinect,也可以采用默認的值:s=5000, cx = 320, cy=240, fx=fy=525。實際值會有一點偏差,但不會太大。

5.定位問題

知道了Kinect中每個點的位置后,接下來我們要做的,就是根據兩幀圖像間的差別計算小蘿卜的位移。比如下面兩張圖,后一張是在前一張之后1秒采集到的:

你肯定可以看出,小蘿卜往右轉過了一定的角度。但究竟轉過多少度呢?這就要靠計算機來求解了。這個問題稱為相機相對姿態估計,經典的算法是ICP(Iterative Closest Point,迭代最近點)。這個算法要求知道這兩個圖像間的一組匹配點,說的通俗點,就是左邊圖像哪些點和右邊是一樣的。你當然看見那塊黑白相間的板子同時出現在兩張圖像中。在小蘿卜看來,這里牽涉到兩個簡單的問題:特征點的提取和匹配。

如果你熟悉計算機視覺,那你應該聽說過SIFT, SURF之類的特征。不錯,要解決定位問題,首先要得到兩張圖像的一個匹配。匹配的基礎是圖像的特征,下圖就是SIFT提取的關鍵點與匹配結果:

對實現代碼感興趣的同學請Google“opencv匹配”即可,在openCV的教程上也有很明白的例子。上面的例子可以看出,我們找到了一些匹配,但其中有些是對的(基本平等的匹配線),有些是錯的。這是由于圖像中存在周期性出現的紋理(黑白塊),所以容易搞錯。但這并不是問題,在接下來的處理中我們會將這些影響消去。

得到了一組匹配點后,我們就可以計算兩個圖像間的轉換關系,也叫PnP問題。它的模型是這樣的:

[uv]=C(Rp+t)(1)(1)[uv]=C(Rp+t)

R為相機的姿態,C為相機的標定矩陣。R是不斷運動的,而C則是隨著相機做死的。ICP的模型稍有不同,但原理上也是計算相機的姿態矩陣。原則上,只要有四組匹配點,就可以算這個矩陣。你可以調用openCV的SolvePnPRANSAC函數或者PCL的ICP算法來求解。openCV提供的算法是RANSAC(Random Sample Consensus,隨機采樣一致性)架構,可以剔除錯誤匹配。所以代碼實際運行時,可以很好地找到匹配點。

有同學會說,那只要不斷匹配下去,定位問題不就解決了嗎?表面上看來,的確是這樣的,只要我們引入一個關鍵幀的結構(發現位移超過一個固定值時,定義成一個關鍵幀)。然后,把新的圖像與關鍵幀比較就行了。至于建圖,就是把這些關鍵幀的點云拼起來,看著還有模有樣,煞有介事的:

1-200幀的匹配結果

然而,如果事情真這么簡單,SLAM理論就不用那么多人研究三十多年了(它是從上世紀90年代開始研究的)(上面講的那些東西簡直隨便哪里找個小碩士就能做出來……)。那么,問題難在什么地方呢?

6.SLAM端優化理論

最麻煩的問題,就是“噪聲”。這種漸近式的匹配方式,和那些慣性測量設備一樣,存在著累積噪聲。因為我們在不斷地更新關鍵幀,把新圖像與最近的關鍵幀比較,從而獲得機器人的位移信息。但是你要想到,如果有一個關鍵幀出現了偏移,那么剩下的位移估計都會多出一個誤差。這個誤差還會累積,因為后面的估計都基于前面的機器人位置……哇!這后果簡直不堪設想啊(例如,你的機器人往右轉了30度,再往左轉了30度回到原來的位置。然而由于誤差,你算成了向右轉29度,再向左轉31度,這樣你構建的地圖中,會出現初始位置的兩個“重影”)。我們能不能想辦法消除這個該死的誤差呢?

朋友們,這才是SLAM的研究,前面的可以說是“圖像前端”的處理方法。我們的解決思路是:如果你和最近的關鍵幀相比,會導致累計誤差。那么,我們最好是和更前面的關鍵幀相比,而且多比較幾個幀,不要只比較一次。

我們用數學來描述這個問題。設:

不要怕,只有借助數學才能把這個問題講清楚。上面的公式中,xp是機器人小蘿卜的位置,我們假定由n個幀組成。xL則是路標,在我們的圖像處理過程中就是指SIFT提出來的關鍵點。如果你做2D SLAM,那么機器人位置就是x, y加一個轉角theta。如果是3D SLAM,就是x,y,z加一個四元數姿態(或者rpy姿態)。這個過程叫做參數化(Parameterization)。

不管你用哪種參數,后面兩個方程你都需要知道。前一個叫運動方程,描述機器人怎樣運動。u是機器人的輸入,w是噪聲。這個方程最簡單的形式,就是你能通過什么方式(碼盤等)獲得兩幀間的位移差,那么這個方程就直接是上一幀與u相加即得。另外,你也可以完全不用慣性測量設備,這樣我們就只依靠圖像設備來估計,這也是可以的。

后一個方程叫觀測方程,描述那些路標是怎么來的。你在第i幀看到了第j個路標,產生了一個測量值,就是圖像中的橫縱坐標。最后一項是噪聲。偷偷告訴你,這個方程形式上和上一頁的那個方程是一模一樣的。

在求解SLAM問題前,我們要看到,我們擁有的數據是什么?在上面的模型里,我們知道的是運動信息u以及觀測z。用示意圖表示出來是這樣的:

我們要求解的,就是根據這些u和z,確定所有的xp和xL。這就是SLAM問題的理論。從SLAM誕生開始科學家們就一直在解決這個問題。最初,我們用Kalman濾波器,所以上面的模型(運動方程和觀測方程)被建成這個樣子。直到21世紀初,卡爾曼濾波器仍在SLAM系統占據最主要的地位,Davison經典的單目SLAM就是用EKF做的。但是后來,出現了基于圖優化的SLAM方法,漸漸有取而代之的地位[1]。我們在這里不介紹卡爾曼濾波器,有興趣的同學可以在wiki上找卡爾曼濾波器,另有一篇中文的《卡爾曼濾波器介紹》也很棒。由于濾波器方法存儲n個路標要消耗n平方的空間,在計算量上有點對不住大家。盡管08年有人提出分治法的濾波器能把復雜度弄到O(n) [2],但實現手段比較復雜。我們要介紹那種新興的方法:Graph-based SLAM。

圖優化方法把SLAM問題做成了一個優化問題。學過運籌學的同學應該明白,優化問題對我們有多么重要。我們不是要求解機器人的位置和路標位置嗎?我們可以先做一個猜測,猜想它們大概在什么地方。這其實是不難的。然后呢,將猜測值與運動模型/觀測模型給出的值相比較,可以算出誤差:

通俗一點地講,例如,我猜機器人第一幀在(0,0,0),第二幀在(0,0,1)。但是u1告訴我機器人往z方向(前方)走了0.9米,那么運動方程就出現了0.1m的誤差。同時,第一幀中機器人發現了路標1,它在該機器人圖像的正中間;第二幀卻發現它在中間偏右的位置。這時我們猜測機器人只是往前走,也是存在誤差的。至于這個誤差是多少,可以根據觀測方程算出來。

我們得到了一堆誤差,把這些誤差平方后加起來(因為單純的誤差有正有負,然而平方誤差可以改成其他的范數,只是平方更常用),就得到了平方誤差和。我們把這個和記作phi,就是我們優化問題的目標函數。而優化變量就是那些個xp, xL。

改變優化變量,誤差平方和(目標函數)就會相應地變大或變小,我們可以用數值方法求它們的梯度和二階梯度矩陣,然后用梯度下降法求最優值。這些東西學過優化的同學都懂的。

注意到,一次機器人SLAM過程中,往往會有成千上萬幀。而每一幀我們都有幾百個關鍵點,一乘就是幾百萬個優化變量。這個規模的優化問題放到小蘿卜的機載小破本上可解嗎?是的,過去的同學都以為,Graph-based SLAM是無法計算的。但就在21世紀06,07年后,有些同學發現了,這個問題規模沒有想象的那么大。上面的J和H兩個矩陣是“稀疏矩陣”,于是呢,我們可以用稀疏代數的方法來解這個問題。“稀疏”的原因,在于每一個路標,往往不可能出現在所有運動過程中,通常只出現在一小部分圖像里。正是這個稀疏性,使得優化思路成為了現實。

優化方法利用了所有可以用到的信息(稱為full-SLAM, global SLAM),其精確度要比我們一開始講的幀間匹配高很多。當然計算量也要高一些。

由于優化的稀疏性,人們喜歡用“圖”來表達這個問題。所謂圖,就是由節點和邊組成的東西。我寫成G={V,E},大家就明白了。V是優化變量節點,E表示運動/觀測方程的約束。什么,更糊涂了嗎?那我就上一張圖,來自[3]。

圖有點模糊,而且數學符號和我用的不太一樣,我用它來給大家一個圖優化的直觀形象。上圖中,p是機器人位置,l是路標,z是觀測,t是位移。其中呢,p, l是優化變量,而z,t是優化的約束。看起來是不是像一些彈簧連接了一些質點呢?因為每個路標不可能出現在每一幀中,所以這個圖是蠻稀疏的。不過,“圖”優化只是優化問題的一個表達形式,并不影響優化的含義。實際解起來時還是要用數值法找梯度的。這種思路在計算機視覺里,也叫做Bundle Adjustment。

不過,BA的實現方法太復雜,不太建議同學們拿C來寫。好在2010年的ICRA上,其他的同學們提供了一個通用的開發包:g2o [5]。它是有圖優化通用求解器,很好用,我改天再詳細介紹這個軟件包。總之,我們只要把觀測和運動信息丟到求解器里就行。這個優化器會為我們求出機器人的軌跡和路標位置。如下圖,紅點是路標,藍色箭頭是機器人的位置和轉角(2D SLAM)。細心的同學會發現它往右偏轉了一些。:

7.閉環檢測

上面提到,僅用幀間匹配最大的問題在于誤差累積,圖優化的方法可以有效地減少累計誤差。然而,如果把所有測量都丟進g2o,計算量還是有點兒大的。根據我自己測試,約10000多條邊,g2o跑起來就有些吃力了。這樣,就有同學說,能把這個圖構造地簡潔一些嗎?我們用不著所有的信息,只需要把有用的拿出來就行了。

事實上,小蘿卜在探索房間時,經常會左轉一下,右轉一下。如果在某個時刻他回到了以前去過的地方,我們就直接與那時候采集的關鍵幀做比較,可以嗎?我們說,可以,而且那是最好的方法。這個問題叫做閉環檢測。

閉環檢測是說,新來一張圖像時,如何判斷它以前是否在圖像序列中出現過?有兩種思路:一是根據我們估計的機器人位置,看是否與以前某個位置鄰近;二是根據圖像的外觀,看它是否和以前關鍵幀相似。目前主流方法是后一種,因為很多科學家認為前一種依靠有噪聲的位置來減少位置的噪聲,有點循環論證的意思。后一種方法呢,本質上是個模式識別問題(非監督聚類,分類),常用的是Bag-of-Words (BOW)。但是BOW需要事先對字典進行訓練,因此SLAM研究者仍在探討有沒有更合適的方法。

在Kinect SLAM經典大作中[6],作者采用了比較簡單的閉環方法:在前面n個關鍵幀中隨機采k個,與當前幀兩兩匹配。匹配上后認為出現閉環。這個真是相當的簡單實用,效率也過得去。

高效的閉環檢測是SLAM精確求解的基礎。這方面還有很多工作可以做。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    211

    文章

    28607

    瀏覽量

    207884
  • SLAM
    +關注

    關注

    23

    文章

    426

    瀏覽量

    31890
  • 計算機視覺
    +關注

    關注

    8

    文章

    1700

    瀏覽量

    46059

原文標題:干貨 | 視覺SLAM漫談

文章出處:【微信號:IV_Technology,微信公眾號:智車科技】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    深度解讀A-SLAM和AC-SLAM實現和方法應用

    本文的優勢不僅包括討論A-SLAM的內部組成部分,還包括其應用領域、局限性和未來前景,以及對過去十年A-SLAM進行全面的統計調查。
    發表于 03-17 10:44 ?817次閱讀

    什么是SLAM?視覺SLAM怎么實現

    上周的組會上,我給研一的萌新們講解什么是SLAM,為了能讓他們在沒有任何基礎的情況下大致聽懂,PPT只能多圖少字沒公式,這里我就把上周的組會匯報總結一下。 這次匯報的題目我定為“視覺SLAM:一直在
    的頭像 發表于 08-21 10:02 ?1.1w次閱讀
    什么是<b class='flag-5'>SLAM</b>?視覺<b class='flag-5'>SLAM</b>怎么<b class='flag-5'>實現</b>?

    SLAM技術的應用及發展現狀

    也將SLAM分為激光SLAM和視覺SLAM。激光SLAM比視覺SLAM起步早,在理論、技術和產品
    發表于 12-06 10:25

    讓機器人完美建圖的SLAM 3.0到底是何方神圣?

    抖動,必要時調整  ▲ SLAM 3.0 ——采用圖優化的SLAM方式  SLAM 3.0 相比較于前兩代,采用圖優化方式進行構圖,能
    發表于 01-21 10:57

    SLAM技術目前主要應用在哪些領域

    )作為工具,獲取地圖數據,并構建地圖,規避路程中遇到的障礙物,實現路徑規劃。跟SLAM技術在機器人領域的應用類似,只是相比較于SLAM在機器人中的應用,無人駕駛的雷達要求和成本要明顯高于機器人。  無人機
    發表于 12-01 14:26

    激光SLAM與視覺SLAM有什么區別?

    機器人定位導航中,目前主要涉及到激光SLAM與視覺SLAM,激光SLAM理論、技術和產品落地上都較為成熟,因而成為現下最為主流的定位導航方式
    發表于 07-05 06:41

    單目視覺SLAM仿真系統的設計與實現

    實現單目視覺同時定位與建圖(SLAM)仿真系統,描述其設計過程。該系統工作性能良好,其SLAM算法可擴展性強,可以精確逼近真實單目視覺SLAM過程。以方便
    發表于 04-15 08:50 ?82次下載

    激光 SLAM與VSLAM定位導航方法誰主沉浮?

    、無人駕駛、AR、VR 等領域。其用途包括傳感器自身的定位,以及后續的路徑規劃、運動性能、場景理解。 由于傳感器種類和安裝方式的不同,SLAM實現
    發表于 11-22 11:52 ?3次下載

    視覺SLAM技術以及其應用詳解

    當我們談論SLAM時,最先問到的就是傳感器。SLAM實現方式與難度和傳感器的形式與安裝方式密切相關。傳感器分為激光和視覺兩大類,視覺下面又
    的頭像 發表于 01-09 13:09 ?2.4w次閱讀

    機器人SLAM實現

    、位姿變換估計以及閉環檢測對SLAM系統的影響,建立了關鍵幀閉環匹配算法和SLAM實時性與魯棒性之間的關系,提出了一種基于ORB關鍵幀匹配算法的SLAM方法。運用改進ORB算法加快了圖
    發表于 03-26 10:57 ?6次下載

    高仙SLAM具體的技術是什么?SLAM2.0有哪些優勢?

    高仙的SLAM2.0技術體系核心,是基于多傳感器融合+深度學習的架構,即語義SLAM。高仙SLAM2.0技術方案以語義分析、機器學習為基礎,結合云端實時信息處理以及專為多傳感器融合而開
    的頭像 發表于 05-15 16:48 ?9071次閱讀

    視覺SLAM的技術資料總結

    隨著傳感器種類和安裝方式的不同,SLAM實現方式和難度會有很大差異。按傳感器來分,SLAM主要分為激光、視覺兩大類。其中,激光
    的頭像 發表于 05-12 10:31 ?5397次閱讀

    在實際應用中,SLAM技術是如何實現

    SLAM作為機器人自主定位導航的重要突破口正不斷引起業內重視,它是實現機器人自主行走的關鍵技術,可幫助機器人實現即時定位與地圖構建,在實際應用中,SLAM技術究竟又是如何
    的頭像 發表于 12-26 09:23 ?848次閱讀

    為什么SLAM很重要 SLAM算法實現的4要素

    可進入的每個角落。SLAM最早由Smith、Self和Cheeseman于1988年提出。由于其重要的理論與應用價值,被很多學者認為是實現真正全自主移動機器人的關鍵。 詞語
    的頭像 發表于 08-26 16:07 ?7247次閱讀

    SLAM技術在國內的發展現狀

    用在SLAM上的傳感器主要可分為兩大類,一種是激光雷達,而另一種是攝像頭,為此,業內人士也將SLAM分為激光SLAM和視覺SLAM。激光SLAM
    的頭像 發表于 02-15 19:15 ?2430次閱讀
    <b class='flag-5'>SLAM</b>技術在國內的發展現狀
    主站蜘蛛池模板: 日韩亚射吧 | 成人午夜精品无码区久久漫画日本 | 猫咪av永久最新域名 | 张津瑜的9分58秒7段免费 | 99精品在线看 | 久久香蕉国产线看观看精品 | 三级全黄a | 亚洲精品国产自在现线最新 | 暖暖 免费 高清 日本视频5 | 日韩一区二区三区精品 | 国产精品亚洲第一区二区三区 | 久久国产视频网 | 人妻熟女斩五十路0930 | 日韩中文欧美在线视频 | 波多结衣一区二区三区 | 忘忧草秋观看未满十八 | 秋霞电影网视频一区二区三区 | 日本不卡不码高清免费 | 色偷拍自怕亚洲在线 | 久久学生精品国产自在拍 | 亚洲综合日韩在线2019 | 欧美男同gay粗大又长 | 中文字幕亚洲无线码一区 | 古风H啪肉NP文 | 99欧美精品| 久青草国产在线观看视频 | 一区一区三区产品 | 做暧暧免费30秒体验 | 三级成年网站在线观看 | 国产视频精品免费 | 日本人添下面的全过程 | 亚洲中文在线偷拍 | 国产无遮挡色视频免费观看性色 | 亚洲不卡视频在线观看 | 日本美女论坛 | 国产精品亚洲AV毛片一区二区三区 | 人妻中文字幕乱人伦在线 | 花蝴蝶高清观看免费 | 扒开老师大腿猛进AAA片邪恶 | 国产在线一区观看 | 久久机热视频 这里只有精品首页 |