德國(guó)伯恩大學(xué)的研究人員設(shè)計(jì)了一個(gè)軟件,能夠看視頻并預(yù)測(cè)未來(lái)5分鐘會(huì)發(fā)生的事件,準(zhǔn)確率在15%到40%之間。研究人員表示,對(duì)于具有大量不同動(dòng)作的長(zhǎng)視頻,他們的方法也能夠準(zhǔn)確預(yù)測(cè)未來(lái),甚至可以處理嘈雜或錯(cuò)誤的輸入信息。
從幾百萬(wàn)年前起,第一個(gè)原始人類仰望星空,對(duì)宇宙產(chǎn)生好奇開始,我們?nèi)祟悓?duì)周遭世界的理解和把控,已經(jīng)達(dá)到了相當(dāng)嫻熟的程度。
我們已經(jīng)可以超音速飛行,可以轉(zhuǎn)基因,還能治療癌癥。但是,有一件事情是我們一直沒(méi)有做得很好的,那就是對(duì)“時(shí)間”的感知——如何從當(dāng)下推斷未來(lái),如何最大限度的利用這種推測(cè)?
現(xiàn)在看,機(jī)器似乎可以幫助我們做到這一點(diǎn)。
德國(guó)波恩大學(xué)的計(jì)算機(jī)科學(xué)家設(shè)計(jì)出了一種軟件,能夠預(yù)測(cè)未來(lái)5分鐘的序列事件,準(zhǔn)確率在15%到40%之間。
雖然從數(shù)值上看,這個(gè)精度并不高,但研究人員Juergen Gall表示,這代表了機(jī)器學(xué)習(xí)超越了單步預(yù)測(cè)(single-step prediction),向新的領(lǐng)域邁進(jìn)了一步。相關(guān)的研究論文已經(jīng)被CVPR 2018接收。
Juergen Gall團(tuán)隊(duì)展示他們的預(yù)測(cè)未來(lái)系統(tǒng)
超越單步預(yù)測(cè)
Gall和他同事們的研究目標(biāo)——教會(huì)計(jì)算機(jī)預(yù)測(cè)未來(lái)——并不是現(xiàn)在才有,實(shí)際上,這是機(jī)器學(xué)習(xí)和計(jì)算機(jī)視覺領(lǐng)域的一個(gè)主要課題,有大量的研究人員都在從事相關(guān)的工作。
但是,這項(xiàng)工作特殊的地方在于其方法:到目前為止,這些領(lǐng)域的研究集中在對(duì)當(dāng)前行動(dòng)的解釋,或者對(duì)預(yù)期的下一步行動(dòng)進(jìn)行預(yù)測(cè)上面,也即前面提到的“單步預(yù)測(cè)”。
單步預(yù)測(cè),也就是預(yù)測(cè)未來(lái)往前一步的結(jié)果。這是預(yù)測(cè)未來(lái)模式的基礎(chǔ),歸結(jié)為一個(gè)回歸問(wèn)題,輸入變量,預(yù)測(cè)結(jié)果。
在進(jìn)行這樣的預(yù)測(cè)時(shí),目前的研究已經(jīng)取得了比較好的結(jié)果。其中一個(gè)例子是,斯坦福大學(xué)吳恩達(dá)團(tuán)隊(duì)設(shè)計(jì)了一種深度學(xué)習(xí)算法,在對(duì)臨終關(guān)懷的預(yù)測(cè)中,實(shí)現(xiàn)了高達(dá)90%的準(zhǔn)確性。
在他們的實(shí)驗(yàn)中,斯坦福的研究人員使用了200萬(wàn)份病歷對(duì)他們?cè)O(shè)計(jì)的神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,通過(guò)這些數(shù)據(jù),網(wǎng)絡(luò)能夠發(fā)現(xiàn)醫(yī)生發(fā)現(xiàn)不了的模式和規(guī)律,并以此為基礎(chǔ),對(duì)新的病人的情況(患者在接下來(lái)3~12個(gè)月內(nèi)的死亡率)進(jìn)行預(yù)測(cè)。
這項(xiàng)研究面臨的變量十分復(fù)雜,而且取得了很高的精度,論文也獲得了IEEE生物信息學(xué)和生物醫(yī)學(xué)組最佳學(xué)生論文獎(jiǎng)。但是,這樣的算法是基于過(guò)往(retrospective),而且只進(jìn)行單步預(yù)測(cè)。
多步預(yù)測(cè):用CNN和RNN預(yù)測(cè)未來(lái)的兩種結(jié)構(gòu)
在Gall和他團(tuán)隊(duì)的最新研究中,他們提出了兩種方法,對(duì)相當(dāng)長(zhǎng)時(shí)間的未來(lái)發(fā)生的大量行動(dòng)進(jìn)行預(yù)測(cè)。他們訓(xùn)練了一個(gè)CNN和一個(gè)RNN,根據(jù)之前看過(guò)的視頻內(nèi)容,學(xué)習(xí)未來(lái)視頻的“標(biāo)簽”。
“我們表明,即使對(duì)于具有大量不同動(dòng)作的長(zhǎng)視頻,我們的方法也能夠準(zhǔn)確預(yù)測(cè)未來(lái),甚至可以處理嘈雜或錯(cuò)誤的輸入信息?!弊髡咴谡撐闹羞@樣寫道。
下面的圖例展示了研究人員設(shè)計(jì)的兩個(gè)方法。首先來(lái)看RNN的設(shè)計(jì)。
在RNN系統(tǒng)的結(jié)構(gòu)中,輸入是一個(gè)序列,網(wǎng)絡(luò)預(yù)測(cè)最近觀察到的動(dòng)作的剩余長(zhǎng)度,以及下一個(gè)動(dòng)作的標(biāo)簽和長(zhǎng)度。將預(yù)測(cè)結(jié)果附加到原始輸入,就可以預(yù)測(cè)下一個(gè)動(dòng)作片段。
而在CNN系統(tǒng)的結(jié)構(gòu)中,輸入序列和輸出序列都被轉(zhuǎn)換成矩陣的形式。其中,C表示類(class)的數(shù)量,S則對(duì)應(yīng)于特定長(zhǎng)度的視頻片段的數(shù)量。矩陣的二進(jìn)制值表示每個(gè)視頻片段的標(biāo)簽。
讓機(jī)器預(yù)測(cè)長(zhǎng)時(shí)間的未來(lái),有望實(shí)現(xiàn)真正的人機(jī)協(xié)作
在他們的實(shí)驗(yàn)中,Gall和他的團(tuán)隊(duì)使用數(shù)小時(shí)的視頻數(shù)據(jù)來(lái)演示不同的烹飪動(dòng)作(例如煎雞蛋、拌沙拉等),并僅向軟件展示其中的一部分動(dòng)作。軟件根據(jù)“已經(jīng)學(xué)到的”來(lái)預(yù)測(cè)接下來(lái)的動(dòng)作步驟。通過(guò)這種方法,Gall希望該領(lǐng)域能夠向真正的人機(jī)共生邁進(jìn)一步。
“[業(yè)界]人們談?wù)撊祟惡?a target="_blank">機(jī)器人協(xié)作,但最終人和機(jī)器之間仍存在分離; 他們并沒(méi)有真正密切地合作,”Gall說(shuō)。
Gall建議說(shuō),通過(guò)使用適當(dāng)?shù)挠布@個(gè)軟件可以通過(guò)直觀地了解任務(wù)來(lái)幫助人類完成任務(wù),進(jìn)而在工業(yè)環(huán)境中幫助人類工作。
Gall說(shuō):“老年人越來(lái)越多,值得努力在家庭中推廣這種機(jī)器人來(lái)照顧老年人,”Gall說(shuō): “我相信10年后服務(wù)機(jī)器人將能夠在家照顧老年人?!?/p>
根據(jù)人口統(tǒng)計(jì)局的報(bào)告,今天65歲以上的美國(guó)人的數(shù)量約為4600萬(wàn),預(yù)計(jì)到2060年將翻一番。根據(jù)2014年美國(guó)疾病控制與預(yù)防中心(CDC)的報(bào)告,這些老年人中約140萬(wàn)將生活在養(yǎng)老院。日本已經(jīng)探索過(guò)使用這樣的軟件帶來(lái)的影響。例如用于療愈的海豹型機(jī)器然PARO,軟銀的伴侶機(jī)器人Pepper等。在日本,四分之一人口是老年人。
隨著這類技術(shù)的進(jìn)步,或許會(huì)在人類代際之間造成進(jìn)一步的分化——把愛和關(guān)懷外包給一臺(tái)機(jī)器。對(duì)于一個(gè)尚未成熟的行業(yè)來(lái)說(shuō),很難說(shuō)這條路將通向何方,但最終決定權(quán)掌握在開發(fā)人員手中,而不是掌握在他們開發(fā)的軟件或機(jī)器人手中。
-
機(jī)器人
+關(guān)注
關(guān)注
211文章
28627瀏覽量
207954 -
計(jì)算機(jī)視覺
+關(guān)注
關(guān)注
8文章
1700瀏覽量
46074 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8438瀏覽量
132912
原文標(biāo)題:機(jī)器也能感知時(shí)間,AI系統(tǒng)可預(yù)測(cè)5分鐘內(nèi)的未來(lái)!
文章出處:【微信號(hào):worldofai,微信公眾號(hào):worldofai】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論