色婷婷久久合月综,一区二区三区在线播放视频,伊人久久影视

計算機視覺的應用可以用來幫助盲人，無論是改善視力缺陷還是打破社交障礙。例如TapTapSee和CamFind等物體識別工具可以讓人們拍攝圖像，并識別目標物體是什么，以及哪里能買到。另外，Facebook和Twitter推出的新功能可以識別和標記圖片中的好友，讓人們與朋友保持聯系。計算機視覺應用的下一個理想目標是讓有視力障礙的人更自然地接收到關于周圍世界的信息。這一目標的出現引起了人們對通用視覺問題解答（visual question answering）的興趣，該問題旨在準確地回答任何有關圖像的問題。

在過去三年里，計算機視覺領域已經涌現出了14種VQA數據集，但他們都是人工創建設置的，并且沒有一個數據集的圖片是來自盲人的或服務于盲人的。然而，可以這么說，盲人能夠產生訓練算法所需的大量數據。近十年來，盲人群體通過拍照詢問他們拍的是什么，并且盲人通常是計算機視覺技術早期的使用者，這項技術將為他們的生活帶來極大的便利。

中國科學技術大學和美國卡內基梅隆大學等高校的研究人員共同提出了第一個由盲人產生的視覺數據庫“VizWiz”，他們通過數據庫創建了一個手機程序，可以讓盲人通過拍照和詢問得到超過七萬個問題的答案。數據集剛開始構建時嚴格對內容進行過濾，消除有可能侵犯個人隱私的視覺問題。之后通過眾包獲取圖像的答案來訓練和評估算法，接著通過實驗對圖像進行特征分類、問題回答，最終發現了VizWiz與其他現有VQA數據集不同的地方。

VizWiz介紹

該VQA數據集由盲人提出的視覺問題組成，在四年時間里積累了72205個問題。表一總結了VizWiz收集數據的過程與其他數據庫的不同，其中明顯的區別是VizWiz包含來自盲人攝影師的圖像，并且提問方式是口頭而非文字。

表一

這種圖像質量帶來了一般數據集中沒有的挑戰，例如會有大量的模糊、光線不足、圖像內容缺失等。另外，因為“提問者”也是“拍攝者”，所以有時問題可能與圖像無關，如圖所示。

在對數據集的圖像進行篩選時，研究人員將可能會泄露隱私的圖片分成以下幾類：

暴露個人信息，例如人臉、財務狀況、藥品處方。

某個地點，例如郵箱地址、商業地點。

不雅內容，例如***、褻瀆。

可疑的復雜場景，審查人員懷疑其中可能包括個人信息，但沒有找到明確的地方。

可疑的低質量圖像，審查人員懷疑增強圖像質量可能會暴露個人信息。

最終，研究人員通過IQ引擎、Facebook、Twitter或電子郵件公開接收圖像的答案。

VizWiz數據庫分析

接著，研究人員將對VizWiz中的問題和答案進行可視化，他們分析了自然語言問題的類型、圖像都有哪幾類、答案分為哪幾類以及視覺問題無法回答的情況。

首先，問題的類別如下圖所示：

表中統計了所有問題的前六個字母。最內環代表第一個字母，以此類推?？梢钥闯觯斑@是什么？（What is this）”這個問題是最常見的。

然后，我們來分析數據庫中的圖像多樣性。尤其值得關注的是，我們的數據集中高質量的圖像可以顯示單個標志性的對象，因為在收集時過濾掉了可疑圖像。在之前工作的基礎上，我們首先計算了VizWiz中所有圖像的平均圖像。如下圖所示：

接著，我們來分析答案的多樣性。我們首先用詞匯地圖將不同答案進行可視化，如下圖所示：

文字越大，答案出現的頻率就越高。

VizWiz評估結果

研究人員用現有算法測試了VizWiz數據集的難度。首先是用現代VQA算法預測VizWiz數據集中視覺問題的答案，結果如下表所示：

可以看出前兩行的表現非常糟糕，而VizWiz的表現還是不錯的。

接著他們測試了算法是夠能區分某一問題是否可答的精確度，結果如下圖所示：

結果可見，研究人員提出的方法比現有方法的精確度提高了至少25%。

結語

在這篇論文中，研究人員介紹了一種VQA數據集——VizWiz，與一般數據集不同的是，其中的內容都來自盲人拍攝的圖片，并由盲人對內容進行提問。通過對數據集的分析，研究人員對計算機視覺以及自然語言處理又有了新的認識。更重要的一點是，VizWiz的出現能讓更多人關注針對盲人的技術需求，為開發專門的技術提供了新機會。

阅读全文

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

數據

數據

+關注

關注
8

文章
7230

瀏覽量
90560
人工智能

人工智能

+關注

關注
1801

文章
48303

瀏覽量
243778

原文標題：VizWiz數據集：用計算機視覺回答盲人的問題

文章出處：【微信號：jqr_AI，微信公眾號：論智】歡迎添加關注！文章轉載請注明出處。

自動駕駛系統要完成哪些計算機視覺任務？

Geiger 的研究主要集中在用于自動駕駛系統的三維視覺理解、分割、重建、材質與動作估計等方面。他主導了自動駕駛領域著名數據集 KITTI 及多項自動駕駛計算機

發表于 07-30 06:49

用于計算機視覺訓練的圖像數據集介紹

用于計算機視覺訓練的圖像數據集

發表于 02-26 07:35

計算機視覺講義

計算機視覺講義:機器視覺是研究用計算機來模擬生物外顯或宏觀視覺功能的科學和技術．機器視覺系統的首

發表于 03-19 08:08 ?0次下載

計算機視覺與機器視覺區別

　“計算機視覺”，是指用計算機實現人的視覺功能，對客觀世界的三維場景的感知、識別和理解。計算機視覺

發表于 12-08 09:27 ?1.3w次閱讀

計算機視覺與圖像處理兩者之間是什么關系

計算機視覺（computer vision），用計算機來模擬人的視覺機理獲取和處理信息的能力。

發表于 11-26 16:11 ?8296次閱讀

使用計算機視覺和人工智能來識別X射線中的計算機模型

這些模型使用計算機視覺和人工智能（AI）分析胸部X射線圖像。它可以對肉眼通常無法識別的信息進行分類，并有助于診斷。

發表于 05-29 11:07 ?1039次閱讀

計算機視覺常用算法_計算機視覺有哪些分類

本文主要介紹了計算機視覺常用算法及計算機視覺的分類。

發表于 07-30 17:34 ?1.4w次閱讀

用于計算機視覺訓練的圖像數據集

角度的不同的攝像機查看圖像或來自醫療掃描儀的多維數據。 ? 用于計算機視覺訓練的圖像數據集 Labelme：麻省理工學院

發表于 12-31 09:33 ?2468次閱讀

用于計算機視覺訓練的圖像數據集

計算機視覺使計算機能夠理解圖像和視頻的內容。計算機視覺的目標是使人類視覺系統可以實現任務自動化。

發表于 02-12 16:13 ?1500次閱讀

機器學習和計算機視覺的前20個圖像數據集

計算機視覺使計算機能夠理解圖像和視頻的內容。計算機視覺的目標是使人類視覺系統可以實現任務自動化。

發表于 01-28 07:40 ?5次下載

如何使用計算機視覺技術識別棋子及其在棋盤上的位置

本期我們將一起學習如何使用計算機視覺技術識別棋子及其在棋盤上的位置

發表于 03-21 13:16 ?3358次閱讀

使用計算機視覺為工業工人進行跌倒檢測

電子發燒友網站提供《使用計算機視覺為工業工人進行跌倒檢測.zip》資料免費下載

發表于 06-12 16:00 ?0次下載

使用計算機視覺進行電梯乘客計數

電子發燒友網站提供《使用計算機視覺進行電梯乘客計數.zip》資料免費下載

發表于 06-12 15:35 ?0次下載

工業計算機與商用計算機的區別

與商用計算機的區別。一、功能和設計工業計算機通常用于工業控制和自動化系統中，其主要功能是提供數據采集、實時控制和監測等功能。它們通常需要具備高可靠性、穩定性和冗余性，以適應惡劣的工業環境。工業

發表于 12-27 10:50 ?805次閱讀

機器視覺和計算機視覺有什么區別

。機器視覺的研究目標是讓機器具有類似人類的視覺能力，能夠自動、準確地完成各種視覺任務。 計算機視覺計算

發表于 07-16 10:23 ?819次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

VizWiz數據集：用計算機視覺回答盲人的問題

評論

自動駕駛系統要完成哪些計算機視覺任務？

用于計算機視覺訓練的圖像數據集介紹

計算機視覺講義

計算機視覺與機器視覺區別

計算機視覺與圖像處理兩者之間是什么關系

使用計算機視覺和人工智能來識別X射線中的計算機模型

計算機視覺常用算法_計算機視覺有哪些分類

用于計算機視覺訓練的圖像數據集

用于計算機視覺訓練的圖像數據集

機器學習和計算機視覺的前20個圖像數據集

如何使用計算機視覺技術識別棋子及其在棋盤上的位置

使用計算機視覺為工業工人進行跌倒檢測

使用計算機視覺進行電梯乘客計數

工業計算機與商用計算機的區別

機器視覺和計算機視覺有什么區別

電子發燒友