炸雞可樂蛋撻,燒烤火鍋奶茶,游戲番劇代碼,夕陽西下,阿宅癱在沙發。面對高強度工作負荷帶來的久坐、各種舌尖上的誘惑,以及一系列可以窩在沙發里進行的娛樂項目,肥胖在當代逐漸成了一個可以當作“梗”來談論的問題。一首《卡路里》展開持續洗腦式轟炸的同時,AI也一直在不斷嘗試對肥胖這一難題“下手”,試圖從更多層面加以挖掘與解釋。
根據2018年8月31日在線發表于JAMA Network Open的一項研究顯示(https://jamanetwork.com/journals/jamanetworkopen/fullarticle/2698635),卷積神經網絡(CNN)可從衛星圖像中自動提取建筑環境的特質,并用于健康指標研究。而了解建筑環境的某些特征與肥胖癥患病率之間關聯,則有助于引導環境結構上的變化,從而達到促進運動、降低肥胖率的作用。
全球疾病負擔報告表明,2015年全球約有超過6.03億成年人在遭受肥胖問題的困擾;在美國,成年肥胖人口更是占據成年總人口數的三分之一。肥胖是一個復雜的健康問題,其間涉及的關聯因素頗多,包括遺傳學、人口統計學,以及行為學的影響。而不健康的飲食習慣和久坐不動的生活方式則都與所處的社會環境特質及建筑環境特征密切相關,環境可以通過其間的步行方便程度、土地使用、占地面積、住宅區、可用資源(活動及娛樂場所、餐飲店等)、貧困等級、安全感以及社區設計方案等來影響人們的健康,例如靠近自然空間或是人行道的建筑設計能夠在增加運動量的同時促進定期活動,這一特征在城市中尤為明顯。
一直以來,關于肥胖問題和建筑環境間這二者間關聯的討論并不鮮見,但盡管如此,研究人員仍在研究過程中注意到了一些不一致的結果,造成這些不一致的原因可能是測量方法和測量工具的跨研究變化所導致的評估及比對困難。此外,相關指標的測量過程可能代價高昂、耗時巨大,并且易受人的主觀思維模式影響。因此,研究人員需要發掘一種一致性的測量方式,以實現跨研究比較。評估并量化建筑環境與肥胖間的關系有助于人們在社區基礎上對相應健康問題加以適當的干預與防范。
對此,來自華盛頓大學的研究人員結合人工智能技術,提出了一種全面評估法,其中包含使用預訓練的卷積神經網絡(一種深度學習法)從高分辨率衛星圖像中提取鄰域的物理特征。事實上,類似的研究方法早在此前便受到了研究人員的關注。Nguyen QC等人2018年3月刊載于《JECH (Journal of Epidemiology and Community Health)》雜志的論文中,便提到了通過卷積神經網絡對Google街景中的建筑環境圖像進行分類,并借以評估肥胖與人行道、建筑類型、街道綠化(或景觀美化)這三者間的關系。只是彼時的研究未能充分利用卷積神經網絡獨立發現關聯因素的能力,僅局限于預設的三大變量。相較之下,此次華盛頓大學發布的最新論文則全面評估了建筑環境中的變量因素,并依據美國四個區人口普查肥胖率的細粒度關聯進行方法論證。研究中所采用的方法皆可擴展,且都基于公開可用的數據與計算工具,可實現跨研究可比性。
▌研究方法
肥胖癥患病率數據分析
數據來源:選取美國疾病防控中心“500 Cities”項目中的2014年度人口普查肥胖率粗略估值
分析方法:包含兩個步驟。首先,利用卷積神經網絡以及提取處理的POI(興趣點)數據來處理衛星圖像,以抓取建筑環境特征。隨后,利用彈性網絡回歸建立一個簡約模型來評估建筑環境與肥胖率之間的關聯性。
獲取衛星圖像和POI數據
在設置好地理中心、圖片尺寸(400*400像素)和縮放級別(縮放系數18)的情況下,從Google Static Maps API下載圖像。將每個城市的地理范圍劃分為方形網格,其中每個點對應一對緯度和經度值,網格間距約150米。同時,利用人口普查區地圖文件將每個圖像與其對應的人口普查區相關聯,排除城市范圍外區域的圖像。使用相同的方形網格來選取地理位置,并在適當的距離內開啟徑向附近搜索,以此實現在Google Places of Interest API上下載POI數據(此處不包含城市范圍外的興趣點)。該研究采集了96個獨有的POI類別,并計算了每個人口普查區對應到每個相關類別下的位置數量。
圖像處理
如今,卷積神經網絡已經在關鍵的計算機視覺任務(如目標識別、圖像分割)、健康相關的應用(如識別皮膚癌),以及貧困預測等領域的大數據集方面取得了突破性的成就。由于缺乏用于對高肥胖地區和低肥胖地區進行分類的大型標注數據集,研究人員采用了遷移學習(Transfer Learning)法,其中涉及使用預訓練網絡從包含近150000個衛星圖像的未標注數據集中提取建筑環境特征。遷移學習包括微調預訓練卷積神經網絡以完成新任務(修改輸出層)或將預訓練卷積神經網絡作為固定特征提取器(與線性分類器或回歸模型相結合)。上述方法已經成功運用于明顯不同于目標識別的計算機視覺任務。
研究中使用VGG-CNN-F網絡,該網絡有8層(5個卷積層和3個完全連接層),并且基于約120萬個來自ImageNet數據庫的圖像進行了訓練,以識別分屬于1000個類別的目標。網絡學習提取有助于目標檢測的圖像梯度、邊緣和圖案。諸多使用類似遷移學習方法的研究表明,從基于ImageNet數據訓練的網絡中提取的特征可有效地將航拍圖像按照土地用途(如高爾夫球場、橋梁、停車場、建筑物和道路)進行細粒度語義分類。
研究人員收集了數據集中每個圖像網絡第二個完全連接層的輸出,這一層有4096個節點,每個節點與其上一層及下一層的節點間呈非線性連接,每個特征向量為4096維,對應(也稱激活)著來自這些節點的輸出。通過計算人口普查區域所有圖像的均值,這些輸出進一步聚合成每個人口普查區的均值特征向量。這些特征共同代表建筑環境的指標。為了研究CNN能否區分建筑環境特征,研究人員通過網絡向前傳輸了一組隨機圖像,并檢查lCNN卷積輸出的地圖(圖1)。同時,研究人員還對圖像特征進行了分組,以此說明在肥胖率低和高的地區,建筑環境的特征存在差異(圖2)。
圖1 卷積神經網絡模型下的特征可視化
圖2
統計分析
運用彈性網絡(一種正則化回歸方法),消除了非重要協變量,保留了相關變量,非常適用于從該研究圖像數據集中提取的高維(n?=?4096)特征向量。彈性網絡的正則化防止過擬合,這也是出于高緯度數據集的考量。為了選擇合適的調整參數值(λ值),這里用到了交叉驗證法,并選取了最小化均值交叉驗證錯誤的值。
采用5折交叉驗證回歸分析法,以量化下列關聯:
① 人口普查區建筑環境特征與肥胖率之間的關聯;
② 人口普查區POI密度與肥胖率之間的關聯;
③ 人口普查區建筑環境特征與人均收入差異之間的關聯(數據來自“美國2014年度社區調查”中的未來五年預測)。
研究還將數據分為兩個隨機樣本,并用樣本1代表模型擬合中60%的數據,其余40%則在所有分析中進行驗證。上述分析針對所有地區共同進行,并對每個地區獨立進行。
除此之外,基于人工智能技術的食物營養成分分析項目、科學食療方案、食物照片的卡路里識別項目、各種穿戴設備、語音識別智能家庭營養健康助手等應用早已數見不鮮,其中就包括Google在2015年推出的Im2Calories項目、2018年的Google Coach,以及雀巢公司與京東集團2017年在智能音箱“叮咚”上合作推出的雀巢小AI……
由是觀之,人工智能在人類健康問題上的探索之路正在不斷延伸。想要了解更多人工智能前沿技術與行業深度應用? 2018 AI 開發者大會(AINEXTCon)來啦!
-
圖像處理
+關注
關注
27文章
1299瀏覽量
56835 -
人工智能
+關注
關注
1793文章
47604瀏覽量
239519 -
深度學習
+關注
關注
73文章
5511瀏覽量
121392
原文標題:人工智能靈魂注入,燃燒你的卡路里——2018,你AI了嗎!?
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論