炸雞可樂蛋撻,燒烤火鍋奶茶,游戲番劇代碼,夕陽西下,阿宅癱在沙發(fā)。面對高強(qiáng)度工作負(fù)荷帶來的久坐、各種舌尖上的誘惑,以及一系列可以窩在沙發(fā)里進(jìn)行的娛樂項(xiàng)目,肥胖在當(dāng)代逐漸成了一個(gè)可以當(dāng)作“梗”來談?wù)摰膯栴}。一首《卡路里》展開持續(xù)洗腦式轟炸的同時(shí),AI也一直在不斷嘗試對肥胖這一難題“下手”,試圖從更多層面加以挖掘與解釋。
根據(jù)2018年8月31日在線發(fā)表于JAMA Network Open的一項(xiàng)研究顯示(https://jamanetwork.com/journals/jamanetworkopen/fullarticle/2698635),卷積神經(jīng)網(wǎng)絡(luò)(CNN)可從衛(wèi)星圖像中自動(dòng)提取建筑環(huán)境的特質(zhì),并用于健康指標(biāo)研究。而了解建筑環(huán)境的某些特征與肥胖癥患病率之間關(guān)聯(lián),則有助于引導(dǎo)環(huán)境結(jié)構(gòu)上的變化,從而達(dá)到促進(jìn)運(yùn)動(dòng)、降低肥胖率的作用。
全球疾病負(fù)擔(dān)報(bào)告表明,2015年全球約有超過6.03億成年人在遭受肥胖問題的困擾;在美國,成年肥胖人口更是占據(jù)成年總?cè)丝跀?shù)的三分之一。肥胖是一個(gè)復(fù)雜的健康問題,其間涉及的關(guān)聯(lián)因素頗多,包括遺傳學(xué)、人口統(tǒng)計(jì)學(xué),以及行為學(xué)的影響。而不健康的飲食習(xí)慣和久坐不動(dòng)的生活方式則都與所處的社會(huì)環(huán)境特質(zhì)及建筑環(huán)境特征密切相關(guān),環(huán)境可以通過其間的步行方便程度、土地使用、占地面積、住宅區(qū)、可用資源(活動(dòng)及娛樂場所、餐飲店等)、貧困等級、安全感以及社區(qū)設(shè)計(jì)方案等來影響人們的健康,例如靠近自然空間或是人行道的建筑設(shè)計(jì)能夠在增加運(yùn)動(dòng)量的同時(shí)促進(jìn)定期活動(dòng),這一特征在城市中尤為明顯。
一直以來,關(guān)于肥胖問題和建筑環(huán)境間這二者間關(guān)聯(lián)的討論并不鮮見,但盡管如此,研究人員仍在研究過程中注意到了一些不一致的結(jié)果,造成這些不一致的原因可能是測量方法和測量工具的跨研究變化所導(dǎo)致的評估及比對困難。此外,相關(guān)指標(biāo)的測量過程可能代價(jià)高昂、耗時(shí)巨大,并且易受人的主觀思維模式影響。因此,研究人員需要發(fā)掘一種一致性的測量方式,以實(shí)現(xiàn)跨研究比較。評估并量化建筑環(huán)境與肥胖間的關(guān)系有助于人們在社區(qū)基礎(chǔ)上對相應(yīng)健康問題加以適當(dāng)?shù)母深A(yù)與防范。
對此,來自華盛頓大學(xué)的研究人員結(jié)合人工智能技術(shù),提出了一種全面評估法,其中包含使用預(yù)訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)(一種深度學(xué)習(xí)法)從高分辨率衛(wèi)星圖像中提取鄰域的物理特征。事實(shí)上,類似的研究方法早在此前便受到了研究人員的關(guān)注。Nguyen QC等人2018年3月刊載于《JECH (Journal of Epidemiology and Community Health)》雜志的論文中,便提到了通過卷積神經(jīng)網(wǎng)絡(luò)對Google街景中的建筑環(huán)境圖像進(jìn)行分類,并借以評估肥胖與人行道、建筑類型、街道綠化(或景觀美化)這三者間的關(guān)系。只是彼時(shí)的研究未能充分利用卷積神經(jīng)網(wǎng)絡(luò)獨(dú)立發(fā)現(xiàn)關(guān)聯(lián)因素的能力,僅局限于預(yù)設(shè)的三大變量。相較之下,此次華盛頓大學(xué)發(fā)布的最新論文則全面評估了建筑環(huán)境中的變量因素,并依據(jù)美國四個(gè)區(qū)人口普查肥胖率的細(xì)粒度關(guān)聯(lián)進(jìn)行方法論證。研究中所采用的方法皆可擴(kuò)展,且都基于公開可用的數(shù)據(jù)與計(jì)算工具,可實(shí)現(xiàn)跨研究可比性。
▌研究方法
肥胖癥患病率數(shù)據(jù)分析
數(shù)據(jù)來源:選取美國疾病防控中心“500 Cities”項(xiàng)目中的2014年度人口普查肥胖率粗略估值
分析方法:包含兩個(gè)步驟。首先,利用卷積神經(jīng)網(wǎng)絡(luò)以及提取處理的POI(興趣點(diǎn))數(shù)據(jù)來處理衛(wèi)星圖像,以抓取建筑環(huán)境特征。隨后,利用彈性網(wǎng)絡(luò)回歸建立一個(gè)簡約模型來評估建筑環(huán)境與肥胖率之間的關(guān)聯(lián)性。
獲取衛(wèi)星圖像和POI數(shù)據(jù)
在設(shè)置好地理中心、圖片尺寸(400*400像素)和縮放級別(縮放系數(shù)18)的情況下,從Google Static Maps API下載圖像。將每個(gè)城市的地理范圍劃分為方形網(wǎng)格,其中每個(gè)點(diǎn)對應(yīng)一對緯度和經(jīng)度值,網(wǎng)格間距約150米。同時(shí),利用人口普查區(qū)地圖文件將每個(gè)圖像與其對應(yīng)的人口普查區(qū)相關(guān)聯(lián),排除城市范圍外區(qū)域的圖像。使用相同的方形網(wǎng)格來選取地理位置,并在適當(dāng)?shù)木嚯x內(nèi)開啟徑向附近搜索,以此實(shí)現(xiàn)在Google Places of Interest API上下載POI數(shù)據(jù)(此處不包含城市范圍外的興趣點(diǎn))。該研究采集了96個(gè)獨(dú)有的POI類別,并計(jì)算了每個(gè)人口普查區(qū)對應(yīng)到每個(gè)相關(guān)類別下的位置數(shù)量。
圖像處理
如今,卷積神經(jīng)網(wǎng)絡(luò)已經(jīng)在關(guān)鍵的計(jì)算機(jī)視覺任務(wù)(如目標(biāo)識別、圖像分割)、健康相關(guān)的應(yīng)用(如識別皮膚癌),以及貧困預(yù)測等領(lǐng)域的大數(shù)據(jù)集方面取得了突破性的成就。由于缺乏用于對高肥胖地區(qū)和低肥胖地區(qū)進(jìn)行分類的大型標(biāo)注數(shù)據(jù)集,研究人員采用了遷移學(xué)習(xí)(Transfer Learning)法,其中涉及使用預(yù)訓(xùn)練網(wǎng)絡(luò)從包含近150000個(gè)衛(wèi)星圖像的未標(biāo)注數(shù)據(jù)集中提取建筑環(huán)境特征。遷移學(xué)習(xí)包括微調(diào)預(yù)訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)以完成新任務(wù)(修改輸出層)或?qū)㈩A(yù)訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)作為固定特征提取器(與線性分類器或回歸模型相結(jié)合)。上述方法已經(jīng)成功運(yùn)用于明顯不同于目標(biāo)識別的計(jì)算機(jī)視覺任務(wù)。
研究中使用VGG-CNN-F網(wǎng)絡(luò),該網(wǎng)絡(luò)有8層(5個(gè)卷積層和3個(gè)完全連接層),并且基于約120萬個(gè)來自ImageNet數(shù)據(jù)庫的圖像進(jìn)行了訓(xùn)練,以識別分屬于1000個(gè)類別的目標(biāo)。網(wǎng)絡(luò)學(xué)習(xí)提取有助于目標(biāo)檢測的圖像梯度、邊緣和圖案。諸多使用類似遷移學(xué)習(xí)方法的研究表明,從基于ImageNet數(shù)據(jù)訓(xùn)練的網(wǎng)絡(luò)中提取的特征可有效地將航拍圖像按照土地用途(如高爾夫球場、橋梁、停車場、建筑物和道路)進(jìn)行細(xì)粒度語義分類。
研究人員收集了數(shù)據(jù)集中每個(gè)圖像網(wǎng)絡(luò)第二個(gè)完全連接層的輸出,這一層有4096個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)與其上一層及下一層的節(jié)點(diǎn)間呈非線性連接,每個(gè)特征向量為4096維,對應(yīng)(也稱激活)著來自這些節(jié)點(diǎn)的輸出。通過計(jì)算人口普查區(qū)域所有圖像的均值,這些輸出進(jìn)一步聚合成每個(gè)人口普查區(qū)的均值特征向量。這些特征共同代表建筑環(huán)境的指標(biāo)。為了研究CNN能否區(qū)分建筑環(huán)境特征,研究人員通過網(wǎng)絡(luò)向前傳輸了一組隨機(jī)圖像,并檢查lCNN卷積輸出的地圖(圖1)。同時(shí),研究人員還對圖像特征進(jìn)行了分組,以此說明在肥胖率低和高的地區(qū),建筑環(huán)境的特征存在差異(圖2)。
圖1 卷積神經(jīng)網(wǎng)絡(luò)模型下的特征可視化
圖2
統(tǒng)計(jì)分析
運(yùn)用彈性網(wǎng)絡(luò)(一種正則化回歸方法),消除了非重要協(xié)變量,保留了相關(guān)變量,非常適用于從該研究圖像數(shù)據(jù)集中提取的高維(n?=?4096)特征向量。彈性網(wǎng)絡(luò)的正則化防止過擬合,這也是出于高緯度數(shù)據(jù)集的考量。為了選擇合適的調(diào)整參數(shù)值(λ值),這里用到了交叉驗(yàn)證法,并選取了最小化均值交叉驗(yàn)證錯(cuò)誤的值。
采用5折交叉驗(yàn)證回歸分析法,以量化下列關(guān)聯(lián):
① 人口普查區(qū)建筑環(huán)境特征與肥胖率之間的關(guān)聯(lián);
② 人口普查區(qū)POI密度與肥胖率之間的關(guān)聯(lián);
③ 人口普查區(qū)建筑環(huán)境特征與人均收入差異之間的關(guān)聯(lián)(數(shù)據(jù)來自“美國2014年度社區(qū)調(diào)查”中的未來五年預(yù)測)。
研究還將數(shù)據(jù)分為兩個(gè)隨機(jī)樣本,并用樣本1代表模型擬合中60%的數(shù)據(jù),其余40%則在所有分析中進(jìn)行驗(yàn)證。上述分析針對所有地區(qū)共同進(jìn)行,并對每個(gè)地區(qū)獨(dú)立進(jìn)行。
除此之外,基于人工智能技術(shù)的食物營養(yǎng)成分分析項(xiàng)目、科學(xué)食療方案、食物照片的卡路里識別項(xiàng)目、各種穿戴設(shè)備、語音識別智能家庭營養(yǎng)健康助手等應(yīng)用早已數(shù)見不鮮,其中就包括Google在2015年推出的Im2Calories項(xiàng)目、2018年的Google Coach,以及雀巢公司與京東集團(tuán)2017年在智能音箱“叮咚”上合作推出的雀巢小AI……
由是觀之,人工智能在人類健康問題上的探索之路正在不斷延伸。想要了解更多人工智能前沿技術(shù)與行業(yè)深度應(yīng)用? 2018 AI 開發(fā)者大會(huì)(AINEXTCon)來啦!
-
圖像處理
+關(guān)注
關(guān)注
27文章
1282瀏覽量
56638 -
人工智能
+關(guān)注
關(guān)注
1791文章
46857瀏覽量
237552 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5492瀏覽量
120976
原文標(biāo)題:人工智能靈魂注入,燃燒你的卡路里——2018,你AI了嗎!?
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論