I.介紹
本論文中的“車輛駕駛相遇”指的是兩輛或多輛車在駕駛時(shí)在空間上靠近并彼此相互作用的場景。近年來,自動(dòng)駕駛已經(jīng)成為工業(yè)界和學(xué)術(shù)界的熱門話題,讓汽車在復(fù)雜的交通場景中與人類駕駛員一樣做出類似人的決定給自動(dòng)駕駛車輛帶來了巨大的挑戰(zhàn)。
目前,處理復(fù)雜“駕駛相遇”的最流行的方法之一是,根據(jù)其具體應(yīng)用,憑經(jīng)驗(yàn)手動(dòng)將其分為幾個(gè)簡單的駕駛場景。例如,基于人類駕駛員主動(dòng)-被動(dòng)決策行為[3],將自動(dòng)駕駛應(yīng)用的變道行為分為不同類別[1]、[2],然后引入機(jī)器學(xué)習(xí)技術(shù),如馬爾可夫決策過程(MDP)和部分可觀察的MDP(POMDP)[4],[5],以學(xué)習(xí)具體的決策模型。
一個(gè)訓(xùn)練有素的模型通常需要足夠數(shù)量的自然駕駛數(shù)據(jù)[ 6 ]。[7]的作者將強(qiáng)化學(xué)習(xí)與博弈論相結(jié)合,利用交通模擬器生成的車輛交互數(shù)據(jù),為自動(dòng)駕駛汽車開發(fā)決策控制器。但是,當(dāng)在現(xiàn)實(shí)世界的交通環(huán)境中部署時(shí),[7]中訓(xùn)練有素的控制器可能變得無效。此外,直接將訓(xùn)練數(shù)據(jù)輸入模型而不進(jìn)行任何分類無法充分利用基礎(chǔ)數(shù)據(jù)資源,從而可能錯(cuò)過實(shí)際交通設(shè)置中的一些罕見但重要的駕駛場景。解決此問題的最大挑戰(zhàn)之一是從自然交通設(shè)置中獲取大量高質(zhì)量的標(biāo)記和分類交通數(shù)據(jù),這對(duì)于學(xué)習(xí)決策模型的穩(wěn)健性和準(zhǔn)確性至關(guān)重要。
現(xiàn)代傳感技術(shù),如攝像機(jī),激光雷達(dá)和雷達(dá),可以收集多輛車遇到的大規(guī)模交通數(shù)據(jù),具有很大的優(yōu)勢(shì);例如,密歇根大學(xué)交通研究所(UMTRI)在安娜堡配備了帶有GPS跟蹤器的多輛公共汽車,以收集自動(dòng)駕駛汽車研究的車輛交互數(shù)據(jù)以及[8][9]中列出的更多已發(fā)布的數(shù)據(jù)庫,可以探索收集車輛的交互數(shù)據(jù),用以開發(fā)自動(dòng)駕駛車輛控制器并生成測(cè)試運(yùn)動(dòng)以評(píng)估自驅(qū)動(dòng)算法[10] - [12]。
然而,如何有效地標(biāo)記如此龐大的數(shù)據(jù)集并以合理的方式分組“駕駛相遇”仍然是挑戰(zhàn)。手動(dòng)標(biāo)記大量數(shù)據(jù)是一項(xiàng)耗時(shí)的任務(wù),這需要數(shù)據(jù)分析師具有豐富的先驗(yàn)知識(shí),涵蓋交通、智能車輛以及人為因素等領(lǐng)域。阿克曼聲稱,一小時(shí)標(biāo)記良好的訓(xùn)練數(shù)據(jù),大約需要800個(gè)人工小時(shí)。Ohn-Bar [13]花費(fèi)了相當(dāng)長的時(shí)間來手動(dòng)注釋錄制的駕駛視頻中的對(duì)象,以研究駕駛時(shí)有趣物體的重要性等級(jí)。
為了滿足基于數(shù)據(jù)的學(xué)習(xí)方法,工業(yè)界和學(xué)術(shù)界都需要一種能夠使標(biāo)簽過程自動(dòng)化的工具,從而有效地消除標(biāo)簽成本[14]。近年來,除了對(duì)“駕駛相遇”進(jìn)行分類之外,還已經(jīng)對(duì)自動(dòng)化數(shù)據(jù)標(biāo)注過程進(jìn)行了不少研究。例如,從使用監(jiān)督學(xué)習(xí)方法[ 15 ]自動(dòng)標(biāo)注模糊推文到使用無監(jiān)督學(xué)習(xí)方法(例如k - means ) [ 16 ]和半監(jiān)督學(xué)習(xí)方法(例如,半監(jiān)督支持向量機(jī)) [ 17 )對(duì)駕駛風(fēng)格進(jìn)行分類。
盡管上述無監(jiān)督和半監(jiān)督方法可以減少標(biāo)記工作,但它們不適合處理大量高維時(shí)間序列數(shù)據(jù)。為了深入了解此類數(shù)據(jù),深度學(xué)習(xí)方法越來越受歡迎。例如,自動(dòng)編碼器及其擴(kuò)展已被用于分析駕駛風(fēng)格[18]和駕駛員行為[19],這從經(jīng)驗(yàn)上證明了它的有效性。對(duì)于自動(dòng)駕駛汽車,來自這些手動(dòng)預(yù)定類別的學(xué)習(xí)模型可能會(huì)受到以下限制:
1)手動(dòng)標(biāo)記大量高維數(shù)據(jù)需要過多的時(shí)間和資源成本,并且由于數(shù)據(jù)分析師的各種先驗(yàn)知識(shí)而可能產(chǎn)生大的偏差。
2)用最適合人類理解的“駕駛相遇”分類來學(xué)習(xí)自動(dòng)駕駛汽車的決策,可能不會(huì)產(chǎn)生最合適的結(jié)果。
本文提出了一個(gè)無監(jiān)督的框架,即結(jié)合自動(dòng)編碼器和k - means聚類( AE - kMC ),以較少的主觀干擾自動(dòng)聚類“駕駛相遇”。自動(dòng)編碼器被用作在“駕駛相遇”分類器中提取隱藏特征的組件。這些數(shù)據(jù)是由M市歷時(shí)五年時(shí)間收集的,該市有2800多輛汽車,包括商用卡車和過境車輛。這項(xiàng)工作的最初貢獻(xiàn)是開發(fā)并實(shí)現(xiàn)了一個(gè)基于自動(dòng)編碼器的框架,根據(jù)識(shí)別出的特征自動(dòng)標(biāo)記“駕駛相遇”。據(jù)我們所知,這在其他地方還沒有被提出過。最后,我們對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行了綜合分析。源代碼可以在這里找到:https://github.com/zhao-lab/li-18-deep-unsupervised-ivs.
論文的其余部分組織如下:第Ⅱ節(jié)詳細(xì)介紹了開發(fā)的AE - kMC方法;第III節(jié)顯示了“車輛相遇”數(shù)據(jù)收集和模型訓(xùn)練程序;第IV節(jié)展示了實(shí)驗(yàn)結(jié)果;第V節(jié)是結(jié)論和今后的工作。
Ⅱ.無監(jiān)督學(xué)習(xí)方法
在本節(jié)中,我們將介紹兩種不同的無監(jiān)督方案,使用k - means聚類和AE - kMC自動(dòng)聚類“車輛相遇”。接下來,我們將介紹傳統(tǒng)自動(dòng)編碼器的理論基礎(chǔ)、自動(dòng)編碼器神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)以及k - means聚類方法。
A.自動(dòng)編碼器框架
在這項(xiàng)工作中實(shí)現(xiàn)的自動(dòng)編碼器是一個(gè)典型的自動(dòng)編碼器,包含一個(gè)編碼器和一個(gè)解碼器,如圖1所示。
圖1:典型自動(dòng)編碼器的結(jié)構(gòu)。
1 )編碼器:在圖1中用橙色框標(biāo)記的編碼器將輸入數(shù)據(jù)X∈Rn映射成隱藏表示X∈Rm[ 20 ]:
其中W∈Rm*n權(quán)重矩陣,b∈Rm是偏差項(xiàng)。
圖2 :本文使用的自動(dòng)編碼器的結(jié)構(gòu)。
與只有一個(gè)輸入層和一個(gè)輸出層的普通編碼器不同,我們使用的編碼器是四層神經(jīng)網(wǎng)絡(luò),包含一個(gè)輸入層( L1 )、兩個(gè)隱藏層( L2和L3 )和一個(gè)輸出層( L4 ),如圖2所示。添加了兩個(gè)隱藏層,因?yàn)楦鶕?jù)通用逼近器定理[21],這兩個(gè)額外層中的每一個(gè)都代表任何函數(shù)的近似值。改進(jìn)的編碼器有利于新的深度,因?yàn)榭梢越档陀?xùn)練成本(計(jì)算成本和訓(xùn)練數(shù)據(jù)大?。21]。
其中Xi是層Li的輸入數(shù)據(jù)表示,而Wi,i+1和bi,i+1是權(quán)重向量和偏向量,分別能夠?qū)i映射到Xi+1。請(qǐng)注意,第4層的數(shù)據(jù)表示是輸入數(shù)據(jù)的代碼或隱藏特征。
2)解碼器:編碼數(shù)據(jù)或來自編碼器的隱藏表示將通過層L5和L7映射回,層L5和L7是原始輸入數(shù)據(jù)X的重建表示。注意,這項(xiàng)工作中使用的解碼器是一個(gè)深層神經(jīng)網(wǎng)絡(luò),它包含一個(gè)輸入層( L4 )、兩個(gè)隱藏層( L5和L6 )和一個(gè)輸出層。
B.優(yōu)化
為了從隱藏特征重構(gòu)輸入數(shù)據(jù),重構(gòu)的表示和原始輸入之間的誤差應(yīng)該被最小化。因此,成本函數(shù)可以定義為:
其中Ω是包含權(quán)重向量和每層偏置向量的參數(shù)集,gΩ是將隱藏表示x映射到的映射。然后,優(yōu)化問題被定義為:
C.k-Means聚類
k - means聚類是一種流行的無監(jiān)督機(jī)器學(xué)習(xí)分類技術(shù)。將訓(xùn)練好的自動(dòng)編碼器應(yīng)用于原始“車輛相遇”數(shù)據(jù),可以提取隱藏特征,然后將其輸入k - means聚類。給定n個(gè)觀測(cè)值并定義k類,k-means聚類方法通過求解優(yōu)化問題將觀測(cè)值聚類成k組。
其中|xi-vj|是質(zhì)心和觀測(cè)之間的歐幾里德距離[22]。目標(biāo)函數(shù)嘗試選擇能夠最小化到屬于其各自聚類的所有點(diǎn)距離的質(zhì)心,從而使這些質(zhì)心代表周圍的數(shù)據(jù)點(diǎn)聚類。
III.數(shù)據(jù)收集和實(shí)驗(yàn)
A.數(shù)據(jù)收集
圖3:“駕駛相遇”的示例。暗點(diǎn)是起點(diǎn),光點(diǎn)是終點(diǎn)
我們使用的是安全試驗(yàn)?zāi)P筒渴穑⊿PMD)數(shù)據(jù)庫,該數(shù)據(jù)庫提供了足夠的自然數(shù)據(jù)[6]。該數(shù)據(jù)庫由密歇根大學(xué)交通研究所( UMTRI )負(fù)責(zé),提供了過去五年在安娜堡地區(qū)記錄的駕駛數(shù)據(jù)。它包括大約3,500輛裝備的車輛和總共600萬次旅程。由機(jī)載GPS采集用于聚類的緯度和高度信息。對(duì)于每輛配備的車輛,數(shù)據(jù)收集過程從點(diǎn)火開始,以10hz的采樣頻率收集。
我們使用了100,000次旅程的數(shù)據(jù)集,從1900輛車中收集了12天的運(yùn)行數(shù)據(jù)。我們提取的軌跡信息包括車輛的緯度,經(jīng)度,速度和航向角。選擇范圍限制在市區(qū),緯度和經(jīng)度范圍分別為(-83.82,-83.64)和(42.22,42.34)。“車輛相遇”被定義為車輛距離小于100米的情況,如圖3所示。點(diǎn)表示每個(gè)采樣時(shí)間的車輛位置。在從SPMD數(shù)據(jù)庫查詢后,我們遇到了49,998次“車輛相遇”。
這些遭遇的分布如圖4所示。可以包含軌跡的最小矩形的中心點(diǎn)用于在一幅圖像中包含大量軌跡。注意,為了減少計(jì)算負(fù)荷,隨機(jī)選擇10,000次相遇來測(cè)試無監(jiān)督的聚類方法。
圖4:“駕駛相遇”的分布。
B.模型訓(xùn)練過程
圖5:模型訓(xùn)練過程中的成本。
一次“車輛相遇”的GPS數(shù)據(jù)被用作自動(dòng)編碼器的輸入。在此之前,數(shù)據(jù)被標(biāo)準(zhǔn)化因而可以將所有訓(xùn)練數(shù)據(jù)放在相同的范圍內(nèi)。在均勻分布之后,使用1和-1之間的隨機(jī)數(shù)初始化每個(gè)層的權(quán)重。更具體地說,我們?cè)O(shè)定了、、、、。采用經(jīng)典的隨機(jī)梯度下降法進(jìn)行學(xué)習(xí),訓(xùn)練過程中的成本函數(shù)值如圖5所示,訓(xùn)練誤差收斂到0.041,這表明訓(xùn)練有素的自動(dòng)編碼器可以重建隱藏特征的輸入數(shù)據(jù)。圖6示出了自動(dòng)編碼器的原始輸入的示例,即原始車輛GPS軌跡。
圖6:原始車輛交互軌跡。 水平軸和垂直軸分別是車輛的經(jīng)度和緯度。
IV.結(jié)果分析與討論
在這一部分,我們將展示和比較兩種無監(jiān)督學(xué)習(xí)方法獲得的聚類結(jié)果。在真實(shí)的交通環(huán)境中,典型的“駕駛相遇”主要包括四種情況:
1)A類:兩輛車在交叉路口相遇。
2)B類:兩輛車在道路的相反方向相遇。
3)C類:一輛車?yán)@過另一輛車;
4)D類:兩輛車在同一條道路上相互作用(有或沒有車道變換)。
圖7顯示了一個(gè)聚類結(jié)果的例子,其中包含交叉路口的交互行為。開發(fā)的AE-kMC成功地將車輛相互作用分為上述四類。
圖7:在交叉點(diǎn)遇到的兩輛車的集群。圓圈表示起始位置,十字表示終點(diǎn)位置。
圖8顯示了兩輛車從相反方向在同一道路上相遇的情景;圖9顯示了兩輛車在同一條道路上的相互作用。請(qǐng)注意,車道更改操作包含在此群集中,但很難從結(jié)果中識(shí)別。
圖8 :兩組車輛在同一條道路上相遇,方向相反。
圖9 :在同一條道路上遇到的兩輛車的集群。
一輛車經(jīng)過另一輛車的交通場景如圖10所示。注意,在這種情況下,一輛車是靜止的(圖10a、圖10b、圖10c和圖10d ),或者是移動(dòng)的,但是距離另一輛車較遠(yuǎn)(圖10e和圖10f )。
圖10 :一輛車經(jīng)過另一輛車的集群。
為了評(píng)估準(zhǔn)確性,我們隨機(jī)混洗并重新采樣了從提議的方法中獲得的每個(gè)聚類的100個(gè)樣本,然后我們手動(dòng)識(shí)別那些不符合聚類中大多數(shù)樣本顯示模式的樣本。因此,每個(gè)群集的性能通過以下方式計(jì)算
其中nabnormal是異常數(shù)據(jù)的數(shù)量,Nsample= 100。我們提出的方法可以對(duì)具有相似地理特征的“車輛相遇”進(jìn)行聚類,但是每個(gè)聚類仍然包含異?!榜{駛相遇”。表一顯示了集群的性能。還評(píng)估了僅使用k - means聚類的方法,結(jié)果表明,與使用AE - kMC的方法相比,該方法還可以將上述具有較低性能的車輛交互類別進(jìn)行聚類。
表一:聚類性能分析
V.結(jié)論和今后的工作
在本文中,我們提出了一種無監(jiān)督學(xué)習(xí)方法來聚類“車輛相遇”數(shù)據(jù)。更具體地說,引入自動(dòng)編碼器來提取“駕駛相遇”的隱藏特征,然后使用k - means聚類方法對(duì)提取的特征進(jìn)行分組。所提出的AE - kMC方法最終獲得了五種主要的典型車輛相遇類型,包括:1)兩輛車相互交叉; 2)兩輛車合并; 3)兩輛車在一條道路的相反方向相遇; 4)一輛車?yán)@過另一輛車; 5)兩輛車在同一條道路上相互作用(有或沒有車道變換)。我們還比較了改進(jìn)的AE - kMC方法和k - means聚類方法,結(jié)果表明我們改進(jìn)的AE - kMC方法優(yōu)于k - means聚類方法。
在未來的工作中,我們將專注于提高無監(jiān)督聚類方法的準(zhǔn)確性,包括評(píng)估不同類型的自動(dòng)編碼器和聚類方法。此外,將研究目標(biāo)“車輛相遇”提取,例如,環(huán)形交通環(huán)境中的車輛交互。
致謝
感謝豐田研究院(“TRI”)提供資金協(xié)助作者進(jìn)行研究,但本文僅反映其作者的意見和結(jié)論,而非代表TRI或任何其他豐田實(shí)體。
REFERENCES
[1] J. Nilsson, J. Silvlin, M. Brannstrom,E. Coelingh, and J. Fredriksson,“If, when, and how to perform lane change maneuvers on highways,”IEEEIntelligent Transportation Systems Magazine, vol. 8, no. 4, pp.68–78, 2016.
[2] J. Nilsson, M. Br¨annstr¨om, E. Coelingh,and J. Fredriksson, “Lane change maneuvers for automated vehicles,” IEEETransactions on Intelligent Transportation Systems, vol. 18, no. 5, pp.1087–1096,2017.
[3] Q. H. Do, H. Tehrani, S. Mita, M.Egawa, K. Muto, and K. Yoneda,“Human drivers based active-passive model for automated lane change,”IEEE Intelligent Transportation Systems Magazine, vol. 9, no. 1, pp. 42–56,2017.
[4] C. Hubmann, M. Becker, D. Althoff, D. Lenz,and C. Stiller, “Decision making for autonomous driving considering interactionand uncertain prediction of surrounding vehicles,” in Intelligent VehiclesSymposium (IV), 2017 IEEE. IEEE, 2017, pp. 1671–1678.
[5] M. Kuderer, S. Gulati, and W. Burgard,“Learning driving styles for autonomous vehicles from demonstration,” inRobotics and Automation (ICRA), 2015 IEEE International Conference on. IEEE,2015, pp. 2641–2646.
[6] W. Wang, C. Liu, and D. Zhao, “How muchdata are enough? A statistical approach with case study on longitudinal drivingbehavior,” IEEE Transactions on Intelligent Vehicles, vol. 2, no. 2, pp. 85–98,2017.
[7] N. Li, D. W. Oyler, M. Zhang, Y. Yildiz,I. Kolmanovsky, and A. R. Girard, “Game theoretic modeling of driver andvehicle interactions for verification and validation of autonomous vehiclecontrol systems,” IEEE Transactions on Control Systems Technology, vol. PP, no.99, pp. 1–16, 2017.
[8] W. Wang and D. Zhao, “Extractingtraffic primitives directly from naturalistically logged data for self-drivingapplications,” IEEE Robotics and Automation Letters, 2018, DOI: 10.1109/LRA.2018.2794604.
[9] D. Zhao, Y. Guo, and Y. J. Jia,“Trafficnet: An open naturalistic driving scenario library,” arXiv preprintarXiv:1708.01872, 2017.
[10] D. Zhao, H. Lam, H. Peng, S. Bao, D.J. LeBlanc, K. Nobukawa, and C. S. Pan, “Accelerated evaluation of automatedvehicles safety in lane-change scenarios based on importance sampling techniques,”IEEE transactions on intelligent transportation systems, vol. 18, no. 3, pp.595–607, 2017.
[11] D. Zhao, X. Huang, H. Peng, H. Lam, andD. J. LeBlanc, “Accelerated evaluation of automated vehicles in car-followingmaneuvers,” IEEE Transactions on Intelligent Transportation Systems, 2017.
[12] Z. Huang, H. Lam, D. J. LeBlanc, and D.Zhao, “Accelerated evaluation of automated vehicles using piecewise mixturemodels,” IEEE Transactions on Intelligent Transportation Systems, 2017.
[13] E. Ohn-Bar and M. M. Trivedi, “Are allobjects equal? deep spatiotemporal importance prediction in driving videos,”Pattern Recognition, vol. 64, pp. 425–436, 2017.
[14] T. Appenzeller, “The scientists’apprentice,” Science, vol. 357, no. 6346, pp. 16–17, 2017.
[15] M. Erdmann, E. Ward, K. Ikeda, G. Hattori,C. Ono, and Y. Takishima,“Automatic labeling of training data for collecting tweets for ambiguoustv program titles,” in 2013 International Conference on Social Computing, Sept2013, pp. 796–802.
[16] C. M. Martinez, M. Heucke, F.-Y. Wang,B. Gao, and D. Cao, “Driving style recognition for intelligent vehicle controland advanced driver assistance: A survey,” IEEE Transactions on IntelligentTransportation Systems, 2017, DOI: 10.1109/TITS.2017.2706978.
[17] W. Wang, J. Xi, A. Chong, and L. Li,“Driving style classification using a semisupervised support vector machine,”IEEE Transactions on Human-Machine Systems, vol. 47, no. 5, pp. 650–660, 2017.
[18] W. Dong, T. Yuan, K. Yang, C. Li, andS. Zhang, “Autoencoder regularized network for driving style representationlearning,” arXiv preprint arXiv:1701.01272, 2017.
[19] H. Liu, T. Taniguchi, Y. Tanaka, K.Takenaka, and T. Bando, “Visualization of driving behavior based on hiddenfeature extraction by using deep learning,” IEEE Transactions on IntelligentTransportation Systems, vol. 18, no. 9, pp. 2477–2489, 2017.
[20] P. Vincent, H. Larochelle, I. Lajoie,Y. Bengio, and P.-A. Manzagol,“Stacked denoising autoencoders: Learning useful representations in adeep network with a local denoising criterion,” Journal of Machine LearningResearch, vol. 11, no. Dec, pp. 3371–3408, 2010.
[21] I. Goodfellow, Y. Bengio, A. Courville,and Y. Bengio, Deep learning. MIT press Cambridge, 2016, vol. 1.
[22] A. K. Jain, “Data clustering: 50 yearsbeyond k-means,” Pattern recognition letters, vol. 31, no. 8, pp. 651–666,2010.
[23] X. Huang, D. Zhao, and H. Peng, “Empiricalstudy of dsrc performance based on safety pilot model deployment data,” IEEETransactions on Intelligent Transportation Systems, 2017.
-
傳感技術(shù)
+關(guān)注
關(guān)注
4文章
528瀏覽量
46270 -
自動(dòng)駕駛
+關(guān)注
關(guān)注
783文章
13694瀏覽量
166166
原文標(biāo)題:一種聚類“車輛駕駛相遇”數(shù)據(jù)的深度無監(jiān)督學(xué)習(xí)方法
文章出處:【微信號(hào):IV_Technology,微信公眾號(hào):智車科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論