日本无码免费高清在线|成人日本在线观看高清|A级片免费视频操逼欧美|全裸美女搞黄色大片网站|免费成人a片视频|久久无码福利成人激情久久|国产视频一二国产在线v|av女主播在线观看|五月激情影音先锋|亚洲一区天堂av

  • 手機(jī)站
  • 小程序

    汽車測(cè)試網(wǎng)

  • 公眾號(hào)
    • 汽車測(cè)試網(wǎng)

    • 在線課堂

    • 電車測(cè)試

安徽大學(xué)王曉教授等|智繪軌跡,認(rèn)知未來:一種考慮駕駛風(fēng)險(xiǎn)認(rèn)知的軌跡規(guī)劃方法

2024-07-20 19:12:10·  來源:智車科技  
 


01 導(dǎo)讀


自動(dòng)駕駛車輛在復(fù)雜高動(dòng)態(tài)路口場(chǎng)景的軌跡規(guī)劃是一項(xiàng)充滿挑戰(zhàn)的任務(wù),特別是在與人類駕駛車輛頻繁互動(dòng)時(shí),需要考慮周邊車輛不確定的駕駛行為所帶來的駕駛風(fēng)險(xiǎn)。為了應(yīng)對(duì)這一挑戰(zhàn),安徽大學(xué)王曉教授及其團(tuán)隊(duì)提出了一種社會(huì)適應(yīng)性和安全敏感的軌跡規(guī)劃(S4TP)框架,該方法特別考慮了周圍人類駕駛車輛的駕駛意圖,通過建立一個(gè)以自動(dòng)駕駛車輛為中心的駕駛風(fēng)險(xiǎn)場(chǎng)模型來表示車輛對(duì)周圍環(huán)境的主觀風(fēng)險(xiǎn)感知,進(jìn)一步應(yīng)對(duì)復(fù)雜交叉路口場(chǎng)景中其他車輛的不確定性社會(huì)互動(dòng)行為,從而在保證車輛駕駛安全的前提下,實(shí)現(xiàn)更加高效的自動(dòng)駕駛決策。該研究形成了名為“S4TP: Social-Suitable and Safety-Sensitive Trajectory Planning for Autonomous Vehicles”的論文成果,已被《IEEE Transactions on Intelligent Vehicles》期刊接受并發(fā)表在2024年第9卷第2期。


引用格式:

1. Wang et al. S4TP: Social-Suitable and Safety-Sensitive Trajectory Planning for Autonomous Vehicles [J]. IEEE Transactions on Intelligent Vehicles, 2024, 9(2):3220- 3231.

2. Wang, Xiao and Tang, Ke and Dai, Xingyuan and Xu, Jintao and Du, Quancheng and Ai, Rui and Wang, Yuxiao and Gu, Weihao. S4TP: Social-Suitable and Safety-Sensitive Trajectory Planning for Autonomous Vehicles [J]. IEEE Transactions on Intelligent Vehicles, 2024, 9(2): 3220- 3231.

全文鏈接:https://ieeexplore.ieee.org/abstract/document/10337798或arxiv版本鏈接:https://arxiv.org/abs/2404.11946。


02  論文介紹


1、研究背景


自動(dòng)駕駛車輛(AVs)在公共道路上的行駛需要與人類駕駛車輛(HDVs)進(jìn)行頻繁的社會(huì)互動(dòng)。這些互動(dòng)因?yàn)轳{駛員之間不同的社會(huì)偏好而引入駕駛不確定性,導(dǎo)致自動(dòng)駕駛車輛難以感知周圍的駕駛風(fēng)險(xiǎn)場(chǎng)狀況。在復(fù)雜的交通場(chǎng)景中,例如無保護(hù)左轉(zhuǎn)路口和超車等,AVs需要全面感知周圍環(huán)境風(fēng)險(xiǎn)方能做出安全有效的決策規(guī)劃。然而,已有工作中所涉及的駕駛風(fēng)險(xiǎn)評(píng)估方式存在不足,其忽略了HDV的駕駛意圖對(duì)SDV的影響,因而無法有效應(yīng)對(duì)駕駛環(huán)境中的不確定性和多模態(tài)性,進(jìn)而對(duì)自車周圍駕駛風(fēng)險(xiǎn)的評(píng)估缺少準(zhǔn)確性。例如,傳統(tǒng)的基于軌跡預(yù)規(guī)劃的風(fēng)險(xiǎn)研判是一種較為粗粒度的方法,其將軌跡規(guī)劃分成了多模態(tài)軌跡生成與軌跡選擇兩個(gè)環(huán)節(jié),該類方法與人類實(shí)際駕駛過程存在顯著差異。此外,基于駕駛風(fēng)險(xiǎn)場(chǎng)的軌跡規(guī)劃方法側(cè)重于感知靜態(tài)風(fēng)險(xiǎn),未能有效處理復(fù)雜高動(dòng)態(tài)場(chǎng)景中的駕駛場(chǎng)景,因而導(dǎo)致自動(dòng)駕駛車輛在軌跡規(guī)劃過程中變得異常困難,并且無法保證自動(dòng)駕駛車輛在行駛過程中的安全性。


2、框架概覽


本研究提出了一種社會(huì)適應(yīng)性和安全敏感的軌跡規(guī)劃(S4TP)框架,主要用于解決自動(dòng)駕駛對(duì)周圍車輛駕駛風(fēng)險(xiǎn)感知不準(zhǔn)確問題,其目標(biāo)是為了實(shí)現(xiàn)自動(dòng)駕駛車量安全高效的駕駛決策。該方法框架如圖1所示。具體來說,S4TP包括社會(huì)感知軌跡預(yù)測(cè)(SATP)和社會(huì)感知駕駛風(fēng)險(xiǎn)場(chǎng)(SADRF)模塊。其中,SATP利用Transformer有效編碼駕駛場(chǎng)景信息,并在預(yù)測(cè)解碼過程中結(jié)合AV的規(guī)劃軌跡。SADRF評(píng)估AV與具有不同社會(huì)交互特性的HDVs互動(dòng)期間預(yù)期的周圍駕駛風(fēng)險(xiǎn)程度,并以AV為中心的二維熱力圖形式呈現(xiàn)。SADRF模擬周圍HDVs的駕駛意圖,并基于車輛互動(dòng)的表示預(yù)測(cè)軌跡。S4TP使用預(yù)測(cè)的HDVs軌跡作為輸入,通過整合社交感知駕駛風(fēng)險(xiǎn)場(chǎng),S4TP在低風(fēng)險(xiǎn)區(qū)域內(nèi)執(zhí)行AV規(guī)劃軌跡的實(shí)時(shí)在線優(yōu)化,從而提高規(guī)劃軌跡的安全性和可解釋性。通過在SMARTS仿真器中進(jìn)行的測(cè)試,S4TP在無保護(hù)左轉(zhuǎn)路口、并道、巡航和超車等復(fù)雜社會(huì)交互場(chǎng)景中展現(xiàn)了卓越的性能,實(shí)現(xiàn)了100%的通過率,超越了現(xiàn)有的最先進(jìn)方法。


undefined

圖1S4TP模型架構(gòu)


3、實(shí)驗(yàn)設(shè)計(jì)及驗(yàn)證


3.1 實(shí)驗(yàn)設(shè)計(jì)


(1)場(chǎng)景編碼器:我們通過Transformer網(wǎng)絡(luò)對(duì)場(chǎng)景進(jìn)行編碼處理。在路口場(chǎng)景下,對(duì)于自車周圍的所有智能體i,編碼器的輸入數(shù)據(jù)包括智能體的歷史狀態(tài)$n_{-T_h:0}^i$和本地地圖折線$\Gamma$。此外,我們明確考慮了自車與周圍車輛之間的交互關(guān)系,在輸入數(shù)據(jù)中加入AV的歷史狀態(tài)$n_{-T_h:0}^e$信息以構(gòu)建完整的交互圖。為了保持張量的固定形狀,我們考慮將歷史軌跡中的缺失的時(shí)間步以及地圖折線中的缺失點(diǎn)填充為零。我們的模型在實(shí)驗(yàn)中選用一定數(shù)量的靠近AV的智能體(實(shí)驗(yàn)中設(shè)置為5個(gè)),并在數(shù)量不足時(shí)進(jìn)行零填充。原始輸入的地圖折線通過多層感知機(jī)(MLP)進(jìn)行編碼。對(duì)于自車周圍其他的智能體的歷史軌跡信息,我們采用基于Transformer的自注意層來進(jìn)行編碼處理,用于提取歷史軌跡上的時(shí)間關(guān)系。正如圖中所示,我們使用分層的Transformer模塊對(duì)agent-agent以及agent-map的關(guān)系進(jìn)行編碼。具體而言,我們通過將所有agent表示為所構(gòu)建的交互圖中的節(jié)點(diǎn)形式,并使用自注意力Transformer模塊來處理圖中信息已捕獲圖中agent-agent之間的交互關(guān)系。然后結(jié)合交叉注意力Transformer層來獲取agent-map之間的關(guān)系。其中,query作為智能體的交互特征,key和value作為地圖折線的特征向量表示。最后,對(duì)于每個(gè)周圍的agent,其歷史特征、交互特征和地圖注意力特征被連接并通過軌跡預(yù)測(cè)解碼器傳遞,以生成預(yù)測(cè)的未來軌跡。


2)軌跡預(yù)測(cè)解碼器:相比其他循環(huán)神經(jīng)網(wǎng)絡(luò)(如RNN或者LSTM),門控循環(huán)單元(GRU)具有更少的參數(shù)且不需要顯式的記憶單元,因此在處理長(zhǎng)序列時(shí)具有更好的表現(xiàn)。我們?cè)谀P椭惺褂肎RU通過自回歸的方式解碼agent在未來一段時(shí)間內(nèi)的狀態(tài)序列。為了明確建模AV對(duì)周圍agent未來動(dòng)作的影響,我們將自車時(shí)刻t的運(yùn)動(dòng)狀態(tài)$m_t^e$輸入到GRU中來模擬AV對(duì)agent未來狀態(tài)的影響,并做出交互感知預(yù)測(cè)。具體來說,在將來的每一個(gè)時(shí)刻,GRU接受上一個(gè)時(shí)刻的隱藏狀態(tài)以和最后的預(yù)測(cè)狀態(tài),以及該時(shí)刻AV狀態(tài)的聯(lián)合輸入表示。通過對(duì)隱藏狀態(tài)進(jìn)行更新來解碼agent狀態(tài)的變化(包括x坐標(biāo)、y坐標(biāo)以及偏航角$\theta$,并將該狀態(tài)信息與上一時(shí)刻得狀態(tài)相加,進(jìn)而得到當(dāng)前時(shí)刻的預(yù)測(cè)狀態(tài)。為了考慮AV對(duì)未處于沖突區(qū)agent的影響,我們通過引入交互門控網(wǎng)絡(luò)$\mathbb{G}$ 來建模路口場(chǎng)景下AV與目標(biāo)agent之間的成對(duì)交互關(guān)系。


(3)社會(huì)感知駕駛風(fēng)險(xiǎn)場(chǎng):本文構(gòu)建一種考慮社會(huì)偏好的自適應(yīng)駕駛安全風(fēng)險(xiǎn)場(chǎng)方法。該方法將基于記憶與注意力的全場(chǎng)景表征作為輸入,通過考慮基于社會(huì)交互的軌跡預(yù)測(cè)進(jìn)一步生成適應(yīng)于周圍車輛駕駛員社會(huì)偏好的風(fēng)險(xiǎn)場(chǎng)。具體來說,我們首先基于交互式預(yù)測(cè)模塊得到其他車輛多模態(tài)軌跡預(yù)測(cè),然后結(jié)合自車采樣軌跡和其他車輛多模態(tài)預(yù)測(cè)軌跡,構(gòu)建了自適應(yīng)動(dòng)態(tài)風(fēng)險(xiǎn)場(chǎng)模型。通過所構(gòu)建的風(fēng)險(xiǎn)場(chǎng)作為自車規(guī)劃的約束條件。風(fēng)險(xiǎn)場(chǎng)公式如下:


圖片


其中,高斯分布的高度a和寬度σ是弧長(zhǎng)s的函數(shù);(x_c,y_c)為上一時(shí)刻車輛旋轉(zhuǎn)中心,R_car是根據(jù)車輛軸距L和轉(zhuǎn)向角δ計(jì)算出的軌跡預(yù)測(cè)半徑,c是風(fēng)險(xiǎn)場(chǎng)模型在自車當(dāng)前位置的寬度。G(x,y)根據(jù)每個(gè)(x,y)處的坐標(biāo)值,將概率分配給下一步中車輛的可能位置。


(4)基于SADRF的軌跡規(guī)劃:通過構(gòu)建基于駕駛員風(fēng)險(xiǎn)場(chǎng)的軌跡規(guī)劃方法,我們可以將自車周圍的風(fēng)險(xiǎn)因素(如其他車輛、行人、障礙物等)映射到一個(gè)二維熱力圖表示的風(fēng)險(xiǎn)場(chǎng)中,并以未來一定時(shí)段內(nèi)的總風(fēng)險(xiǎn)之和作為評(píng)價(jià)自車軌跡安全性的標(biāo)準(zhǔn);然后在風(fēng)險(xiǎn)場(chǎng)中搜索最優(yōu)軌跡。相比于傳統(tǒng)的靜態(tài)風(fēng)險(xiǎn)場(chǎng)方法,我們更加細(xì)粒度地對(duì)自車軌跡規(guī)劃的風(fēng)險(xiǎn)進(jìn)行建模,直觀地表示出環(huán)境中的風(fēng)險(xiǎn)分布,能夠?qū)崿F(xiàn)更加安全、魯棒性更強(qiáng)的自車軌跡規(guī)劃效果。


3.2 實(shí)驗(yàn)結(jié)果分析


(1)數(shù)據(jù)集與評(píng)價(jià)指標(biāo):我們?cè)赟MARTS模擬器中設(shè)計(jì)了無保護(hù)左轉(zhuǎn)自動(dòng)駕駛場(chǎng)景,如圖2中所示的場(chǎng)景。在無信號(hào)無保護(hù)左轉(zhuǎn)路口場(chǎng)景中,自動(dòng)駕駛汽車需要處理交通從不同,并與其他代理協(xié)調(diào)以安全高效地通過路口。此外,為了證明我們所提方法的優(yōu)越性,我們還測(cè)試了另外三個(gè)經(jīng)典場(chǎng)景:(b)路口并道:自動(dòng)駕駛車輛在兩條或以上道路交叉口處匯合的情況。(c)道路巡航:自動(dòng)駕駛車輛沿著已知的道路線路行駛,同時(shí)遵守交通規(guī)則和安全法規(guī)。(d) 車道超車:自動(dòng)駕駛車輛在行駛過程中從后方超過前方行駛的車輛。此外,我們還采用了成功率、時(shí)間、類人性作為評(píng)估指標(biāo)來進(jìn)行實(shí)驗(yàn)結(jié)果評(píng)估。


圖片

圖2 SMART仿真器中涉及的4種駕駛場(chǎng)景


(2)性能分析


定量結(jié)果分析:由表1可知,在無保護(hù)左轉(zhuǎn)場(chǎng)景下,自動(dòng)駕駛車輛(AV)需要與來自不同方向的人類駕駛車輛(HDV)進(jìn)行協(xié)調(diào),以安全通過路口。然而,靜態(tài)DRF方法僅基于歷史數(shù)據(jù)和地理信息進(jìn)行場(chǎng)景編碼,無法考慮駕駛員的實(shí)時(shí)感知和特定社會(huì)偏好,導(dǎo)致不能動(dòng)態(tài)的捕捉到真實(shí)駕駛環(huán)境中的各種復(fù)雜情況和變化,因此成功率較低。SMARTS和Discrete-SAC采用傳統(tǒng)強(qiáng)化學(xué)習(xí)方法,在一定程度上取得了效果,但由于強(qiáng)化學(xué)習(xí)方法本身的缺點(diǎn),模型在復(fù)雜交互場(chǎng)景下的泛化能力較差。Safety-Balance方法考慮了周圍HDV的駕駛風(fēng)格,并使用基于Transformer的編解碼網(wǎng)絡(luò)來建模車輛之間的交互。雖然該方法側(cè)重于交叉路口場(chǎng)景的交互,在無保護(hù)左轉(zhuǎn)場(chǎng)景下表現(xiàn)不錯(cuò),但對(duì)比其他三個(gè)場(chǎng)景的效果一般。Fanta方法采用監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)相結(jié)合的方式進(jìn)行訓(xùn)練,并結(jié)合傳統(tǒng)基于規(guī)則的碰撞檢測(cè)模塊進(jìn)行自車決策規(guī)劃,因此取得了較好的結(jié)果。相比之下,我們的方法在Predictive-Decision的基礎(chǔ)上進(jìn)行改進(jìn),在自車的規(guī)劃階段引入了SADRF。這使得我們能夠動(dòng)態(tài)自適應(yīng)地對(duì)場(chǎng)景中的風(fēng)險(xiǎn)進(jìn)行建模,并實(shí)現(xiàn)對(duì)自車周圍駕駛風(fēng)險(xiǎn)的準(zhǔn)確評(píng)估。我們的方法具有更好的可解釋性和泛化性,因此在與其他方法的比較中實(shí)現(xiàn)了最佳結(jié)果。此外,對(duì)于其他路口場(chǎng)景,我們的方法在評(píng)估指標(biāo)“time” 和“humanness” 上也分別取得了最優(yōu)的實(shí)驗(yàn)結(jié)果,這也充分證明了S4TP能夠?qū)崿F(xiàn)一個(gè)更加安全舒適的自動(dòng)駕駛決策規(guī)劃。


表1多種場(chǎng)景下軌跡規(guī)劃方法實(shí)驗(yàn)對(duì)比



定性結(jié)果分析:圖2展示了在特定的未保護(hù)左轉(zhuǎn)路口場(chǎng)景中,我們的SADRF方法與 Predictive-Decision和靜態(tài)DRF進(jìn)行比較的可視化結(jié)果。為了更清晰地區(qū)分,軌跡規(guī)劃過程在第3、8、13和18幀進(jìn)行展示。此外,任何碰撞實(shí)例都被強(qiáng)調(diào)并清晰標(biāo)記。其中,Predictive-Decision操作時(shí)未添加SADRF,而靜態(tài)DRF則用靜態(tài)風(fēng)險(xiǎn)場(chǎng)替換SADRF。如圖2(a)所示,靜態(tài)DRF生成的策略過于保守,在通過路口時(shí)導(dǎo)致決策過程明顯減慢。此外,在重新啟動(dòng)過程中遇到了重大困難,最終與對(duì)向的HDV發(fā)生碰撞。同時(shí),圖2(b)展示了從第8到第18幀的結(jié)果,顯而易見的是,在完成軌跡規(guī)劃后,Predictive Decision在實(shí)時(shí)調(diào)整策略時(shí)遇到了困難,當(dāng)面臨侵略性或先前未注意到的車輛(未觀察到或被遮擋的車輛)突然出現(xiàn)在駕駛場(chǎng)景中時(shí),導(dǎo)致與人駕駛車輛發(fā)生碰撞。相比之下,如圖2 (c) 所示,S4TP在規(guī)劃之前為車輛分配了預(yù)設(shè)邊際,以預(yù)見未預(yù)料到的情況。與保守策略不同,S4TP動(dòng)態(tài)地適應(yīng)實(shí)時(shí)場(chǎng)景中其他HDV的運(yùn)動(dòng)。這可以確保在特定未來時(shí)刻避免危險(xiǎn)情況,并生成更像人類的駕駛軌跡。值得注意的是,我們的方法結(jié)合了一個(gè)駕駛風(fēng)險(xiǎn)場(chǎng)模型,使其能夠根據(jù)實(shí)時(shí)的道路條件和車輛狀態(tài)動(dòng)態(tài)調(diào)整駕駛風(fēng)險(xiǎn)場(chǎng)。這種自適應(yīng)能力可以更好地預(yù)測(cè)和避免潛在的風(fēng)險(xiǎn)和危險(xiǎn),從而產(chǎn)生更具人類特征的指標(biāo)。定量結(jié)果進(jìn)一步證實(shí)了這一創(chuàng)新特性在真實(shí)道路場(chǎng)景中提高了我們方法的適應(yīng)性,為自動(dòng)駕駛提供了更高級(jí)別的安全保障。


undefined

圖2場(chǎng)景可視化結(jié)果分析


4、總結(jié)



本文中,我們提出了一種社交適用且安全敏感的軌跡規(guī)劃方法,命名為S4TP。該方法考慮了復(fù)雜混合交通環(huán)境中與社交互動(dòng)相關(guān)的風(fēng)險(xiǎn),確保了自動(dòng)駕駛車輛(AVs)的軌跡規(guī)劃安全、高效且社交適用。所提出的方法采用基于Transformer的編碼和解碼模塊進(jìn)行場(chǎng)景表示,并使用交互式建模預(yù)測(cè)周圍HDVs的未來軌跡?;谶@些預(yù)測(cè)的多步軌跡,構(gòu)建了一個(gè)SADRF模型,以生成與人類駕駛行為一致的自動(dòng)駕駛軌跡。我們的方法利用端到端框架中的多任務(wù)學(xué)習(xí),促進(jìn)了在模擬駕駛場(chǎng)景中的訓(xùn)練和評(píng)估。結(jié)果表明,我們的方法優(yōu)于基準(zhǔn)方法。通過SADRF模塊,我們實(shí)現(xiàn)了比傳統(tǒng)的靜態(tài)DRF模型或忽略社交互動(dòng)的軌跡規(guī)劃方法更高的成功率。未來的研究將專注于將風(fēng)險(xiǎn)場(chǎng)模塊納入模型,建立行人-車輛交互關(guān)系,準(zhǔn)確識(shí)別行人位置和運(yùn)動(dòng)狀態(tài),并實(shí)現(xiàn)安全舒適的軌跡規(guī)劃。

分享到:
 
反對(duì) 0 舉報(bào) 0 收藏 0 評(píng)論 0
滬ICP備11026917號(hào)-25