面向結(jié)果的自動(dòng)駕駛功能評(píng)價(jià)
本文譯自《2018 IEEE Conference on Decision and Control (CDC)》,作者為Davide Gagliardi, Pavlo Tkachenko, Luigi del Re.
摘要:自動(dòng)駕駛功能(Autonomous Driving Functions,ADF)正在迅速發(fā)展,但業(yè)界仍未就如何在現(xiàn)實(shí)世界中測(cè)試它們的安全性和其他性能達(dá)成一致。由于時(shí)間和成本的限制,無(wú)法進(jìn)行充分的道路測(cè)試,因此普遍共識(shí)是需要基于仿真的測(cè)試評(píng)價(jià)。對(duì)于這樣的評(píng)價(jià),仿真中包含的場(chǎng)景應(yīng)代表被測(cè)功能的預(yù)期實(shí)際使用場(chǎng)景,但是關(guān)于時(shí)間范圍的選擇以及如何確保測(cè)試場(chǎng)景是否具有代表性尚沒(méi)有指南。在此背景下,本文旨在提出面向結(jié)果的方法以確定實(shí)現(xiàn)給定置信水平所需的仿真長(zhǎng)度,從而解決時(shí)間范圍選擇的問(wèn)題。這一方法使得不同仿真條件下的結(jié)果具有可比性,同時(shí)優(yōu)化了總仿真時(shí)間,并可用于評(píng)價(jià)其他場(chǎng)景的獨(dú)特性。
1、引言
自動(dòng)駕駛功能的重要性日益凸顯,但仍沒(méi)有統(tǒng)一的方法評(píng)價(jià)其性能。因?yàn)榈缆窚y(cè)試需要投入過(guò)多的時(shí)間和費(fèi)用,因此當(dāng)前業(yè)界普遍認(rèn)為需要一種仿真測(cè)試方法。用于測(cè)試的仿真環(huán)境通常包括3個(gè)關(guān)鍵部分:車(chē)輛模型(本車(chē))、被測(cè)系統(tǒng)模型(system under test , SUT, 此處即指ADF)和系統(tǒng)預(yù)期運(yùn)行環(huán)境條件模型。環(huán)境條件通常概述于“場(chǎng)景”中,包括但不限于道路屬性(車(chē)道數(shù)、坡度、出口、路障、道路條件等)、交通屬性(其他交通參與者的數(shù)量和速度、其他駕駛員的可能模型)和總體環(huán)境條件(能見(jiàn)度、天氣條件等)。典型的基于場(chǎng)景的ADF評(píng)價(jià)首先通過(guò)對(duì)真實(shí)數(shù)據(jù)分析識(shí)別得到相關(guān)交通狀況,然后對(duì)場(chǎng)景進(jìn)行建模并用于ADF的仿真和評(píng)價(jià)。

隨著ADF功能性提高和運(yùn)行持續(xù)時(shí)間延長(zhǎng),很難找到一組先驗(yàn)定義的相關(guān)場(chǎng)景。例如為了評(píng)價(jià)自適應(yīng)巡航控制器(Adaptive Cruise Controller, ACC)的燃油節(jié)省量,場(chǎng)景中必須包括實(shí)際交通中經(jīng)常出現(xiàn)的“正常工況”(normal cases);而對(duì)于安全性評(píng)價(jià),導(dǎo)致事故的“極限工況”(limit cases)至關(guān)重要。目前為止,對(duì)于同一功能的使用場(chǎng)景并沒(méi)有唯一的定義,以ACC為例,根據(jù)關(guān)注點(diǎn)是燃油經(jīng)濟(jì)性還是安全性,可以使用完全不同的場(chǎng)景進(jìn)行評(píng)價(jià)。考慮到這一情況,文獻(xiàn)中推薦使用連續(xù)交通微觀仿真環(huán)境,而不是純粹基于場(chǎng)景進(jìn)行測(cè)試,這些仿真環(huán)境包括旨在反映真實(shí)駕駛情況的交通模型。
仿真測(cè)試存在一些局限性。首先,仿真結(jié)果不是先驗(yàn)正確的,因?yàn)闆](méi)有模型是完美的并且可以無(wú)限精確地表示真實(shí)行為。其次,重要特征可能在建模階段受到人為影響,或者在仿真運(yùn)行中表現(xiàn)不足或過(guò)多,導(dǎo)致評(píng)價(jià)結(jié)果出現(xiàn)偏差。此外,盡管相比于道路測(cè)試,仿真測(cè)試速度更快且重復(fù)性好,但若考慮所有工況,仿真仍需要大量時(shí)間。在實(shí)踐中經(jīng)常使用先驗(yàn)停止標(biāo)準(zhǔn)(a priori stopping criteria)來(lái)執(zhí)行測(cè)試,例如每種工況的最長(zhǎng)仿真時(shí)間或固定重復(fù)次數(shù),由此得到的最終結(jié)果通常是無(wú)需進(jìn)一步分析的某些績(jī)效指標(biāo)的平均值。
已有研究顯示,在不評(píng)價(jià)統(tǒng)計(jì)特性的條件下使用和比較仿真結(jié)果可能會(huì)產(chǎn)生誤導(dǎo),因此我們建議將結(jié)果的統(tǒng)計(jì)顯著性評(píng)價(jià)與仿真運(yùn)行相關(guān)聯(lián),這可以為所有仿真運(yùn)行確定先驗(yàn)顯著性水平,以使結(jié)果有可比性或可用于其他方案的評(píng)價(jià)。
2、評(píng)價(jià)方法
2.1 ADF目標(biāo)確定
每個(gè)ADF具有至少有一個(gè)必須滿足的關(guān)鍵功能,例如ACC的速度跟蹤功能和制動(dòng)輔助的緊急情況減速功能等,通常用與控制器任務(wù)直接相關(guān)的可測(cè)變量來(lái)量化其性能。如果我們用變量x表示本車(chē)狀態(tài),則控制器目標(biāo)可用目標(biāo)集X*進(jìn)行識(shí)別。以ACC為例,目標(biāo)集是本車(chē)的期望速度。在評(píng)價(jià)已定義的ADF質(zhì)量,即實(shí)際數(shù)據(jù)與目標(biāo)集之間的差距時(shí),對(duì)于ACC,這可以是由周?chē)煌ǖ臄_動(dòng)引起的與期望速度的偏差。
2.2 與目標(biāo)一致的KPI定義
評(píng)價(jià)過(guò)程的第二步是定義一個(gè)能夠“觀察”SUT與期望目標(biāo)或行為間偏差的指數(shù)。若我們將SUT的狀態(tài)視為隨機(jī)過(guò)程X(t),則關(guān)鍵績(jī)效指標(biāo)(Key Performance Index,KPI)可定義為在系統(tǒng)狀態(tài)下通過(guò)定義函數(shù)f(KPI)得到的另一個(gè)隨機(jī)過(guò)程Y(t)。原則上,選定的函數(shù)f(KPI)既不能忽略SUT由于測(cè)試過(guò)程中的擾動(dòng)而產(chǎn)生的與其期望行為的偏差,也不能突出這一偏差。對(duì)函數(shù)f(KPI)的最低要求是單邊有界,并在X*處達(dá)到其最小值。為了清楚起見(jiàn),我們指出,原則上,KPI可以同時(shí)評(píng)估多個(gè)目標(biāo)但不能作為風(fēng)險(xiǎn)函數(shù)。只有在進(jìn)行單一安全評(píng)價(jià)的情況下才可以用風(fēng)險(xiǎn)函數(shù)表示KPI。
2.3 KPI描述統(tǒng)計(jì)值選定
由于KPI是一個(gè)隨機(jī)變量,我們感興趣的是它在統(tǒng)計(jì)方面的表征(本文中指其統(tǒng)計(jì)特征參數(shù))。因此,所研究參數(shù)的隨機(jī)“時(shí)刻”(平均值、方差或等效標(biāo)準(zhǔn)偏差)、中位數(shù)以及形狀參數(shù)(如偏度、峰度、所研究參數(shù)的置信區(qū)間)是出于這一目的考慮的自然統(tǒng)計(jì)參數(shù)。用通用統(tǒng)計(jì)數(shù)據(jù)值q(KPI)描述KPI,并假設(shè)由于實(shí)際原因,q(KPI)是有限的。
這些參數(shù)的估計(jì)只能通過(guò)在仿真期間收集KPI測(cè)量值來(lái)完成。應(yīng)特別注意用于收集測(cè)量值和估計(jì)隨機(jī)過(guò)程統(tǒng)計(jì)數(shù)據(jù)的方法,因?yàn)橐话銇?lái)說(shuō)它會(huì)影響估計(jì)。
2.4 仿真流程定義
對(duì)于隨機(jī)過(guò)程,文獻(xiàn)中提供了大量針對(duì)期望算子的估計(jì)方法。通常,不同的估計(jì)程序可導(dǎo)致對(duì)相同量估計(jì)的不同,這些結(jié)果既受基礎(chǔ)隨機(jī)過(guò)程的性質(zhì)的影響,也受到用于評(píng)價(jià)的樣本的代表性的影響。另外,抽樣過(guò)程也取決于估計(jì)目標(biāo)。
第一種期望估計(jì)方法稱(chēng)為遍歷。這一方法假設(shè)在足夠長(zhǎng)的觀察時(shí)間內(nèi),隨機(jī)過(guò)程的每個(gè)軌跡都將在相同的評(píng)價(jià)時(shí)刻顯示其樣本幾何的相同特征,即狀態(tài)空間平均值可以用時(shí)間平均值代替。第二種期望估計(jì)方法稱(chēng)為蒙特卡洛方法,這一方法將隨機(jī)過(guò)程Y中的N個(gè)互相獨(dú)立的、時(shí)長(zhǎng)足夠的仿真中出現(xiàn)的極限值視為總體樣本。
2.5 收斂準(zhǔn)則定義
仿真運(yùn)行期間,模擬器產(chǎn)生的場(chǎng)景(包括周?chē)煌ê捅拒?chē)的軌跡)會(huì)擾亂SUT,并通過(guò)估計(jì)KPI的值測(cè)量實(shí)際數(shù)據(jù)與控制器目標(biāo)間的偏差。經(jīng)過(guò)一定的仿真時(shí)間(或n個(gè)樣本)后,將不再有新事件產(chǎn)生,即KPI的統(tǒng)計(jì)量不會(huì)隨著仿真時(shí)間的增加而顯著變化。收斂意味著隨著仿真時(shí)間的增加,統(tǒng)計(jì)量的估計(jì)值會(huì)收斂到一個(gè)恒定值,并且值置信水平很高。一般而言,從統(tǒng)計(jì)角度來(lái)看,關(guān)鍵是有足夠的樣本量以確保KPI統(tǒng)計(jì)量具有一定的置信度。
3、應(yīng)用案例及結(jié)果
3.1 應(yīng)用案例
ACC在跟蹤期望速度的同時(shí),還應(yīng)確保不會(huì)對(duì)周?chē)煌ㄔ斐晌kU(xiǎn)。在本文中,我們以ACC功能評(píng)價(jià)為例應(yīng)用所提出的方法??刂破鬏斎霝榭v向加速度a,并考慮到真實(shí)駕駛情況,將a的值限定在±2.5m/s^2之間??刂破鲃t根據(jù)本車(chē)狀態(tài)變量進(jìn)行控制,周?chē)煌ōh(huán)境中的所有相關(guān)信息在建模中視為本車(chē)狀態(tài)擾動(dòng)。ACC功能被認(rèn)為是在兩種行為模式之間轉(zhuǎn)換:本車(chē)速度控制目標(biāo)為期望速度的巡航模式;本車(chē)速度控制目標(biāo)為前車(chē)速度的跟車(chē)模式。對(duì)于兩種行為模式需要分別選取合適的KPI。
本文中用于評(píng)價(jià)SUT的仿真環(huán)境包括在貝葉斯網(wǎng)絡(luò)圖形模型基礎(chǔ)上建立的隨機(jī)交通環(huán)境模型,交通參與者的預(yù)期運(yùn)動(dòng)位置建模則使用的是叫作條件線性高斯模型的一類(lèi)特殊貝葉斯網(wǎng)絡(luò),根據(jù)其前后駕駛行為對(duì)其狀態(tài)進(jìn)行分區(qū),針對(duì)每個(gè)預(yù)定義的前后駕駛行為(巡航、跟車(chē)、向左換道、向右換道)提出合理假設(shè),并在實(shí)際交通測(cè)量數(shù)據(jù)基礎(chǔ)上進(jìn)行訓(xùn)練。

由于ACC有兩種運(yùn)行狀態(tài),故f(KPI)由兩部分組成,計(jì)算定義如下:

當(dāng)相對(duì)速度小于0時(shí),即本車(chē)速度小于前車(chē)速度,計(jì)算式中兩者均不為0,即ACC功能性能損失增加。因此,該參數(shù)的引入可以防止ACC功能產(chǎn)生過(guò)于保守的減速行為。
f(KPI)的值在本文研究中需要進(jìn)行兩次估計(jì)分析。第一次估計(jì)分析采用的是遍歷方法,隨后采用蒙特卡洛方法對(duì)第一次分析所得的f(KPI)估計(jì)值進(jìn)行第二次估計(jì)。
3.2 仿真結(jié)果

對(duì)于圖3中的仿真過(guò)程,本車(chē)最初處于巡航模式下,并在ACC的控制下以期望速度行駛,在此階段,不對(duì)f(KPI)進(jìn)行評(píng)價(jià)。一旦安全距離內(nèi)出現(xiàn)前車(chē),ACC則切換到跟車(chē)模式,并開(kāi)始對(duì)f(KPI)進(jìn)行評(píng)價(jià)。本文共進(jìn)行了200次仿真,f(KPI)值的分布如圖4所示。

本文同時(shí)研究了樣本大小n對(duì)f(KPI)值置信區(qū)間的影響。按圖5所示,直方圖分布服從Gamma分布,且隨著n的增加,95%置信區(qū)間變窄。

圖5的結(jié)果表明,為了在隨機(jī)仿真環(huán)境中評(píng)估ADF,應(yīng)仔細(xì)選擇仿真持續(xù)時(shí)間。較短的仿真(本文中小于1000或2000個(gè)樣本)可能得到誤導(dǎo)性的性能評(píng)價(jià),其結(jié)果僅表征特定仿真下的ADF行為。而從一定的仿真長(zhǎng)度開(kāi)始(本文中為3000-4000個(gè)樣本),測(cè)試中的ADF性能變得可靠,且?guī)缀酹?dú)立于隨機(jī)模型生成的仿真條件。
4、結(jié)論和展望
本文提出了一種在隨機(jī)仿真環(huán)境中評(píng)價(jià)自動(dòng)駕駛功能的整體方法。本文討論的關(guān)鍵問(wèn)題是如何確定必要的仿真時(shí)間以獲得可靠的評(píng)價(jià)結(jié)果?;贏CC的應(yīng)用案例表明,隨機(jī)環(huán)境中較短的仿真可能導(dǎo)致對(duì)ADF性能評(píng)價(jià)做出錯(cuò)誤的結(jié)論。另一方面,過(guò)長(zhǎng)的仿真并不能提供有關(guān)ADF性能的額外信息,且計(jì)算成本大幅提高。
目前的研究是在對(duì)正常交通行為進(jìn)行校準(zhǔn)的交通隨機(jī)模型上進(jìn)行的。這項(xiàng)工作可擴(kuò)展至探索在不同校準(zhǔn)或甚至產(chǎn)生更危險(xiǎn)的情景特定校準(zhǔn)下,KPI估計(jì)值如何變化。我們還期望通過(guò)使用基于KPI的ADF性能統(tǒng)計(jì)分析,以實(shí)現(xiàn)不同交通場(chǎng)景之間的比較(例如對(duì)于測(cè)試中的ADF更具挑戰(zhàn)性的場(chǎng)景)以及不同ADF之間的比較(執(zhí)行相同的操作任務(wù))。一旦成功,還可以進(jìn)一步預(yù)選出對(duì)相應(yīng)ADF的測(cè)試來(lái)說(shuō)至關(guān)重要的場(chǎng)景,這將意味著顯著減少評(píng)價(jià)ADF所需的時(shí)間和成本。
廣告 編輯推薦
最新資訊
-
“汽車(chē)爬坡試驗(yàn)方法”將有國(guó)家標(biāo)準(zhǔn)
2026-03-03 12:44
-
十年耐久監(jiān)管時(shí)代:電池系統(tǒng)開(kāi)發(fā)策略將如何
2026-03-03 12:44
-
聯(lián)合國(guó)法規(guī)R59對(duì)機(jī)動(dòng)車(chē)備用消聲系統(tǒng)的工程
2026-03-03 12:08
-
聯(lián)合國(guó)法規(guī)R58對(duì)后下部防護(hù)裝置的工程化約
2026-03-03 12:07
-
聯(lián)合國(guó)法規(guī)R57對(duì)摩托車(chē)前照燈配光性能的工
2026-03-03 12:07





廣告


























































