日本无码免费高清在线|成人日本在线观看高清|A级片免费视频操逼欧美|全裸美女搞黄色大片网站|免费成人a片视频|久久无码福利成人激情久久|国产视频一二国产在线v|av女主播在线观看|五月激情影音先锋|亚洲一区天堂av

  • 手機(jī)站
  • 小程序

    汽車測試網(wǎng)

  • 公眾號
    • 汽車測試網(wǎng)

    • 在線課堂

    • 電車測試

詳細(xì)解讀斯坦福大學(xué)最新成果——自動駕駛的神經(jīng)網(wǎng)絡(luò)模型

2019-04-03 21:07:31·  來源:智車科技  
 
斯坦福大學(xué)研究人員研發(fā)的高性能自動駕駛的神經(jīng)網(wǎng)絡(luò)模型于3月27日被ScienceRobotics收錄。下面我們一起看看他們研究成果吧。簡介首先,研究人員讓一輛2009年奧迪
斯坦福大學(xué)研究人員研發(fā)的高性能自動駕駛的神經(jīng)網(wǎng)絡(luò)模型于3月27日被Science Robotics收錄。下面我們一起看看他們研究成果吧。

簡介
 
首先,研究人員讓一輛2009年奧迪TTS在基于物理的自動系統(tǒng)控制下加速,該系統(tǒng)預(yù)裝了相關(guān)條件的固定信息。當(dāng)在同一場地連續(xù)實驗10次后,2009年奧迪TTS和經(jīng)驗豐富的業(yè)余車手產(chǎn)生了差不多的單圈時間。然后,研究人員用他們的新的神經(jīng)網(wǎng)絡(luò)系統(tǒng)測試,盡管神經(jīng)網(wǎng)絡(luò)缺乏關(guān)于道路摩擦的明確信息,但這輛車在運(yùn)行神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)和基于物理的系統(tǒng)時表現(xiàn)相似。在模擬測試中,神經(jīng)網(wǎng)絡(luò)系統(tǒng)在高摩擦和低摩擦情況下均優(yōu)于基于物理的系統(tǒng)。在混合高摩擦和低摩擦兩種情景中,該系統(tǒng)表現(xiàn)良好。
  
研究目的
 
自動駕駛汽車自主導(dǎo)航行駛,首先要對路徑進(jìn)行規(guī)劃設(shè)計,然后沿著安全的軌道行駛。為了證明自動駕駛比人類駕駛更安全,自動駕駛汽車必須在大范圍的駕駛環(huán)境和危急情況下,表現(xiàn)出同人類司機(jī)一樣或更好的駕駛表現(xiàn)。
基于此種想法,斯坦福大學(xué)研究人員設(shè)計了一個前饋反饋控制結(jié)構(gòu),結(jié)合一個簡單的基于物理的模型,用來跟蹤業(yè)余組冠軍賽車手駕駛汽車時候的各種路徑的摩擦極限和車輛的性能。該項研究的關(guān)鍵是擁有合適的模型。盡管基于物理的模型在透明性和直覺方面很有用,但它們需要圍繞單個操作點進(jìn)行顯式描述,并且無法利用自動駕駛汽車生成的大量車輛數(shù)據(jù)。為了克服這些限制,研究人員提出了一種神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),使用物理模型驅(qū)動的一系列過去狀態(tài)和輸入。在實驗車輛上采用相同的前饋-反饋控制結(jié)構(gòu)時,神經(jīng)網(wǎng)絡(luò)的性能優(yōu)于物理模型。更值得注意的是,當(dāng)對來自干燥路面和雪地的數(shù)據(jù)進(jìn)行組合訓(xùn)練時,該模型能夠?qū)囕v正在行駛的路面做出適當(dāng)?shù)念A(yù)測,而不需要進(jìn)行明確的路面摩擦估計。這些結(jié)果表明,該網(wǎng)絡(luò)結(jié)構(gòu)值得進(jìn)一步研究。
 
研究現(xiàn)狀
 
雖然已經(jīng)開展了大量的工作來開發(fā)自動駕駛的控制技術(shù),但是大部分工作都集中在正常駕駛條件下控制車輛,并且在高摩擦且干燥的路面上進(jìn)行了輕柔的操作。許多相關(guān)文獻(xiàn)[5-6]已經(jīng)闡明,在摩擦極限附近控制車輛是一個不容忽視的挑戰(zhàn)。從根本上說,當(dāng)車輛接近輪胎-路面摩擦的極限時,它變得不穩(wěn)定(如果后輪胎達(dá)到極限)或不可控制(如果前輪胎達(dá)到極限)。 為了跟蹤車輛的極限路徑,車輛的道路-輪胎摩擦系數(shù)的某些估計對于軌跡設(shè)計和確定適當(dāng)?shù)霓D(zhuǎn)向命令是必要的。總的來說,獲得這樣的估計是具有挑戰(zhàn)性的。由于輪胎-路面摩擦經(jīng)??焖僮兓⑶业缆返囊恍┎糠挚赡苡刹煌谋砻娼M成,使研究過程進(jìn)一步復(fù)雜化。除了難以估計該關(guān)鍵參數(shù)之外,開發(fā)可用于軌跡生成和在極限處跟隨的精確動態(tài)模型是一項艱巨的任務(wù),因為運(yùn)動方程是高度非線性的。設(shè)計者必須進(jìn)一步選擇適當(dāng)?shù)谋U娑?,從而決定是否包括諸如由于加速引起的輪胎重量傳遞或快速轉(zhuǎn)向運(yùn)動產(chǎn)生的輪胎力滯后等效應(yīng)。
 
對于控制系統(tǒng)設(shè)計人員來說,處理極限是一項挑戰(zhàn),而對于普通駕駛員而言,處理極端情況的極限條件也是一項挑戰(zhàn),并且極端條件下的摩擦不穩(wěn)定是許多事故的罪魁禍?zhǔn)?。只有少部分駕駛能力在業(yè)余水平以上,并且具有賽車經(jīng)驗的駕駛員,能夠在這種路況下安全地控制車輛。如果自動駕駛車輛想要在危急情況下能夠比經(jīng)驗豐富的駕駛員更好地操縱自動駕駛車輛,那么跟蹤控制器性能的標(biāo)準(zhǔn)必須設(shè)置得相當(dāng)高。
 
該項目中,研究人員展示了一個簡單的路徑跟蹤架構(gòu),該構(gòu)架可以使自動駕駛車輛準(zhǔn)確地跟蹤路徑,達(dá)到像賽車手一樣充分利用輪胎-道路的摩擦的能力。該項目的關(guān)鍵是找到恰當(dāng)?shù)哪P汀Q芯咳藛T使用基于物理的動力學(xué)模型進(jìn)行前饋控制,這是一個簡單的線性反饋控制器,搭配根據(jù)車輛建模的摩擦極限設(shè)計的軌跡,汽車可以在模擬的摩擦極限下以平均路徑跟蹤誤差低于40厘米的精度行駛。由于該模型僅代表對真實極限的估計,因此研究人員將自動駕駛汽車的性能與業(yè)余賽車手進(jìn)行基準(zhǔn)測試,并比較賽道上各賽段的單圈時間。這種新穎的比較方法表明,控制器在模擬摩擦極限下的操作在摩擦利用率方面與經(jīng)驗豐富的賽車賽車手的能力相當(dāng)。
 
深入研究
 
簡單模型準(zhǔn)確有效的前提條件是在特定條件,比如特定的溫度、干燥的高摩擦賽道等等。那么,如何為條件不確定的公路自動駕駛車輛開發(fā)出可比模型呢?盡管獲得不同車輛的參數(shù)作為典型開發(fā)過程的一部分是可行的,但是幾個參數(shù)隨著道路狀況的變化結(jié)果差距很大。盡管研究人員已經(jīng)證明了可以適應(yīng)不斷變化的道路狀況的在線參數(shù)估計,但是這些技術(shù)尚未成熟的運(yùn)用到汽車的商業(yè)部署或安全關(guān)鍵系統(tǒng);而且,已有研究成果的實時估算不會利用當(dāng)前車輛產(chǎn)生的大量數(shù)據(jù)。鑒于隨著模型復(fù)雜性的增加,參數(shù)估計變得更具挑戰(zhàn)性,它也沒有解決模型保真度的問題。理想情況下,模型生成過程應(yīng)該能夠利用不同摩擦水平的表面數(shù)據(jù),減少先驗建模決策的數(shù)量,同時仍然捕獲針對特定條件調(diào)整的基于物理的模型的準(zhǔn)確性和性能。
 
這些要求促使人們研究用于車輛控制的神經(jīng)網(wǎng)絡(luò)模型。神經(jīng)網(wǎng)絡(luò)模型由于具有普遍的函數(shù)逼近特性,近年來取得了許多成果,如在圖像識別和圍棋方面的基準(zhǔn)測試。早期對神經(jīng)網(wǎng)絡(luò)模型的研究表明,這些模型能夠進(jìn)行車輛控制和動態(tài)模型識別。神經(jīng)網(wǎng)絡(luò)車輛模型在從四軸飛行器控制到大規(guī)模拉力賽車輛控制的眾多機(jī)器人應(yīng)用中取得了成功。以上這些模型已成功地用于車輛動力學(xué)模型識別,但尚未用于捕捉在多個摩擦面極限下行駛時的車輛動力學(xué)變化。此外,神經(jīng)網(wǎng)絡(luò)模型可以使用歷史信息來捕捉時變或高階效應(yīng),如模型直升機(jī)和機(jī)器人應(yīng)用程序中所示。
 
研究人員提出了一個可行性研究:研究人員利用基于物理模型的狀態(tài)和輸入作為指導(dǎo),開發(fā)了一個兩層前饋神經(jīng)網(wǎng)絡(luò),能夠?qū)W習(xí)車輛在不同表面上的動態(tài)行為。該網(wǎng)絡(luò)包含了當(dāng)前測量值和來自前三個時間步驟的歷史信息的組合。歷史信息使網(wǎng)絡(luò)能夠提供不同摩擦水平下的行為預(yù)測,而不需要顯式的摩擦估計方案。當(dāng)對高摩擦和低摩擦數(shù)據(jù)進(jìn)行組合訓(xùn)練時,該模型做出了與歷史信息描述的表面相適應(yīng)的預(yù)測。通過上述摩擦估計步驟,具有歷史信息融合估計和預(yù)測能力的神經(jīng)網(wǎng)絡(luò),簡化了車輛控制任務(wù)。這種額外的功能并沒有以性能為代價。與基于調(diào)優(yōu)物理的模型相比,研究人員在極限處顯示了更好的路徑跟蹤性能。仿真研究表明,該神經(jīng)網(wǎng)絡(luò)模型能夠捕捉到一系列簡單物理模型所沒有的動態(tài)行為。
 
實驗方法
 
為了研究路徑跟蹤體系結(jié)構(gòu)在車輛操縱能力極限下的性能,研究人員設(shè)計了一個與有經(jīng)驗的人類駕駛員的實驗比較。在這種情況下,研究人員的自動駕駛汽車的一個合適的基準(zhǔn)是一個熟練的人類駕駛員,他具有豐富的駕駛和業(yè)余賽車經(jīng)驗,并熟悉測試課程。在本實驗中,研究人員使用了一個基于物理的前饋反饋控制器(如圖1所示),該控制器實現(xiàn)在一臺自動化的2009年奧迪TTS (Shelley)上。控制器通過制動、節(jié)流閥和換擋命令跟蹤所需的路徑,而另一個控制器通過制動、節(jié)流閥和換擋命令匹配所需的車速。通過優(yōu)化技術(shù)設(shè)計路徑和速度剖面,使基于車輛模型的軌跡驅(qū)動所需時間最小化。
 圖1 簡單的前饋反饋控制結(jié)構(gòu),用于自動車輛的路徑跟蹤
圖2 Shelly
  
該模型用于前饋控制產(chǎn)生一個適當(dāng)?shù)霓D(zhuǎn)向角,適用于給定的路徑曲率和車輛縱向速度。這種輸入的準(zhǔn)確性對產(chǎn)生的路徑跟蹤誤差和所需的反饋工作都有很大的影響。這里的前饋轉(zhuǎn)向指令是由平面單軌或自行車模型的運(yùn)動方程推導(dǎo)而來的,平面單軌或自行車模型是由牛頓物理推導(dǎo)而來的車輛動力學(xué)共同體中常用的模型。本文所提到的基于物理的模型明確地指的是平面自行車模型。為了計算前饋轉(zhuǎn)向輸入從這些運(yùn)動方程,研究人員使用穩(wěn)態(tài)運(yùn)行條件來確定前饋輪胎的力量。
 
隨后,通過使用基于物理的輪胎模型,將這些穩(wěn)態(tài)輪胎力轉(zhuǎn)換為所需的轉(zhuǎn)向輸入,該模型明確地考慮了輪胎力產(chǎn)生和飽和的影響。為了補(bǔ)償前反饋指令產(chǎn)生的誤差和干擾,研究人員使用一個簡單的基于路徑的轉(zhuǎn)向反饋控制器來跟蹤期望的軌跡。該控制器基于e,即車輛偏離期望軌跡的橫向偏差DY,即車輛偏離期望軌跡的航向偏差,如圖1所示。利用非線性最小二乘擬合實驗車輛數(shù)據(jù),對基于物理模型的輪胎參數(shù)進(jìn)行擬合。
 
為了比較自動化方法和經(jīng)驗豐富的司機(jī),研究人員創(chuàng)建了一個封閉的賽道研究的賽車性能包括在加利福尼亞州Thunderhill Raceway Park的前五個轉(zhuǎn)彎。自動駕駛汽車和人類參與者都試圖在最短的時間內(nèi)完成課程(如圖3)。這包括以接近0.95g的加速度駕駛,同時在輪胎附著的物理極限處跟蹤最短時間的賽車軌跡。在這種縱向和橫向加速度的綜合水平下,車輛能夠在部分賽道上接近95英里每小時(英里每小時)的速度。自動駕駛汽車和人類參與者都參與了10項在封閉賽道上駕駛的試驗。測試是在相同的條件下進(jìn)行的,包括在自動駕駛和人工駕駛測試中,給汽車壓載以使車輛的質(zhì)量相等。即使在這些極端的駕駛條件下,控制器也能夠始終跟蹤賽道,平均路徑跟蹤誤差在賽道上的任何位置都低于40cm(如圖4)。 
 圖3 人類司機(jī)和Shelley
圖4
為了研究軌跡跟蹤的一致性,研究人員檢驗了平均絕對偏離中值軌跡離散度,這是對每個驅(qū)動軌跡偏離軌跡中心線的魯棒性度量。經(jīng)驗豐富的駕駛員在兩圈之間的平均路徑散布比自動駕駛的車輛要大得多(圖4)。這些數(shù)據(jù)也被表示為在圖3中航跡圖上的投影,其中N表示測試課程的北方方向??刂破鞯穆窂狡钜恢滦员砻鳎摽刂品椒ň雀?。利用高精度GPS定位系統(tǒng)跟蹤預(yù)先計算的軌跡,可以解釋自動車輛的低路徑離散性。正如后面所討論的,人類驅(qū)動路徑的高度分散性表明,人類駕駛員采用的策略與自動駕駛車輛不同。因此,在跟蹤精度或可變性方面,人類和自動駕駛車輛無法進(jìn)行比較。然而,它們可以在時間方面進(jìn)行比較。
 
研究人員使用分段時間的度量來比較自動車輛和人類駕駛員,因為這是賽車駕駛員和自動車輛的期望軌跡都試圖最小化的度量。為了比較研究人員封閉賽程的賽段時間,研究人員將賽段分為三個賽段。圖5顯示了在Thunderhill Raceway Park進(jìn)行的人類駕駛員和自動駕駛車輛聯(lián)合試驗中記錄的分段時間。Shelley通過每段賽道的時間都在人類駕駛員的分段時間范圍內(nèi),這表明基于模型的控制器的性能可以與賽車駕駛員在Shelley能力的極限下進(jìn)行比較??杀容^的搭接次數(shù)表明,基于物理模型的簡單前饋反饋控制器的摩擦利用率可比較。相對于人類駕駛員,低路徑分散和可比較的路段時間是由調(diào)整到特定路面的模型造成的。在建立了一個相對于有經(jīng)驗的人類驅(qū)動程序的性能基準(zhǔn)之后,研究人員可以使用這個控制器性能作為神經(jīng)網(wǎng)絡(luò)模型的基準(zhǔn)。
圖5
在基于物理模型考慮狀態(tài)和控制的激勵下,研究人員選擇使用前饋神經(jīng)網(wǎng)絡(luò),其輸入如圖6所示。該神經(jīng)網(wǎng)絡(luò)模型由兩個隱層組成,每層有128個單元,每個模型狀態(tài)或控件采用三種延遲輸入狀態(tài)。與基于物理的模型相似,該網(wǎng)絡(luò)預(yù)測了車輛的偏航率和橫向速度導(dǎo)數(shù)。該網(wǎng)絡(luò)最初以監(jiān)督的方式進(jìn)行訓(xùn)練,以復(fù)制基于物理的模型。在基于物理模型輸入空間中對200,000條軌跡進(jìn)行全范圍訓(xùn)練后,研究人員利用在高摩擦和低摩擦測試中收集的實驗車輛數(shù)據(jù)更新了神經(jīng)網(wǎng)絡(luò)。在Thunderhill Raceway Park進(jìn)行了高摩擦試驗,在北極圈附近的試驗跑道上對冰雪混合物進(jìn)行了低摩擦試驗。
圖6 神經(jīng)網(wǎng)絡(luò)動力學(xué)模型采用基于物理的輸入設(shè)計模型
 
雖然神經(jīng)網(wǎng)絡(luò)模型可以用于多種控制方案,但研究人員希望將其與基于物理的前饋反饋控制器提供的基準(zhǔn)進(jìn)行比較。因此,研究人員使用學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)模型來生成前饋命令,與基于物理的模型做出相同的穩(wěn)態(tài)假設(shè)。為了生成前饋轉(zhuǎn)向指令,研究人員利用二階非線性優(yōu)化方法建立了神經(jīng)網(wǎng)絡(luò)動力學(xué)模型的平衡點。測量的速度和路徑曲率作為優(yōu)化的輸入,以指定正確的前饋命令。對車輛進(jìn)行在線優(yōu)化,從網(wǎng)絡(luò)中以20hz的速率計算前饋轉(zhuǎn)向指令。為了補(bǔ)償擾動和模型失配,研究人員在兩種情況下都使用了相同的基于簡單路徑的反饋控制器結(jié)構(gòu)來進(jìn)行控制器之間的比較。
 
研究人員通過在一輛自主的大眾GTI(圖7)上實現(xiàn)這兩種控制器進(jìn)行了比較,研究人員有機(jī)會使用它來獲取雪的數(shù)據(jù),因為雪是為自動駕駛準(zhǔn)備的。圖8顯示了用于評估兩個控制器的Thunderhill Raceway Park滑塊上的橢圓軌道。兩種控制方案均采用相同的縱向速度剖面和縱向控制器,并在整車性能極限下進(jìn)行了試驗。對比發(fā)現(xiàn),圖9中標(biāo)記為1的轉(zhuǎn)彎入口時,神經(jīng)網(wǎng)絡(luò)控制器比基于物理的模型學(xué)會了更多的轉(zhuǎn)向,從而降低了轉(zhuǎn)彎中段的跟蹤誤差。在轉(zhuǎn)彎中途,跟蹤誤差受道路輪胎摩擦力的影響,負(fù)誤差表明車輛超過了抓地力極限。此外,神經(jīng)網(wǎng)絡(luò)控制器在轉(zhuǎn)彎出口(3)的轉(zhuǎn)向指令較少,因為它更接近所期望的路徑。出口和直線段的峰值受控制器增益、前向距離等轉(zhuǎn)向反饋參數(shù)的影響。研究人員發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)控制器能夠在極限處明顯地實現(xiàn)不同的橫向誤差分布(圖10)。這些結(jié)果表明,在相同的穩(wěn)態(tài)假設(shè)和控制體系結(jié)構(gòu)下,神經(jīng)網(wǎng)絡(luò)模型比基于物理的模型具有更高的模型保真度。也就是說,控制器滿足本課程所要求的性能基準(zhǔn)。
圖7
 
圖8
 
圖9
 
圖10
然而,數(shù)據(jù)驅(qū)動模型的真正功能不僅僅是提供與基于物理的方法相當(dāng)?shù)男阅?。該神?jīng)網(wǎng)絡(luò)模型還具有融合高階動態(tài)效應(yīng)和學(xué)習(xí)不同路面車輛行為的潛力。為了確定研究人員所學(xué)習(xí)的模型(圖6)是否顯示了這些特性,研究人員在另外兩項研究中檢驗了包含高保真度車輛動力學(xué)建模和多個表面摩擦值的預(yù)測。
 
相對于簡化的基于物理的模型,為了證明網(wǎng)絡(luò)的建模能力,研究人員使用不同保真度的動態(tài)模型來生成基于統(tǒng)一隨機(jī)控制策略的訓(xùn)練數(shù)據(jù)。這些數(shù)據(jù)既用于訓(xùn)練網(wǎng)絡(luò),又用于為基于物理的模型確定最合適的參數(shù),以便比較它們的預(yù)測能力。在第一次比較中,基于物理的模型本身生成數(shù)據(jù),因此生成仿真數(shù)據(jù)的基于物理的模型與學(xué)習(xí)到的基于物理的模型之間沒有模型失配。在這種情況下,沒有錯誤匹配(圖11),基于物理的模型明顯優(yōu)于神經(jīng)網(wǎng)絡(luò)模型,恢復(fù)了用于仿真的參數(shù)集。這是可以理解的,因為基于物理的模型代表數(shù)據(jù)背后的真實模型形式,而神經(jīng)網(wǎng)絡(luò)試圖學(xué)習(xí)一個近似模型。
 圖11
然而,當(dāng)不同保真度的模型生成訓(xùn)練數(shù)據(jù)時,情況發(fā)生了變化。研究人員使用基于物理的模型生成模擬數(shù)據(jù),這些模型經(jīng)過增強(qiáng),包括縱向重量轉(zhuǎn)移、輪胎松弛長度和多個路面摩擦值的影響(圖11)。當(dāng)數(shù)據(jù)擬合到簡單的基于物理的模型時,模型錯誤匹配的這些附加效應(yīng)導(dǎo)致了參數(shù)值的偏置。研究人員發(fā)現(xiàn),在所有這些模型失配的情況下,神經(jīng)網(wǎng)絡(luò)模型在預(yù)測方面都優(yōu)于基于物理的模型(圖11)。此外,研究人員發(fā)現(xiàn)這些結(jié)果擴(kuò)展到仿真數(shù)據(jù)(圖12)。這些結(jié)果與用于設(shè)計神經(jīng)網(wǎng)絡(luò)預(yù)測模型的物理見解是一致的。例如,在學(xué)習(xí)輪胎松弛效應(yīng)時,網(wǎng)絡(luò)能夠通過包含多個狀態(tài)和輸入延遲階段來捕捉變化的滑移角動力學(xué),而基于物理的模型僅使用當(dāng)前輸入和狀態(tài)來預(yù)測車輛的動力學(xué)。 
圖12
基于神經(jīng)網(wǎng)絡(luò)在模擬中捕捉大量動態(tài)的能力,我們設(shè)計了一個額外的研究來評估模型在真實條件下對不同路面進(jìn)行預(yù)測的能力。為此,我們使用Volkswagen GTI平臺收集了手動驅(qū)動和自動數(shù)據(jù)。此外,我們還收集了干瀝青上的高摩擦驅(qū)動和冰雪上的低摩擦驅(qū)動的數(shù)據(jù)。為了說明神經(jīng)網(wǎng)絡(luò)在低摩擦和高摩擦條件下學(xué)習(xí)動力學(xué)模型的能力,我們分別對每種情況分別訓(xùn)練和驗證了模型(圖13)。結(jié)果表明,在高摩擦和低摩擦情況下,神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)都優(yōu)于基于物理的模型。這兩種情況的數(shù)據(jù)可以進(jìn)一步結(jié)合起來,用于訓(xùn)練單一的神經(jīng)網(wǎng)絡(luò)和基于物理的模型。我們發(fā)現(xiàn),這導(dǎo)致基于物理模型的訓(xùn)練和測試誤差最大,原因是它無法捕捉兩種不同的摩擦條件,如圖13所示。識別出的基于物理的模型特征近似地表示了路面的平均狀態(tài),而神經(jīng)網(wǎng)絡(luò)模型的隱藏節(jié)點能夠隱式地表示和應(yīng)用不同的條件。結(jié)果表明,該神經(jīng)網(wǎng)絡(luò)在訓(xùn)練和測試方面均優(yōu)于基于物理的模型一個數(shù)量級以上。這些結(jié)果表明,神經(jīng)網(wǎng)絡(luò)模型對混合路面和孤立路面數(shù)據(jù)均具有較好的預(yù)測性能,這一特性也可以推廣到圖14所示的空載試驗數(shù)據(jù)。
 圖13
圖14
  
實驗結(jié)論
結(jié)果表明,在適當(dāng)?shù)哪P拖拢粋€簡單的前饋反饋控制器可以在車輛摩擦能力極限下提供路徑跟蹤性能,其摩擦利用率可與有經(jīng)驗的人類賽車手相媲美。此外,我們的可行性研究表明,神經(jīng)網(wǎng)絡(luò)可以為這種方法提供必要的模型,實現(xiàn)比簡單但經(jīng)過仔細(xì)調(diào)優(yōu)的靜態(tài)物理模型更好的性能。最值得注意的是,這樣的模型可以預(yù)測不同摩擦表面的性能,而無需顯式地識別摩擦,并在考慮高保真度車輛動力學(xué)特性時顯示出魯棒性。實驗結(jié)果表明,這種神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)是自動車輛動力學(xué)模型的有效選擇,值得進(jìn)一步研究。
 
將跟蹤控制器(如本文所示的控制器)與人類性能進(jìn)行基準(zhǔn)測試是一項挑戰(zhàn)。從路徑離散的水平可以看出,人類駕駛員并沒有從精確的路徑跟蹤的角度來表述這個問題。相反,人類駕駛員傾向于在特定的點(比如彎道的頂點)上錨定想要的路徑,并專注于將汽車推到摩擦極限。由于人類駕駛員的方法與典型的自動化車輛體系結(jié)構(gòu)有根本的不同,因此分段時間似乎是這兩種方法中最公平的比較。人類和已確定的軌道都是為了盡量縮短時間而運(yùn)行的??紤]到分段時間對摩擦利用的極端敏感性,我們可以從可比時間推斷出可比的摩擦利用。
 
拓展討論
 
此外,雖然我們的業(yè)余賽車手速度很快,但專業(yè)車手的速度更快,這意味著使用摩擦的能力更強(qiáng)。因此,我們已經(jīng)證明了可以與高級人員相媲美的能力,但是我們還沒有證明可以超越高級人員的性能。要做到這一點,十有可能需要采取一些人類駕駛員愿意偏離路線的做法,以便更充分地利用摩擦力,減少時間。
 
比較了神經(jīng)網(wǎng)絡(luò)模型和基于物理的模型的控制性能,結(jié)果表明,采用神經(jīng)網(wǎng)絡(luò)模型的控制器在選擇的測試路徑上具有較好的路徑跟蹤性能。采用基于物理模型的控制器獲得了較大的橫向誤差,在轉(zhuǎn)彎過程中工作在50厘米左右。然而,在典型的2.7 - 3.6 m車道寬度和典型的2 m車道寬度的基礎(chǔ)上,即使在摩擦極限下,兩種控制器也會使車輛保持在車道邊界內(nèi)。這條道路的轉(zhuǎn)彎速度不超過26英里每小時,所以這個實驗反映了一個合理的城市或郊區(qū)駕駛的緊急機(jī)動模型。雖然在部署前還需要與其他機(jī)動進(jìn)行進(jìn)一步的驗證,但這些結(jié)果證明了神經(jīng)網(wǎng)絡(luò)方法在極限條件下用于車輛控制的可行性。在使用神經(jīng)網(wǎng)絡(luò)模型時,控制器的前饋計算只使用了模型狀態(tài)空間的一小部分(此時車輛處于穩(wěn)態(tài)),而神經(jīng)網(wǎng)絡(luò)模型具有學(xué)習(xí)瞬態(tài)動力學(xué)效應(yīng)的能力,預(yù)測誤差表明了這一點。因此,在這種特殊的控制結(jié)構(gòu)中,還沒有實現(xiàn)神經(jīng)網(wǎng)絡(luò)控制的真正潛力。此外,通過對神經(jīng)網(wǎng)絡(luò)模型進(jìn)行穩(wěn)態(tài)假設(shè)來生成命令,必須控制網(wǎng)絡(luò)的狀態(tài)歷史。前饋控制器沒有充分利用神經(jīng)網(wǎng)絡(luò)的能力來同時估計和預(yù)測可變摩擦面。其他控制結(jié)構(gòu),如模型預(yù)測控制,可以利用網(wǎng)絡(luò)的估計能力,提供了一種簡單的方法,把同時進(jìn)行的估計和控制結(jié)合起來。同樣,也可以使用更復(fù)雜的物理模型或在線估計參數(shù)。但是,這一系列的神經(jīng)網(wǎng)絡(luò)模型和傳統(tǒng)模型、以及人類駕駛的對比,是目前最清晰的對比基準(zhǔn)。研究人員也表示,還需要進(jìn)一步的研究,來確定不同的條件下的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的正確編碼。 
分享到:
 
反對 0 舉報 0 收藏 0 評論 0
滬ICP備11026917號-25