利用OpenAI Gym建立一個(gè)簡(jiǎn)單的自動(dòng)駕駛模擬器

Maxime Chevalier
蒙特利爾大學(xué)博士
專(zhuān)注于編譯器設(shè)計(jì)
作為我的新工作的一部分,我一直在和Liam Paull教授一起為Duckietown構(gòu)建模擬器。這是在麻省理工學(xué)院,蘇黎世聯(lián)邦理工學(xué)院,蒙特利爾大學(xué)和其他機(jī)構(gòu)教授的一門(mén)大學(xué)課程,學(xué)生們通過(guò)構(gòu)建自己的小型模型來(lái)了解自動(dòng)駕駛汽車(chē)和機(jī)器人技術(shù),可以在微型Duckietown環(huán)境中駕駛,完成轉(zhuǎn)彎,十字路口,交通標(biāo)志和其他移動(dòng)車(chē)輛。
是的,Logo是一個(gè)握著方向盤(pán)的小黃鴨,Duckietown項(xiàng)目是開(kāi)源的項(xiàng)目,他們的資料和代碼都在網(wǎng)上可以查到。
Duckietown開(kāi)發(fā)者手冊(cè):(微信后臺(tái)回復(fù):Duckietown,下載Duckietown開(kāi)發(fā)者手冊(cè))
到目前為止,該課程一直專(zhuān)注于使用計(jì)算機(jī)視覺(jué)和PID控制器來(lái)驅(qū)動(dòng)機(jī)器人的傳統(tǒng)自動(dòng)駕駛方法。然而,學(xué)生和教授對(duì)使用深度學(xué)習(xí)(特別是強(qiáng)化學(xué)習(xí))越來(lái)越感興趣。由于強(qiáng)化學(xué)習(xí)需要大量的數(shù)據(jù),因此在模擬環(huán)境中比使用物理機(jī)器人更加實(shí)際。這是構(gòu)建模擬器的主要?jiǎng)訖C(jī)之一。
我構(gòu)建的模擬器是基于OpenAI Gym環(huán)境,它可以輕松用于強(qiáng)化學(xué)習(xí)。它是用純Python編寫(xiě)的,使用OpenGL(pyglet)生成圖形。我選擇Python是因?yàn)檫@是深度學(xué)習(xí)最常用的語(yǔ)言之一,我希望學(xué)生能夠輕松修改模擬器。模擬器支持許多形式的域隨機(jī)化:它隨機(jī)地改變顏色,攝像機(jī)角度和視野等等。這個(gè)特性旨在幫助神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)處理變化,以便在模擬工作中,訓(xùn)練不錯(cuò)的網(wǎng)絡(luò),而且在現(xiàn)實(shí)世界中也能有不錯(cuò)的表現(xiàn)。
因?yàn)镈uckietown基本上屬于一個(gè)二維的玩具世界,我設(shè)計(jì)了一個(gè)YAML地圖格式,可以輕松手動(dòng)編輯以創(chuàng)建自定義的新環(huán)境。我也對(duì)物理學(xué)做了一些簡(jiǎn)化的假設(shè)(代理人基本上沿著2D平面移動(dòng))。
在這個(gè)模擬器上工作時(shí),我也在嘗試sim-to-real transfer,也就是說(shuō),讓模擬培訓(xùn)的算法在真實(shí)機(jī)器人上測(cè)試。這是一項(xiàng)正在進(jìn)行的工作,我們正在檢驗(yàn)這項(xiàng)工作的可靠性。
廣告 編輯推薦
最新資訊
-
“汽車(chē)爬坡試驗(yàn)方法”將有國(guó)家標(biāo)準(zhǔn)
2026-03-03 12:44
-
十年耐久監(jiān)管時(shí)代:電池系統(tǒng)開(kāi)發(fā)策略將如何
2026-03-03 12:44
-
聯(lián)合國(guó)法規(guī)R59對(duì)機(jī)動(dòng)車(chē)備用消聲系統(tǒng)的工程
2026-03-03 12:08
-
聯(lián)合國(guó)法規(guī)R58對(duì)后下部防護(hù)裝置的工程化約
2026-03-03 12:07
-
聯(lián)合國(guó)法規(guī)R57對(duì)摩托車(chē)前照燈配光性能的工
2026-03-03 12:07





廣告


























































