日本无码免费高清在线|成人日本在线观看高清|A级片免费视频操逼欧美|全裸美女搞黄色大片网站|免费成人a片视频|久久无码福利成人激情久久|国产视频一二国产在线v|av女主播在线观看|五月激情影音先锋|亚洲一区天堂av

  • 手機站
  • 小程序

    汽車測試網(wǎng)

  • 公眾號
    • 汽車測試網(wǎng)

    • 在線課堂

    • 電車測試

清華大學(xué)車輛與運載學(xué)院智能駕駛課題組榮獲ICCAS 2020最佳學(xué)生論文獎

2020-11-04 23:08:36·  來源:清華大學(xué)車輛與運載學(xué)院  
 
2020年10月13-16日,第20屆國際控制自動化與系統(tǒng)大會(ICCAS 2020)于韓國釜山市召開。車輛學(xué)院李升波老師指導(dǎo)穆堯、彭柏寓等人,以清華大學(xué)為第一單位發(fā)表論文
2020年10月13-16日,第20屆國際控制自動化與系統(tǒng)大會(ICCAS 2020)于韓國釜山市召開。車輛學(xué)院李升波老師指導(dǎo)穆堯、彭柏寓等人,以清華大學(xué)為第一單位發(fā)表論文《Mixed Reinforcement Learning for Efficient Policy Optimization in Stochastic Environments》,榮獲“最佳學(xué)生論文獎”(Student Best Paper Award)。此次會議總共錄用全世界25個國家和地區(qū)的近500篇論文,其中12篇入圍“最佳學(xué)生論文獎”的提名環(huán)節(jié),這是最終獲獎的5篇優(yōu)秀論文之一。

車輛學(xué)院穆堯、彭柏寓等同學(xué)發(fā)表的論文榮獲第20屆ICROS國際控制自動化與系統(tǒng)大會(ICCAS 2020)“最佳學(xué)生論文獎”
知識與數(shù)據(jù)聯(lián)合驅(qū)動學(xué)習(xí)是人工智能領(lǐng)域最重要的發(fā)展方向之一。該研究工作以探索能力受限且不確定性環(huán)境為對象(典型例子是行駛于城市道路的自動駕駛汽車),提出了模型與數(shù)據(jù)同步驅(qū)動的混合強化學(xué)習(xí)(MAC,Mixed Actor-Critic)算法,突破了收斂快速性和策略準(zhǔn)確性難以同時保障的難題。該法以經(jīng)驗解析模型和真實交互數(shù)據(jù)的混合表征模型為基礎(chǔ),首次將策略迭代(Policy Iteration)的兩步結(jié)構(gòu)擴展為三步結(jié)構(gòu),即:迭代貝葉斯估計(IBE)、策略評估(PEV)、策略改進(PIM),且理論證明了該三步迭代學(xué)習(xí)結(jié)構(gòu)的收斂性與最優(yōu)性,這為模型與數(shù)據(jù)混合驅(qū)動學(xué)習(xí)提供了全新的統(tǒng)一框架。


以自動駕駛汽車的運動控制任務(wù)為例,驗證表明:該法有效提升了自動駕駛控制策略的學(xué)習(xí)速度,與純數(shù)據(jù)驅(qū)動法相比提速近25倍,同時保證了所求解策略的最優(yōu)性,與純模型驅(qū)動法相比性能提升約15%。該算法為高級別智能汽車進一步發(fā)展自我進化型駕駛智能奠定了基礎(chǔ)。

注:ICCAS全稱” The International Conference on Control, Automation, and Systems”, 是機器人與智能控制領(lǐng)域的頂級學(xué)術(shù)會議之一,每年召開一次。 
分享到:
 
反對 0 舉報 0 收藏 0 評論 0
滬ICP備11026917號-25