日本无码免费高清在线|成人日本在线观看高清|A级片免费视频操逼欧美|全裸美女搞黄色大片网站|免费成人a片视频|久久无码福利成人激情久久|国产视频一二国产在线v|av女主播在线观看|五月激情影音先锋|亚洲一区天堂av

  • 手機站
  • 小程序

    汽車測試網(wǎng)

  • 公眾號
    • 汽車測試網(wǎng)

    • 在線課堂

    • 電車測試

首頁 > 汽車技術 > 正文

智能駕駛的數(shù)據(jù)采集與測評解決方案

2021-09-30 08:52:23·  來源:焉知  作者:Jessie  
 
當前,智能駕駛AI識別領域高速發(fā)展,人工智能商業(yè)化在算力、算法和技術方面,基本達到階段性成熟,應用控制能力落地不斷加速。通過算法和應用的落地來真正解決行
當前,智能駕駛AI識別領域高速發(fā)展,人工智能商業(yè)化在算力、算法和技術方面,基本達到階段性成熟,應用控制能力落地不斷加速。通過算法和應用的落地來真正解決行業(yè)具體痛點,需要采集大量人工智能相關的原始數(shù)據(jù),并經(jīng)過標注處理后做算法訓練支撐。

落地場景對AI數(shù)據(jù)的需求更加多樣化和定制化,也對AI數(shù)據(jù)服務的專業(yè)性和質(zhì)量提出了更高的要求。以車載攝像頭識別的機視覺圖像處理為例,一個新場景的開發(fā)支持需要上萬張甚至數(shù)十萬張不等的經(jīng)過采集和標注的圖片。隨著AI應用場景的豐富,對AI數(shù)據(jù)服務將產(chǎn)生長期海量的需求。
眾所周知,先進的自動駕駛技術以有監(jiān)督的深度學習為主,算法模型訓練對數(shù)據(jù)有極高要求,隨著自動駕駛企業(yè)路測里程不斷累積,產(chǎn)生了大量多元場景化數(shù)據(jù)。其中要求對車輛傳感器采集到的大量交通數(shù)據(jù)進行清洗、分類、標注。其中包括車道線標注,可行駛區(qū)域語義分割,車輛、非機動車、行人、車庫拉框標注,車輛3D拉框,視頻標注、3D激光點云標注等在內(nèi)的多種標注服務。
可以說數(shù)據(jù)決定了 AI 的落地程度,而數(shù)據(jù)采集這一過程對技術、規(guī)模、專業(yè)度都要求較高。原因主要有以下3方面:
1、數(shù)據(jù)安全
人工智能數(shù)據(jù)的獲取有安全合規(guī)要求,需授權主機廠合法的采集和訓練權限,若濫用或通過非法手段獲取,易產(chǎn)生法務風險。這里且不說在專業(yè)繪圖的地圖公司進行相應的數(shù)據(jù)采集繪圖也是需要專業(yè)資質(zhì),即便是大型主機廠在做類似影子模式或道路測試標定過程中,對于數(shù)據(jù)的采集也是受限的。
2、數(shù)據(jù)質(zhì)量
訓練數(shù)據(jù)的質(zhì)量嚴重影響算法有效性,需要強有力的人員管理和質(zhì)檢手段,確保數(shù)據(jù)質(zhì)量一致性,有效保障數(shù)據(jù)質(zhì)量。
3、數(shù)據(jù)處理效率
采集的數(shù)據(jù)需要整體科學的項目管理流程,建立合適的數(shù)據(jù)采集、標注團隊模式,且需要一套完整的工具和流程支撐,確保數(shù)據(jù)處理效率充分得到保障。
對于基于數(shù)據(jù)AI開發(fā)者數(shù)據(jù)平臺而言,包含缺陷挖掘、模型迭代、數(shù)據(jù)管理幾個部分,整個數(shù)據(jù)采集標定過程由于計算資源龐大,一般可基于云端管理單元進行計算和資源分配。
本文將系統(tǒng)的講解智能駕駛系統(tǒng)開發(fā)過程中的數(shù)據(jù)采集流程、標注及如何應用于仿真測評及性能提升。

數(shù)據(jù)采集流程及方法
數(shù)據(jù)采集標注平臺從下至上包括基礎(數(shù)據(jù))層、加工(工具)層、中間(流程)層、應用層幾個層級,而整個過程通過數(shù)據(jù)管理和數(shù)據(jù)存儲可有效地應用于場景重構與數(shù)據(jù)訓練模型。

數(shù)據(jù)采集處理的完成流程包括原始數(shù)據(jù)采集、特征數(shù)據(jù)標注、場景數(shù)據(jù)分類、基礎數(shù)據(jù)管理、模型數(shù)據(jù)訓練幾大部分。這里需要說明的是數(shù)據(jù)采集和需要標注的數(shù)據(jù)需求主要來源于智能駕駛系統(tǒng)的場景感知能力需求。標注的模型主要用于在測試匹配驗證階段進行問題分析及原因追溯。標注的方式通常采用視頻圖像框選進行,可助力圖像識別模型訓練,用于框選視頻圖像中的識別主體目標,常見于對人臉、人體、障礙物、紅綠燈的框選。
 
智能駕駛中的數(shù)據(jù)采集分析軟件,需要首先支持將CAN、LIN、Ethernet 等總線數(shù)據(jù)同步匯集, 并加入視頻、GPS 以及各種傳感器等數(shù)據(jù),以便支撐后續(xù)的場景分析、算法訓練等。同時智能駕駛的算法開發(fā)驗證也需要大量的數(shù)據(jù),數(shù)據(jù)采集硬件端需要提供開放的平臺接口及其所需的數(shù)據(jù)接口。這里的數(shù)據(jù)采集主要指基于攝像頭、Lidar、4D毫米波雷達的環(huán)境識別,采集流程包括需求分析、制定采集方案、獲取數(shù)據(jù)、數(shù)據(jù)加工、標準化數(shù)據(jù)輸出、可用數(shù)據(jù)驗收幾個大的方面。采集的數(shù)據(jù)類型通常包括語音、圖像、多模態(tài)數(shù)據(jù)。

數(shù)據(jù)采集設備通常包括工控機、車機、電腦及處理芯片。
工控機:主要功能是進行數(shù)據(jù)搜集,一般需要支持多路圖像(可自定義4-6路)和一路語音錄制;
車機/中央域控:主要功能是進行處理圖像的即時顯示,一般需要支持IR+RGB圖像及語音錄制,支持多路模態(tài)數(shù)據(jù);
本地計算機:主要是對采集回來的數(shù)據(jù)進行線下標注,一般需要支持對單路語音或圖像的時間戳對齊。

數(shù)據(jù)采集平臺需要采用靈活的主機選擇,從邊緣傳感器融合再到傳感器信號旁通,從中央數(shù)據(jù)采集到數(shù)據(jù)存儲陣列,不同的組合可以滿足開發(fā)過程中不同的應用需求。

采集數(shù)據(jù)標注過程分析

數(shù)據(jù)標注涉及圖像、點云等各種不同輸入傳感器數(shù)據(jù)類型,標注過程包括提起標注需求、注入標注方案,實際數(shù)據(jù)標注(包括數(shù)據(jù)清洗、數(shù)據(jù)評估、數(shù)據(jù)提取、數(shù)據(jù)分析),最后通過數(shù)據(jù)審核,則生成相應的數(shù)據(jù)標注結果,可用于下載。其中,數(shù)據(jù)標注過程需要滿足一定的要求和原則,包括如下:
對于在AI賦能下的自動駕駛的具體應用主要有以下幾種:
1、2D框標注,應用于對車輛與行人的基礎識別,即標注出騎行的人,步行的人,汽車等;
2、3D立方體標注,對車輛進行區(qū)域標注及分類標注,應用于對車輛類型的識別,例如面包車、卡車、大客車、小轎車等,訓練自動駕駛,在道上選擇性跟車或者變道操作;
3、點云標注,對3D激光雷達點云進行標注;
4、多段線標注,車道線標注:一種對道路地面標線進行的綜合標注,包括區(qū)域標注、分類標注及語義標注,應用于訓練自動駕駛,根據(jù)車道規(guī)則進行行駛。

針對如上的標注方式,需要說明的是在自動駕駛設計過程中,我們更加關注對于3維目標障礙物的識別,常用的檢測方式是采取激光雷達或4D毫米波雷達進行目標檢測。檢測結果通過如上2D或3D進行點云標注,其中3D點云標注主要應用于基于激光雷達或4D高分辨率毫米波雷達的訓練,針對自動駕駛主要場景而言應用先進的標注工具,可對3D障礙物進行框選、對雷達圖進行語義分割,對于環(huán)境中的三維模型或障礙物實現(xiàn)更好的識別分類。另一種標注方式是進行2D3D融合標注,借助先進的標注工具,可對環(huán)境中的二維和三維數(shù)據(jù)參照是否具備明顯的深度信息,圖像的形狀模型信息同時確定進行聯(lián)合標注。幫助車輛實現(xiàn)視覺和雷達的感知,可應用于自動駕駛場景的訓練落地。

5、語義分割,對圖片中的不同區(qū)域進行分割標注:這些類可能是行人,車輛,建筑物,天空,植被等等。例如,語義分割可以幫助SDCs(自動駕駛車輛)識別一個圖片中的可行駛區(qū)域。

圖像語義分割是基于區(qū)域的多邊形標注,對復雜不規(guī)則的圖片進行區(qū)域劃分并標注對應屬性,助力圖像識別模型訓練,多應用于人體分割、場景分割和自動駕駛道路分割。

6、視頻跟蹤標注,跟蹤標注視頻中行駛的車輛,是將視覺數(shù)據(jù)按照圖片幀抓取進行標框標注,標注后的圖片幀按照順序重新組合成視頻數(shù)據(jù)訓練自動駕駛。

視頻跟蹤標注又稱為連續(xù)幀標注,常用于自動駕駛及視頻圖像識別模型的訓練,通常應用于下一代自動駕駛圖像識別場景的幀率較高如果在識別分類過程中對每一幀圖像都進行目標物標注,則會導致在模型訓練中存在較大的計算量,常用的方法是通過對視頻進行抽幀注,并抽取的每一幀圖片中的目標物體進行連續(xù)標注,不僅可以大大降低運算量,又可以降低識別標注的難度,增強標注的效率。
此外,對于智能座艙內(nèi)部的駕駛員監(jiān)控平臺而言,要識別駕駛員的面部表情、神態(tài)、疲勞程度、注意力程度、人臉分析,就需要對駕駛員形態(tài)進行精確識別,將人臉部分骨骼進行打點分析,并基于所打點的部分進行標注,標注后的圖像可很好的助力于圖像識別模型訓練。

基于數(shù)據(jù)采集的后端仿真管理

數(shù)據(jù)采集后端除開可進行模型訓練外,還可以進行場景仿真。仿真的輸入包含基于自然采集數(shù)據(jù)統(tǒng)計參數(shù)范圍,通過open工具可大規(guī)模生成測試場景。在滿足上述場景測試需求的同時,隨著系統(tǒng)及場景復雜性要求,由于自動駕駛功能的設計缺陷及可合理預見的人員誤用導致產(chǎn)生預期功能安全問題愈發(fā)嚴重,針對預期功能安全設計場景庫已成為自動駕駛系統(tǒng)驗證的重中之重。最終從宏觀層面,保證測試場景的多源異構,場景數(shù)據(jù)涉及不同城市、不同地域,并具體到不同自動駕駛功能ODD范圍。微觀層面,依托真實駕駛數(shù)據(jù),確保場景內(nèi)元素取值的真實性與合理性。
通過采集的不同場景數(shù)據(jù),基于場景提取原則,確定關鍵場景生成元素,建立場景生成及篩選機制,產(chǎn)生高效、合理且典型的場景,通過軟件匹配,可以確保由參數(shù)范圍生成測試場景的有效性。測試驗證自動駕駛功能在危險工況下的性能表現(xiàn),旨在將危險場景通過自動駕駛功能的合理設計和迭代升級轉(zhuǎn)換成安全場景,降低事故發(fā)生率。同時,考慮數(shù)據(jù)采集管理階段充分考慮場景中的各元素,從海量測試場景中選取高質(zhì)量代表性場景,在算法調(diào)試和功能驗證階段節(jié)省測試時間,加速測試驗證過程。計算單個測試場景的復雜程度,選取代表性典型場景,剔除冗余和低質(zhì)量場景。通過數(shù)據(jù)驅(qū)動的方式,尋找采集場景數(shù)據(jù)中難以獲取的邊角場景,保證對自動駕駛系統(tǒng)驗證的全面性要求。以自然駕駛場景數(shù)據(jù)為基礎,通過統(tǒng)計學合理外推(例如:μ+3σ原則),尋找現(xiàn)實生活中難以發(fā)現(xiàn)的低概率場景。采用高維搜索與自延展學習理論,實現(xiàn)已知不安全場景庫的構建,通過建立搜索約束和加速搜索邏輯擴大已知不安全場景庫,縮小未知不安全領域,確保自動駕駛系統(tǒng)的安全性要求。

總結

目前自動駕駛的主流算法模型主要以有監(jiān)督的深度學習方式為主,需要大量的結構化標注數(shù)據(jù)對模型進行訓練和調(diào)優(yōu)??梢姅?shù)據(jù)采集、標注在其中扮演了極為重要的角色。本文重點介紹了數(shù)據(jù)采集、標注的整個過程需求、方法、原則、類型要素及仿真場景重構等。數(shù)據(jù)采集流程包收集三大主要流程,其中涉及需求收集階段進行原始采集需求收集;數(shù)據(jù)獲取服務涉及數(shù)據(jù)獲取包含定制數(shù)據(jù)方案、人工數(shù)據(jù)采集、自動化數(shù)據(jù)采集、調(diào)研問卷收集幾大方面。數(shù)據(jù)加工服務涉及數(shù)據(jù)清洗、數(shù)據(jù)評估、數(shù)據(jù)提取、分析處理及標準化數(shù)據(jù)輸出。數(shù)據(jù)交付階段主要涉及將采集數(shù)據(jù)輸入至訓練模型進行智能學習過程。

在功能開發(fā)過程中,利用好數(shù)據(jù)采集、標注方法可以很好的提升場景重構、訓練能力,提升前期軟件開發(fā)性能。
分享到:
 
反對 0 舉報 0 收藏 0 評論 0
滬ICP備11026917號-25