日本无码免费高清在线|成人日本在线观看高清|A级片免费视频操逼欧美|全裸美女搞黄色大片网站|免费成人a片视频|久久无码福利成人激情久久|国产视频一二国产在线v|av女主播在线观看|五月激情影音先锋|亚洲一区天堂av

  • 手機(jī)站
  • 小程序

    汽車測(cè)試網(wǎng)

  • 公眾號(hào)
    • 汽車測(cè)試網(wǎng)

    • 在線課堂

    • 電車測(cè)試

駕駛域計(jì)算平臺(tái)架構(gòu)核心軟件和底層硬件梳理

2021-09-15 20:40:05·  來(lái)源:智駕最前沿  
 
二、底層硬件梳理
(一)底層硬件采用異構(gòu)分布架構(gòu)(以華為 MDC 為例)
智能駕駛域控制器是結(jié)合車輛線控平臺(tái)和大量多類型外圍傳感器的核心部分,具有多樣的接口類型、足夠的接口數(shù)量和高性能等特點(diǎn)。多傳感器數(shù)據(jù)融合、人工智能算法等技術(shù)對(duì)域控制器的接口和算力性能都有著更高要求,因此,域控制器需要采用集成多種架構(gòu)芯片的異構(gòu)多核芯片的硬件方案。
異構(gòu)多核芯片硬件架構(gòu)主要由具有AI單元、計(jì)算單元和控制單元三部分組成。
AI單元:為異構(gòu)芯片硬件架構(gòu)中算力最大的一部分,通過(guò)系統(tǒng)內(nèi)核進(jìn)行加速引擎和軟硬件資源的分配、調(diào)度。AI 單元主要完成多傳感器融合數(shù)據(jù)的分析和處理,輸出用于規(guī)劃、決策和控制的周圍環(huán)境信息。目前,主流的 AI芯片可選架構(gòu)有 GPU、FPGA、ASIC 等。
計(jì)算單元:基于多核CPU的計(jì)算單元具有主頻高,計(jì)算能力強(qiáng)等特點(diǎn),通過(guò)系統(tǒng)內(nèi)核管理軟件和硬件資源、完成任務(wù)調(diào)度。計(jì)算單元主要用于執(zhí)行大部分自動(dòng)駕駛相關(guān)的核心算法,整合多傳感器融合數(shù)據(jù)完成路徑規(guī)劃、決策控制等功能。
控制單元:主要基于傳統(tǒng)車輛控制器(MCU)完成車輛動(dòng)力學(xué)橫縱向控制任務(wù),搭載基礎(chǔ)軟件平臺(tái)的控制單元將各個(gè)車輛控制的功能軟件連接起來(lái)實(shí)現(xiàn)車輛控制,同時(shí),軟件系統(tǒng)需要預(yù)留與智能車輛操作系統(tǒng)集成的通信接口。


域控制器核心底層硬件分類
以華為MDC為例,除了常見的MCU外,MDC計(jì)算平臺(tái)內(nèi)部包含了兩個(gè)核心芯片:CPU芯片:鯤鵬920s,基于華為自研的ARM處理器,采用7nm制程,最大功耗55W;AI芯片:昇騰310,基于達(dá)芬奇AI架構(gòu),12nm制程,最大功耗8W,算力達(dá)到16TOPS(八位整數(shù)精度)。


華為MDC架構(gòu)——底層硬件平臺(tái)有AI芯片/CPU等構(gòu)成
華為MDC計(jì)算單元內(nèi)部包括四大模塊:CPU模塊、圖像處理、AI處理、數(shù)據(jù)交換。其中數(shù)據(jù)交換模塊主要負(fù)責(zé)其余各個(gè)模塊的數(shù)據(jù)交互,圖像處理模塊主要用于把攝像頭的原始數(shù)據(jù)處理成YUV格式或者RGB格式,此外AI處理模塊和CPU模塊主要功能如下:
AI處理模塊(內(nèi)置AI芯片):主要用來(lái)做AI計(jì)算,主要是CNN計(jì)算(卷積神經(jīng)網(wǎng)絡(luò)),可以做攝像頭的AI處理,或者攝像頭和激光雷達(dá)的前融合AI計(jì)算,內(nèi)存64GB;
CPU模塊(內(nèi)置CPU芯片):主要提供整型計(jì)算,可以用來(lái)部署后融合、定位、規(guī)控等應(yīng)用軟件算法,內(nèi)存是16GB。


華為MDC與上層應(yīng)用架構(gòu)圖
注:CAN、ETH、GMSL 等皆為內(nèi)部通信方式,一般來(lái)說(shuō) ETH(以太網(wǎng)接口)可以連接到 4G 網(wǎng)絡(luò),車聯(lián)網(wǎng)系統(tǒng)等,CAN 接口可以對(duì)接底盤 ECU,包括轉(zhuǎn)向和動(dòng)力 ECU 等。
(二) CPU+ AI 芯片的三大流派
1.AI芯片的主要分類:GPU/FPGA/ASIC
GPU仍屬于通用性芯片。它與傳統(tǒng)CPU有明顯差異,CPU需要很強(qiáng)的通用性來(lái)處理各種不同的數(shù)據(jù)類型,同時(shí)對(duì)邏輯判斷有較高要求,因此CPU的內(nèi)部結(jié)構(gòu)異常復(fù)雜。而GPU面對(duì)的則是數(shù)據(jù)類型高度一致、相互無(wú)依賴的大規(guī)模數(shù)據(jù)和不需要被打斷的純凈的計(jì)算環(huán)境。
GPU采用了數(shù)量眾多的計(jì)算單元和超長(zhǎng)的流水線,但只有非常簡(jiǎn)單的控制邏輯并省去了Cache,而CPU不僅被Cache占據(jù)大量空間,而且還有有復(fù)雜的控制邏輯和諸多優(yōu)化電路,相比之下計(jì)算能力只是CPU很小的一部分。


CPU VS GPU
ASIC屬于定制化芯片,即應(yīng)特定用戶要求和特定電子系統(tǒng)的需要而設(shè)計(jì)、制造的集成電路。ASIC的特點(diǎn)是面向特定用戶的需求,ASIC在批量生產(chǎn)時(shí)與通用集成電路相比具有體積更小、功耗更低、可靠性提高、性能提高、保密性增強(qiáng)、成本降低等優(yōu)點(diǎn)。ASIC具有高性能、低功耗的優(yōu)勢(shì),但它們包含的大部分算法——除了那些在軟件內(nèi)部處理器內(nèi)核執(zhí)行的——其余都是“凍結(jié)的”。
FPGA,是作為專用集成電路(ASIC)領(lǐng)域中的一種半定制電路而出現(xiàn)的,F(xiàn)PGA最大特點(diǎn)在于,可以配置它的可編程架構(gòu)來(lái)實(shí)現(xiàn)研發(fā)人員需要的數(shù)字功能組合。
ASIC VS FPGA對(duì)比:
(1)用途:FPGA主要用于要求快速迭代或小批量產(chǎn)品;ASIC用于設(shè)計(jì)規(guī)模大,復(fù)雜度較高的芯片,或成熟度高,產(chǎn)量較大的產(chǎn)品;
(2)成本:小批量需求時(shí),單片F(xiàn)PGA成本低于ASIC,隨著產(chǎn)品量的增加,單片ASIC成本逐步降低;
(3)功耗:在相同工藝條件下,F(xiàn)PGA要大于ASIC;
(4)速度:FPGA內(nèi)部是基于通用的結(jié)構(gòu),通用則導(dǎo)致冗余;ASIC是根據(jù)設(shè)計(jì)需求,最優(yōu)化邏輯資源,并且做到最優(yōu)布局走線,降低走線延遲;
(5)面積:定制化的電路設(shè)計(jì)和工藝使用ASIC面積小于FPGA;


不同類型芯片對(duì)比
1. 流派一:CPU+GPU+ASIC(英偉達(dá)、特斯拉、高通等為代表)
英偉達(dá)自動(dòng)駕駛芯片采用CPU+GPU+ASIC架構(gòu)。英偉達(dá)目前在全球自動(dòng)駕駛芯片領(lǐng)域處于行業(yè)龍頭地位,主要產(chǎn)品包括Xavier(2018年推出,已公布架構(gòu))、Orin(2019年推出,英偉達(dá)未曾披露內(nèi)部架構(gòu))等,2021年推出ALTAN。
2018年發(fā)布的Xavier目前已成功量產(chǎn),該款芯片主要有4個(gè)模塊:CPU、GPU以及兩個(gè)加速器ASIC。搭載的兩個(gè)加速器ASIC分別為Deep Learning Accelerator(DLA) 和 Programmable Vision Accelerator(PVA)。從體型來(lái)看,占據(jù)最大面積的是GPU,其次是CPU,最后輔以兩個(gè)專用 ASI,有助于優(yōu)化能耗比。
2021年發(fā)布的Atlan將用于多家汽車制造商的2025年車型上,該款芯片主要也包括4個(gè)模塊:全新Arm CPU核、GPU以及深度學(xué)習(xí)和計(jì)算機(jī)視覺(jué)加速器。
此外,它還將包括BlueField數(shù)據(jù)處理單元,該數(shù)據(jù)處理單元可提供廣泛的高級(jí)網(wǎng)絡(luò)、存儲(chǔ)和安全服務(wù),以支持自動(dòng)駕駛汽車中的復(fù)雜計(jì)算和AI工作負(fù)載,該款處理器將提供每秒超過(guò)1000萬(wàn)億次(TOPS)算力。


英偉達(dá)Xavier架構(gòu)


英偉達(dá)Atlan架構(gòu)
特斯拉自行設(shè)計(jì)的FSD算力高達(dá)144Tops,也采用CPU+GPU+ASIC架構(gòu)。FSD包含著三種不同的處理單元,分別為負(fù)責(zé)圖形處理的GPU、負(fù)責(zé)深度學(xué)習(xí)和預(yù)測(cè)的神經(jīng)處理單元 NPU(ASIC),還有負(fù)責(zé)通用數(shù)據(jù)處理的中央處理器 CPU。特斯拉自行定制設(shè)計(jì)FSD芯片上的神經(jīng)網(wǎng)絡(luò)加速器(NPU),這是FSD芯片上最大的組件,也是最重要的邏輯部分。


特斯拉FSD架構(gòu)
高通Snapdragon ride高階產(chǎn)品預(yù)計(jì)采用的也是CPU+GPU+ASIC架構(gòu)。2020年高通發(fā)布駕駛域芯片產(chǎn)品Snapegragon ride,該款產(chǎn)品分為三個(gè)系列:
(1)面向L1/L2級(jí)ADAS(具備AEB、TSR和LKA等ADAS功能)的底層硬件包括1個(gè)ADAS應(yīng)用處理器(安全系統(tǒng)級(jí)芯片SoC),可提供30~60 TOPS算力;
(2)面向L2+級(jí)ADAS (具備HWA、自動(dòng)泊車APA以及TJA等功能)的硬件支持為2個(gè)或多個(gè)ADAS應(yīng)用處理器,所需算力要求約為60-125 TOPS;
(3)最高階產(chǎn)品面向L4/L5級(jí)自動(dòng)駕駛,配置的底層硬件為2個(gè)ADAS應(yīng)用處理器+ 2個(gè)自動(dòng)駕駛加速器ML(ASIC),最高可提供700TOPS算力,功耗為150W左右。


高通Snapdragon ride產(chǎn)品線
2. 流派二:CPU+ASIC(Mobileye、華為、地平線等為代表)
Mobileye在自動(dòng)駕駛芯片領(lǐng)域具有強(qiáng)大競(jìng)爭(zhēng)優(yōu)勢(shì),2004年以來(lái)陸續(xù)推出基于ASIC架構(gòu)的EyeQ系列芯片。Mobileye產(chǎn)品覆蓋L1-L3級(jí)別的前裝 ADAS,硬件產(chǎn)品主要是是基于 ASIC 架構(gòu)的 EyeQ 芯片,該公司智能駕駛系統(tǒng)解決方案包括四個(gè)部分:EyeQ芯片、自動(dòng)駕駛策略、安全的防護(hù)層 RSS、地圖技術(shù) REM。
截止目前,EyeQ系列芯片已發(fā)布五代。第一代產(chǎn)品EyeQ1算力約0.0044Tops,第二代產(chǎn)品EyeQ2算力約0.026Tops,功耗均為2.5w,這兩款產(chǎn)品主要用于L1級(jí)自動(dòng)駕駛。第三代產(chǎn)品EyeQ3是自行開發(fā)的ASIC架構(gòu),使用了4顆MIPS核心處理器、4顆VMP芯片,可以支持L2高級(jí)輔助駕駛計(jì)算需求。
2018年量產(chǎn)上市的第四代產(chǎn)品EyeQ4采用28nm工藝,使用了5顆核心處理器、6顆VMP芯片、2顆MPC核心和2顆PMA核心,最高可實(shí)現(xiàn)L4級(jí)自動(dòng)駕駛功能。
最新一代芯片EyeQ5主要有4個(gè)模塊:CPU、視覺(jué)加速期CVP(ASIC)、以及Deep Learning Accelerator(DLA) 和 Multithreaded Accelerator(MA)。從模塊的大小來(lái)看,CPU 、CVP占據(jù)大頭,其中CVP是針對(duì)很多傳統(tǒng)計(jì)算機(jī)視覺(jué)算法設(shè)計(jì)的ASIC芯片。歷史上,Mobileye一向以CV算法而聞名,同時(shí)因?yàn)橛脤S械腁SIC來(lái)運(yùn)行算法從而可以達(dá)到很低功耗。
不過(guò)Mobileye的ASIC芯片+算法系統(tǒng)是封閉的,對(duì)OEM和Tier 1來(lái)說(shuō)就是黑盒,這也是被眾多廠商詬病的主要原因,因?yàn)镺EM和Tier 1不僅無(wú)法使用不同的算法來(lái)體現(xiàn)差異化競(jìng)爭(zhēng),而且還不能掌握這類核心算法。


Mobileye EyeQ5方框圖
華為是我國(guó)本土智能駕駛芯片領(lǐng)域綜合實(shí)力最強(qiáng)的龍頭之一,針對(duì)不同應(yīng)用場(chǎng)景,2021年初正式推出4款MDC產(chǎn)品。(1)MDC300F,目標(biāo)應(yīng)用場(chǎng)景為港口、礦山、園區(qū)物流等領(lǐng)域的商業(yè)車或作業(yè)車,算力約64Tops;(2)MDC210,目標(biāo)應(yīng)用場(chǎng)景為L(zhǎng)2+功能場(chǎng)景的乘用車,算力約48Tops;(3)MDC610,目標(biāo)應(yīng)用場(chǎng)景為L(zhǎng)4+功能場(chǎng)景的乘用車,算力逾200Tops;(4)MDC810,目標(biāo)應(yīng)用場(chǎng)景為L(zhǎng)4-L5功能場(chǎng)景的乘用車或Robotaxi,算力逾400Tops;
華為MDC亦采用CPU+ASIC組合架構(gòu),自研NPU昇騰310提供強(qiáng)勁AI算力。根據(jù)華為2018年發(fā)布的MDC產(chǎn)品介紹,MDC集成了華為自研的Host CPU芯片、AI芯片、ISP芯片與SSD控制芯片。
MDC300計(jì)算平臺(tái)支持L3級(jí)自動(dòng)駕駛,由昇騰310芯片(自研達(dá)芬奇架構(gòu)NPU,屬于ASIC)、鯤鵬CPU和英飛凌TC397三部分構(gòu)成,MDC600計(jì)算平臺(tái)支持L4及以上自動(dòng)駕駛,包括鯤鵬CPU、昇騰310芯片和ISP。


華為MDC300/600部分核心參數(shù)


華為MDC平臺(tái)基于高度集成的Ascend Soc
地平線屬于我國(guó)第一個(gè)實(shí)現(xiàn)車規(guī)級(jí)AI芯片前裝量產(chǎn)的企業(yè)。2019年公司發(fā)布征程2,已公布搭載地平線征程2芯片的有長(zhǎng)安UNI-T、奇瑞螞蟻、智己汽車、長(zhǎng)安UNI-K、廣汽埃安AION Y、東風(fēng)嵐圖Free、江淮汽車思皓QX、廣汽傳祺GS4 Plus、上汽大通MAXUS MIFA概念車9款車型。
目前,2021年發(fā)布的征程5已率先斬獲車型定點(diǎn),量產(chǎn)上車時(shí)間預(yù)計(jì)在2022年下半年,計(jì)劃中的征程6基于車規(guī)級(jí)7nm先進(jìn)工藝,預(yù)計(jì)工程樣片的推出時(shí)間是2023年,量產(chǎn)上車是在2024年。


地平線汽車智能芯片路線圖
地平線征程2采用CPU+ASIC組合架構(gòu)。2019年地平線發(fā)布國(guó)內(nèi)首款已量產(chǎn)車規(guī)級(jí)邊緣AI視覺(jué)芯片征程2.0,該芯片用28納米制程制造,集成雙核Arm Cortex A53,以及自研的雙核地平線二代BPU架構(gòu),達(dá)到車規(guī)級(jí)AEC-Q100標(biāo)準(zhǔn),性能方面,其等效算力超過(guò)4 TOPS,采用17mm*17mm的BGA388封裝工藝,其典型功耗僅為2W。


地平線征程2芯片架構(gòu)


地平線征程2方框圖
3. 流派三:CPU+ FPGA(百度-賽靈思、Waymo等為代表)
百度已量產(chǎn)的ACU采用CPU+FPGA。百度ACU是Apollo面向量產(chǎn)的自動(dòng)駕駛車載計(jì)算單元,根據(jù)不同需求場(chǎng)景的計(jì)算能力要求,分為多個(gè)系列產(chǎn)品,ACU-Advanced是自主泊車產(chǎn)品專用車載計(jì)算平臺(tái),目前已量產(chǎn)下線。
ACU-Advanced核心架構(gòu)基于Xilinx ZU5(FPGA)設(shè)計(jì),同時(shí)適配百度飛槳深度學(xué)習(xí)框架。根據(jù)百度的研發(fā)人員觀點(diǎn),賽靈思該款芯片具有靈活性好,有利于算法迭代;其次,該款芯片可以提供充足算力,保持行駛速度;再次,可以滿足85℃環(huán)境下正常使用的嚴(yán)苛車規(guī)級(jí)要求。同時(shí),F(xiàn)PGA SOC性能可靠度高,有助于保證自動(dòng)駕駛的安全。


百度采用的賽靈思FPGA芯片架構(gòu)


百度ACU-Advanced采用的底層硬件架構(gòu)
Waymo采用Xeon處理器(CPU)和 Arria FPGA為典型處理方案。2017年英特爾表示自2009年以來(lái)一直與谷歌合作開發(fā)無(wú)人駕駛汽車,同時(shí)也與 Waymo 合作,英特爾Waymo后者提供 Xeon處理器、Arria FPGA(用于機(jī)器視覺(jué))以及千兆以太網(wǎng)的解決方案,以幫助 Waymo無(wú)人汽車實(shí)時(shí)處理信息。


英特爾Xeon 處理器架構(gòu)


Arria 10 FPGA架構(gòu)
分享到:
 
反對(duì) 0 舉報(bào) 0 收藏 0 評(píng)論 0
廣告
滬ICP備11026917號(hào)-25