日本无码免费高清在线|成人日本在线观看高清|A级片免费视频操逼欧美|全裸美女搞黄色大片网站|免费成人a片视频|久久无码福利成人激情久久|国产视频一二国产在线v|av女主播在线观看|五月激情影音先锋|亚洲一区天堂av

  • 手機(jī)站
  • 小程序

    汽車測試網(wǎng)

  • 公眾號
    • 汽車測試網(wǎng)

    • 在線課堂

    • 電車測試

L4無人駕駛瓶頸之一:計算平臺

2019-12-10 23:01:08·  來源:佐思汽車研究  作者:周彥武  
 
L4無人駕駛計算平臺是限制L4無人駕駛大規(guī)模推廣的瓶頸之一,其他瓶頸也很多。悲觀的話,10年內(nèi)L4級無人駕駛無法量產(chǎn),樂觀的話至少也要再等上5年。典型L4級無人
 L4無人駕駛計算平臺是限制L4無人駕駛大規(guī)模推廣的瓶頸之一,其他瓶頸也很多。悲觀的話,10年內(nèi)L4級無人駕駛無法量產(chǎn),樂觀的話至少也要再等上5年。
典型L4級無人駕駛計算平臺如上圖,基本上就是兩套一模一樣的系統(tǒng),包含了CPU、GPU和加速器。多個加速器還需要一個PCIe交換機(jī),其價格非常昂貴,甚至比加速器都貴。與線控底盤連接需要一個達(dá)到ASIL-D級的MCU,通常是英飛凌的TC297/397,瑞薩的RH850和NXP的MPC574X系列也能達(dá)到。
計算平臺核心是以太網(wǎng)交換機(jī),以上圖為例,Marvell的7口以太網(wǎng)交換器88E6321通過以太網(wǎng)物理層Marvell的88E1512與兩個CPU也就是英偉達(dá)的Tegra Parker連接。Parker外接GPU加速器,以太網(wǎng)交換器也連接主要傳感器和底盤控制MCU(PX2中就是英飛凌的TC297T),可謂是PX2的關(guān)鍵芯片。88E6321的后續(xù)產(chǎn)品是88Q5050,由德國大陸汽車旗下子公司Elektrobit與Marvell聯(lián)合打造,88Q5050則用在英偉達(dá)最新旗艦Pegasus,這也是基于最新的車載以太網(wǎng)標(biāo)準(zhǔn)TSN的首次實際應(yīng)用。
通常CPU對應(yīng)標(biāo)量計算,主要是路徑規(guī)劃和決策算法,此外部分激光雷達(dá)使用ICP點云配準(zhǔn)算法,CPU比GPU能更好對應(yīng)。常用的傳感器融合如卡爾曼濾波算法也多是標(biāo)量運算。GPU對應(yīng)矢量或者說向量計算,包括高精度地圖、傳統(tǒng)視覺算法。矩陣就是卷積運算的核心,也是所謂人工智能的核心運算。通俗一點理解的話,我們可以將標(biāo)量視為零階張量,矢量視為一階張量,那么矩陣就是二階張量。FPGA比較特殊,它天生并行結(jié)構(gòu),對應(yīng)矢量和矩陣都沒問題,對應(yīng)高階張量更能發(fā)揮特長。
CPU應(yīng)該達(dá)到200K DMIPS以上的算力。ARM設(shè)計的針對L4使用的Cortex-a76AE,ARM推薦的是驚人的16核設(shè)計,車規(guī)級肯定運行頻率不能太高,否則功耗太高,估計最高不超過2.2GHz,甚至是1.8GHz,這樣的算力超過250K,我們給它打個八折,算200K。AI部分主要是推理,一般都是INT8的精度。如果特別側(cè)重攝像頭,INT8至少要有20TOPS的算力,如果更側(cè)重激光雷達(dá),那么個人認(rèn)為4TOPS就足夠。
常見或有潛力成為無人駕駛計算平臺的芯片對比
EyeQ5的CPU很弱,只有52K,是所有芯片里最差的,不過這關(guān)系不大,因為它屬于英特爾,英特爾的汽車SoC也就是Atom 3900系列可以派上用場,3900系列中最高級的A3960大約有50K DMIPS。英特爾的Atom 3900系列差不多6年都沒更新?lián)Q代了?;蛟S2020年會更新。
Xavier表現(xiàn)最全面,CPU算力有137K,仍然不及格。SA8155P是高通驍龍855的車規(guī)版,跟麒麟990一樣都是7納米,4個A76加4個A55內(nèi)核。估計A76的運行頻率也會降低,即便是A76火力全開,也難以超過130K。特斯拉的AI很強(qiáng),不過12個A72最多也就是150K。以特斯拉的出貨量,這顆芯片估計最低都要300美元。
最優(yōu)秀的實際是Xilinx的VersalAI Core,AI算力擁有壓倒性優(yōu)勢,最低都有49TOPS。這是全球首顆7納米FPGA。
稱之為FPGA或許不切合實際,Xilinx稱之為Adaptive Compute Acceleration Platform (ACAP)。
 ACAP結(jié)合了CPU和GPU(DSP)的高效率應(yīng)用場景,能夠自適應(yīng)各種計算形式。
ACAP里包含了兩個A72內(nèi)核,對應(yīng)標(biāo)量計算,兩個A72擁有48KB/32KB的一級緩存,1MB的二級緩存,這比傳統(tǒng)的ASIC要高不少。同時也有Cortex-R5雙核保證實時性任務(wù)的可靠執(zhí)行,如Boot。有AI和DSP引擎,AI引擎從128-400個,DSP引擎從928-1968個。還有完整的片上網(wǎng)絡(luò),包括兩個以太網(wǎng)接口,一個USB 2.0,兩個UART,兩個SPI,兩個I2C,兩個特別為汽車行業(yè)考慮的CAN-FD。LUT方面最高接近200萬個,Xilinx說足以媲美服務(wù)器級CPU。
Xilinx Versal AICore參數(shù)見上表,這么牛掰的東西使用的晶體管數(shù)量驚人,Versal AI Core的旗艦VC1902使用了370億個晶體管,預(yù)計最低級的VC1352也有50億個。而英偉達(dá)的Tesla V100才212億個,Xavier才90億個晶體管。上個月英特爾還有更瘋狂的Stratix 10 GX 10M FPGA。這是全球密度最高的 FPGA,擁有 1020 萬個邏輯單元,433 億顆晶體管。通常芯片的晶體管密度是25-31百萬/平方毫米,Xilinx Versal AI Core最小都有大約250平方毫米的裸晶面積,這就注定其價格非常高昂?,F(xiàn)在7納米的產(chǎn)能非常緊俏,F(xiàn)PGA的裸晶面積又特別大,但量又很低,筆者估計最低價格也是1500美金起。ACAP主要市場還是數(shù)據(jù)中心領(lǐng)域、5G基站和航天航空雷達(dá)領(lǐng)域。不過在汽車領(lǐng)域可以只用一片,甚至可以連風(fēng)扇都不需要的小盒子搞掂L4運算平臺。

Versal ACAP在今年9月份正式推出,目前價格還未知。ACAP的出現(xiàn)或許表明初創(chuàng)公司做AI芯片不是個好方向,先不要說7納米一次流片費用近3億(28納米的芯片晶體管密度根本無法和7納米比)。即便是ASIC,一味強(qiáng)調(diào)算力,也根本無法和FPGA匹敵的。靈活度就更不用說了。初創(chuàng)公司還是做算法比較合適,等壯大了,才能燒錢做芯片。 
分享到:
 
反對 0 舉報 0 收藏 0 評論 0
滬ICP備11026917號-25