全球自動(dòng)駕駛AI芯片最新、最全盤(pán)點(diǎn)

2020-07-13 21:37:30· 來(lái)源：汽車(chē)電子與軟件

一.引言自動(dòng)駕駛汽車(chē)的智能化取決于算法，因此有軟件定義汽車(chē)的概念出現(xiàn)并且大為盛行，但是要想實(shí)現(xiàn)軟件定義汽車(chē)，必須要有一個(gè)可以承載高度智能化且運(yùn)算量龐大

一. 引言

自動(dòng)駕駛汽車(chē)的智能化取決于算法，因此有軟件定義汽車(chē)的概念出現(xiàn)并且大為盛行，但是要想實(shí)現(xiàn)軟件定義汽車(chē)，必須要有一個(gè)可以承載高度智能化且運(yùn)算量龐大的AI算法的硬件計(jì)算平臺(tái)或者叫域控制器，而無(wú)論是硬件計(jì)算平臺(tái)還是域控制器，都離不開(kāi)芯片。自動(dòng)駕駛從L0到L5，隨著功能的完善和性能的提升，帶來(lái)更好的智能和科技體驗(yàn)的同時(shí)，也對(duì)AI芯片的算力和性能提出更高的需求。

之前的文檔曾提到，L2或者說(shuō)ADAS需要的AI計(jì)算力<10TOPS，L3需要的AI計(jì)算力為30~60TOPS，L4需要的AI計(jì)算力>100TOPS，L5需要的AI計(jì)算力為500-1000TOPS。

對(duì)于域控制器而言，硬件大體可分為三部分：承擔(dān)環(huán)境感知和深度學(xué)習(xí)等超大算力需求的AI處理芯片、負(fù)責(zé)控制決策和邏輯運(yùn)算的CPU、以及負(fù)責(zé)功能安全和車(chē)輛控制的MCU。

第一部分通常是GPU或TPU，承擔(dān)大規(guī)模浮點(diǎn)數(shù)并行計(jì)算需求，主要用于環(huán)境感知和信息融合，如Xavier的GPU單元、昇騰310、地平線BPU等。

第二部分大多為ARM架構(gòu)，類(lèi)似于CPU，主要負(fù)責(zé)邏輯運(yùn)算和決策控制，處理高精度浮點(diǎn)數(shù)串行計(jì)算。

第三部分主要負(fù)責(zé)可靠性和車(chē)輛控制，目前用的較多的就是Infineon的TC297或者TC397。

第三部分MCU目前大部分域控制器或者計(jì)算平臺(tái)都會(huì)選擇Infineon的TriCore系列TC397或者TC297，比如華為、地平線、德賽西威、優(yōu)控智行等。第二部分大多是ARM架構(gòu)處理器，或者和第一部分AI計(jì)算模塊集成到一個(gè)SoC上，而第一部分目前正處在風(fēng)頭浪尖或者說(shuō)行業(yè)變革和技術(shù)路線探索的階段，前面也專(zhuān)門(mén)整理了一篇文章講被稱(chēng)為AI芯片的各種xPU。

本文盤(pán)一下，目前可供選擇用于設(shè)計(jì)域控制器或計(jì)算平臺(tái)的AI芯片種類(lèi)和廠家，雖然目前的芯片最高也僅能滿足部分L3、L4級(jí)自動(dòng)駕駛AI計(jì)算所需。

二. 自動(dòng)駕駛AI芯片盤(pán)點(diǎn)

1. 華為MDC和昇騰Ascend芯片

華為在2018年推出MDC智能駕駛計(jì)算平臺(tái)以及高階自動(dòng)駕駛?cè)珬＝鉀Q方案，包括MDC300和MDC600兩個(gè)平臺(tái)，分別對(duì)應(yīng)L3和L4級(jí)自動(dòng)駕駛。

華為MDC300由華為昇騰Ascend310芯片、華為鯤鵬芯片和Infineon的TC397三部分構(gòu)成，算力在64Tops 左右，滿足L3級(jí)自動(dòng)駕駛算力需求。MDC600基于8顆昇騰310 AI芯片，同時(shí)還整合了CPU和相應(yīng)的ISP模塊，算力高達(dá)352TOPS。

華為MDC相對(duì)于其他平臺(tái)而言，最大的優(yōu)勢(shì)在于其統(tǒng)一的系統(tǒng)架構(gòu)便于功能擴(kuò)展和適配多種場(chǎng)景應(yīng)用。并且華為MDC智能駕駛計(jì)算平臺(tái)已經(jīng)于2020年1月16日通過(guò)了德國(guó)萊茵頒發(fā)的ISO26262功能安全管理認(rèn)證，達(dá)到ASIL-D級(jí)標(biāo)準(zhǔn)。

華為依托其ICT行業(yè)的經(jīng)驗(yàn)積累，目前已經(jīng)建立起了完善的芯片體系，包括專(zhuān)為5G提供支持的巴龍系列芯片、基于全新達(dá)芬奇架構(gòu)研發(fā)的昇騰Ascend系列AI芯片、在手機(jī)上搭載的CPU處理器芯片麒麟系列，以及服務(wù)器級(jí)處理器芯片鯤鵬系列。其中，昇騰系列AI芯片主打AI算力需求。

昇騰310使用了華為自研的高效靈活CISC指令集，每個(gè)AI核心可以在1個(gè)周期內(nèi)完成4096次MAC計(jì)算，集成了張量、矢量、標(biāo)量等多種運(yùn)算單元，支持多種混合精度計(jì)算，支持訓(xùn)練及推理兩種場(chǎng)景的數(shù)據(jù)精度運(yùn)算。

作為NPU，昇騰310集成了FPGA和ASIC兩款芯片的優(yōu)點(diǎn)，包括ASIC的低功耗以及FPGA的可編程、靈活性高等特點(diǎn)，從而其統(tǒng)一架構(gòu)可以適配多種場(chǎng)景，功耗范圍從幾十毫瓦到幾百瓦，彈性多核堆疊，可在多種場(chǎng)景下提供最優(yōu)能耗比。

相較而言，英偉達(dá)的Xavier 算力為30TOPS，功耗則達(dá)30W，能效為1 TOPS/W，相比之下，華為昇騰310 算力為16 TOPS，功耗僅為8W，能效為2 TOPS/W。

華為自研的昇騰Ascend芯片，支持接入與實(shí)時(shí)處理更多的外部傳感器數(shù)據(jù)流（如攝像頭、毫米波雷達(dá)、激光雷達(dá)、GPS等），為自動(dòng)駕駛提供更安全可靠的計(jì)算力支持，能夠應(yīng)付處理更復(fù)雜路況。搭載昇騰芯片的MDC相比其他計(jì)算平臺(tái)具備高性能。高能效、高安全性和確定性低延時(shí)等優(yōu)勢(shì)。

2. 華為海思(HiSilicon)麒麟芯片

說(shuō)到華為，順道提一下成立于2004年的華為海思，以及大名鼎鼎的麒麟系列芯片。

海思推出的第一款片上SoC是麒麟910，作為智能移動(dòng)端SoC，麒麟910除了CPU還包括基帶（baseband）、圖形處理器（GPU）、數(shù)字信號(hào)處理器（DSP）、圖像信號(hào)處理器（ISP）等重要模塊。

2017年9月，華為在德國(guó)柏林國(guó)際電子消費(fèi)品展覽會(huì)（IFA）上正式推出其新款A(yù)I芯片“麒麟970”（Kirin 970）。麒麟970采用TSMC10nm 工藝，內(nèi)部集成了55億個(gè)晶體管，功耗降低了20%，并實(shí)現(xiàn)了1.2Gbps 峰值下載速率。麒麟970基于寒武紀(jì)的 NPU架構(gòu)打造，創(chuàng)新設(shè)計(jì)了 HiAI 移動(dòng)計(jì)算架構(gòu)，其AI性能密度大幅優(yōu)于CPU和GPU。相較于四個(gè)Cortex-A73核心，處理相同AI任務(wù)，麒麟970擁有約50倍能效和 25倍性能優(yōu)勢(shì)。并且，華為海思陸續(xù)推出麒麟980/985/990等系列SoC，全部針對(duì)AI計(jì)算做了優(yōu)化設(shè)計(jì)，采用華為自研NPU架構(gòu)，性能得到大幅度提升。

近日，有消息稱(chēng)華為已經(jīng)與比亞迪簽訂了合作協(xié)議，未來(lái)的比亞迪新車(chē)將用上華為的麒麟芯片。

但是令人驚訝的是，華為首款上車(chē)的芯片不是成熟的麒麟970，也不是最新的990，而是比較早的一款芯片麒麟710A。麒麟710芯片發(fā)布于2018年7月，它采用8核心設(shè)計(jì)，包括四個(gè)A73大核心和四個(gè)A53小核心，大核心的頻率為2.2GHz；定位較低、核心較老的麒麟710A在麒麟710的基礎(chǔ)上發(fā)展而來(lái)，架構(gòu)和核心未變，但是工藝制程從12nm變?yōu)?4nm，大核心的頻率也降低到了2.0GHz。

為何選擇麒麟710A這款工藝水平退步的過(guò)時(shí)芯片來(lái)上車(chē)？

我們知道由于美國(guó)針對(duì)華為的種種舉措，華為的供應(yīng)商渠道受到嚴(yán)重影響，尤其是芯片代工方面，之前的臺(tái)積電已經(jīng)靠不住了，華為的芯片只能轉(zhuǎn)為國(guó)產(chǎn)代工，而國(guó)內(nèi)唯一可以承擔(dān)這個(gè)重任的只有中芯國(guó)際，但是中芯國(guó)際的工藝只能到14nm，對(duì)于7nm的麒麟970等芯片有心無(wú)力，選來(lái)選去，也就是麒麟710A合適了。

但是從應(yīng)用需求來(lái)說(shuō)，目前麒麟710A可以滿足當(dāng)前智能汽車(chē)車(chē)機(jī)系統(tǒng)對(duì)于功能性能方面的要求，主要是圖像和影音處理，以及交互流暢性等。其競(jìng)爭(zhēng)對(duì)手有同級(jí)別的Intel Atom A3950、高通的驍龍820A芯片等均已開(kāi)始裝車(chē)量產(chǎn)了，比如理想ONE、領(lǐng)克05、小鵬P7等。但是麒麟710A在正式量產(chǎn)裝車(chē)之前，也需要先通過(guò)車(chē)規(guī)級(jí)認(rèn)證。

3. 地平線機(jī)器人征程芯片

地平線成立于2015年7月，由前百度研究院副院長(zhǎng)、百度深度學(xué)習(xí)實(shí)驗(yàn)室主任余凱創(chuàng)辦，致力于為B端用戶提供涉及算法和硬件在內(nèi)完整的嵌入式人工智能解決方案（機(jī)器人大腦）。

2017年12月底，地平線發(fā)布了中國(guó)首款全球領(lǐng)先的嵌入式人工智能芯片——面向智能駕駛的征程（Journey）1.0處理器和面向智能攝像頭的旭日（Sunrise）1.0 處理器，還有針對(duì)智能駕駛、智能城市和智能商業(yè)三大應(yīng)用場(chǎng)景的人工智能解決方案。

2019年8月，地平線宣布量產(chǎn)中國(guó)首款車(chē)規(guī)級(jí)AI芯片——征程二代。Journey 2芯片搭載地平線自主創(chuàng)新研發(fā)的高性能計(jì)算架構(gòu)BPU2.0（Brain Processing Unit），采用臺(tái)積電 28nm 制程工藝，每TOPS算力可達(dá)同等算力GPU的10倍以上，視覺(jué)感知可以實(shí)現(xiàn)識(shí)別精度>99%，延遲<100 毫秒。征程二代主要面向ADAS市場(chǎng)感知方案，可提供超過(guò)4 TOPS的等效算力，典型功耗僅2W。主要用于自動(dòng)駕駛中對(duì)車(chē)輛、行人和道路環(huán)境等目標(biāo)的感知，類(lèi)似MobileyeQ系列芯片。

CES2020上地平線發(fā)布了Matrix2平臺(tái)，基于自研Journey征程2芯片，算力達(dá)到16Tops。同時(shí)地平線計(jì)劃2020年底推出征程5，96Tops算力，15W功耗，支持16路攝像頭，對(duì)標(biāo)特斯拉FSD。

基于自研計(jì)算平臺(tái)與產(chǎn)品矩陣，目前地平線已支持 L2、L3、L4 等不同級(jí)別自動(dòng)駕駛的解決方案。在智能駕駛領(lǐng)域，地平線同全球四大汽車(chē)市場(chǎng)（美國(guó)、德國(guó)、日本和中國(guó)）的業(yè)務(wù)聯(lián)系不斷加深，目前已賦能合作伙伴包括奧迪、博世、長(zhǎng)安、比亞迪、上汽、廣汽等國(guó)內(nèi)外的頂級(jí)Tier1s，OEMs廠商。

4. 寒武紀(jì)Cambricon-1M/MLU100

寒武紀(jì)科技創(chuàng)立于2016年3月，前身是中國(guó)科學(xué)院計(jì)算技術(shù)研究所下一個(gè)課題小組，是最早進(jìn)入AI計(jì)算領(lǐng)域的芯片公司，其主要方向是高性能服務(wù)器芯片、高性能終端芯片和服務(wù)機(jī)器人芯片，但寒武紀(jì)的重點(diǎn)在人工智能領(lǐng)域，早在2016年就發(fā)布了首款商用深度學(xué)習(xí)處理器寒武紀(jì)1A。寒武紀(jì)在2018產(chǎn)品發(fā)布會(huì)上發(fā)布了多個(gè)IP產(chǎn)品——采用7nm工藝的終端芯片Cambricon-1M、云端智能芯片MLU100等。

Cambricon-1M處理器IP屬于第三代產(chǎn)品，主打的是智能駕駛領(lǐng)域，后將應(yīng)用領(lǐng)域拓寬到了智能手機(jī)、智能音箱、攝像頭、自動(dòng)駕駛等方面。Cambricon-1M的int 8（8位運(yùn)算）效能比高達(dá)達(dá)5Tops/W每瓦5萬(wàn)億次運(yùn)算），并且提供了2Tops、4Tops、8Tops三種尺寸的處理器內(nèi)核，以滿足不同需求。1M還將支持CNN、RNN、SVM、k-NN等多種深度學(xué)習(xí)模型與機(jī)器學(xué)習(xí)算法的加速，能夠完成視覺(jué)、語(yǔ)音、自然語(yǔ)言處理等任務(wù)。通過(guò)靈活配置1M處理器，可以實(shí)現(xiàn)多線和復(fù)雜自動(dòng)駕駛?cè)蝿?wù)的資源最大化利用。它還支持終端的訓(xùn)練，以此避免敏感數(shù)據(jù)的傳輸和實(shí)現(xiàn)更快的響應(yīng)。

寒武紀(jì)首款云端智能芯片Cambricon MLU100采用寒武紀(jì)最新的MLU V01架構(gòu)和臺(tái)積電16nm工藝，可工作在平衡模式（主頻 1Ghz）和高性能模式（主頻1.3GHz）兩種不同模式下，等效理論峰值速度則分別可以達(dá)到128萬(wàn)億次定點(diǎn)運(yùn)算和166.4萬(wàn)億次定點(diǎn)運(yùn)算，而其功耗為80w和110w。MLU100云端芯片同樣具備高通用性，可支持各類(lèi)深度學(xué)習(xí)和常用機(jī)器學(xué)習(xí)算法。

5. 百度昆侖AI芯片

2018年7月4日百度在其開(kāi)發(fā)者大會(huì)上發(fā)布百度首款A(yù)I芯片——昆侖。百度介紹昆侖是中國(guó)首款云端全功能AI芯片，基于百度CPU,GPU和FPGA加速器，采用百度自研XPU神經(jīng)處理器架構(gòu)，通過(guò)長(zhǎng)達(dá)8年的研發(fā)20多次的迭代產(chǎn)生。設(shè)計(jì)性能在100W以上的功耗提供260Tops算力，內(nèi)存帶寬達(dá)到了512GB/s，核心數(shù)有數(shù)萬(wàn)個(gè)。。據(jù)說(shuō)昆侖芯片將由三星代工，采用14nm工藝。

2019年12月18日三星官方宣布，百度首款 AI 芯片昆侖已經(jīng)完成研發(fā)，由三星代工最早將于2020年初實(shí)現(xiàn)量產(chǎn)。這款百度自主研發(fā)的面向云、邊緣和人工智能的SoC目前是設(shè)計(jì)性能最高的SoC。

昆侖芯片采用了I-Cube封裝方案，通過(guò)I-Cube技術(shù)將邏輯芯片和高帶寬存儲(chǔ)器與插入器連接，再利用三星的差異化解決方案可以實(shí)現(xiàn)在最小尺寸上提供更高的密度/帶寬。

在算力方面，昆侖芯片提供512 GBps的內(nèi)存帶寬，在150W的功率下實(shí)現(xiàn)260Tops算力；它支持針對(duì)自然語(yǔ)言處理的預(yù)訓(xùn)練模型 Ernie，推理速度比傳統(tǒng) GPU/FPGA 加速模型快 3 倍。

借助昆侖，百度可以支持包括大規(guī)模人工智能計(jì)算在內(nèi)的多種功能，例如搜索排序、語(yǔ)音識(shí)別、圖像處理、自然語(yǔ)言處理、自動(dòng)駕駛和 PaddlePaddle 等深度學(xué)習(xí)平臺(tái)。

6. 芯馳科技9系列SoC

5月28日，南京芯馳半導(dǎo)體科技有限公司SemiDrive（簡(jiǎn)稱(chēng)“芯馳科技”）正式對(duì)外發(fā)布9系列X9、V9、G9三大汽車(chē)芯片產(chǎn)品，提供了針對(duì)汽車(chē)的協(xié)同一體化解決方案，覆蓋了智能座艙、智能駕駛、中央網(wǎng)關(guān)三大核心應(yīng)用。

據(jù)芯馳科技介紹，X9、V9、G9均是域控級(jí)別的大型SOC芯片，單顆芯片可以替代多個(gè)傳統(tǒng)ECU，可以支持QNX、 Linux、Android等多種車(chē)載OS，也可支持AutoSAR，滿足客戶對(duì)產(chǎn)品進(jìn)行靈活適配的需求，適應(yīng)未來(lái)智能汽車(chē)發(fā)展的需求。

其中，X9系列芯片用來(lái)支持未來(lái)智能座艙：X9中采用了Imagination的PowerVR Series9XM圖形處理器（GPU），一顆X9芯片可以同時(shí)支持多塊高清屏幕，具備語(yǔ)音交互、手勢(shì)識(shí)別，駕駛員狀態(tài)監(jiān)控等功能。

V9系列芯片定義為自動(dòng)駕駛的核心大腦，作為域控制器核心，V9內(nèi)置高性能視覺(jué)引擎，支持多達(dá)18個(gè)攝像頭輸入，不僅能滿足ADAS應(yīng)用需求，還能給未來(lái)更高級(jí)別的自動(dòng)駕駛和無(wú)人駕駛留有充足的擴(kuò)展空間。

G9系列芯片是作為未來(lái)汽車(chē)的智慧信息樞紐；為智能座艙、域控制器及其他模塊起到交互連接作用，同時(shí)，G9還可連接外部網(wǎng)絡(luò)，支持OTA在線升級(jí)。

V9系列處理器是集成了最新的高性能引擎，包括64-bitArm® Cortex®-A55內(nèi)核，V8.2架構(gòu)CPU；高性能PowerVR GPU；CV專(zhuān)用視覺(jué)處理引擎等，能夠滿足新一代智能駕駛輔助系統(tǒng)應(yīng)用對(duì)強(qiáng)大的計(jì)算能力日益增長(zhǎng)的需求。此外，V9系列處理器集成了千兆以太網(wǎng)，CAN-FD，能夠以較低的成本與車(chē)載系統(tǒng)進(jìn)行無(wú)縫銜接。該款處理器還支持MIPI-CSI和并口CSI，能夠支持?jǐn)z像頭輸入，包括360°環(huán)視影像系統(tǒng)、前視攝像、后視攝像和車(chē)內(nèi)攝像系統(tǒng)。

位于英國(guó)的Imagination為芯馳科技提供GPU支持，針對(duì)芯馳科技的自動(dòng)駕駛芯片，Imagination的最新一代神經(jīng)網(wǎng)絡(luò)加速器（NNA）PowerVR Series3NX可以提供最高達(dá)160TOPS的算力；針對(duì)其高端座艙芯片，Imagination最新發(fā)布的IMG A系列（IMG A-Series）GPU可以提供更高的性能、更快的處理速度和更低的功耗。

另外，芯馳科技號(hào)稱(chēng)是中國(guó)中國(guó)第一家獲得TÜV萊茵頒發(fā)的ISO 26262:2018版功能安全管理體系證書(shū)的企業(yè)。

7. 黑芝麻華山二號(hào)

2020年6月15日晚，黑芝麻科技發(fā)布了自研的車(chē)規(guī)級(jí)芯片重磅產(chǎn)品，華山二號(hào)A1000和華山二號(hào)A1000L，這是黑芝麻繼華山一號(hào)之后的第二代產(chǎn)品。兩顆芯片都采用臺(tái)積電16nm工藝，支持車(chē)規(guī)級(jí)AEC-Q100標(biāo)準(zhǔn)和支持多項(xiàng)傳感器。

華山二號(hào)A1000對(duì)標(biāo)特斯拉，具有8個(gè)CPU核，單顆可提供40 TOPS的算力，功耗8-10W。據(jù)黑芝麻智能科技消息，A1000是全球頂尖的包含功能安全的高性能車(chē)規(guī)級(jí)SOC芯片，也是中國(guó)目前第一顆能夠量產(chǎn)的，滿足自動(dòng)駕駛L3/L4級(jí)別要求車(chē)規(guī)級(jí)芯片。華山二號(hào)A1000在L3級(jí)別上對(duì)標(biāo)Tesla，其功耗僅有Tesla FSD的四分之一，面積只有三分之一，成本也只有四分之一，是一款高性?xún)r(jià)比落地產(chǎn)品。到2021年底，搭載黑芝麻華山二號(hào)芯片的車(chē)型或?qū)⒄搅慨a(chǎn)。

對(duì)比而言，特斯拉FSD算力144TOPS，功耗72W，能效比2TOPS/W；英偉達(dá)Xavier算力30TOPS，功耗30W，能耗比1TOPS/W。而華山二號(hào)A1000單芯片能效比超過(guò)6TOPS/W ,雙芯片疊加組成的域控制器能效比也超過(guò)5TOPS/W。

根據(jù)黑芝麻給出的計(jì)算平臺(tái)方案，單顆A1000L芯片適用于低等級(jí)級(jí)ADAS輔助駕駛；單顆A1000芯片適用于L2+自動(dòng)駕駛；雙A1000芯片互聯(lián)組成的域控制器可支持L3級(jí)別自動(dòng)駕駛；四顆A1000芯片疊加可用于未來(lái)L4級(jí)別自動(dòng)駕駛。

8. 西井科技westwell類(lèi)腦芯片

西井科技創(chuàng)辦于2015年，它起初是一家做類(lèi)腦芯片的廠商。所謂的類(lèi)腦芯片簡(jiǎn)單來(lái)說(shuō)就是以人腦的工作方式設(shè)計(jì)制造出來(lái)的芯片。

類(lèi)腦芯片模仿的是大腦神經(jīng)元的工作形式，馮•諾依曼結(jié)構(gòu)處理器芯片不同，與大腦的處理單元是神經(jīng)元，內(nèi)存就是突觸。神經(jīng)元和突觸是物理相連的，所以每個(gè)神經(jīng)元計(jì)算都是本地的，而從全局來(lái)看神經(jīng)元們是分布式在工作。類(lèi)腦芯片由于具有本地計(jì)算和分布式工作的特點(diǎn)，所以在工作效率和能耗上相比馮•諾依曼結(jié)構(gòu)處理器芯片更有優(yōu)勢(shì)。

西井科技早期開(kāi)發(fā)了“DeepSouth”類(lèi)腦芯片，是全球首塊可商用5000萬(wàn)類(lèi)腦“神經(jīng)元”芯片，可以模擬5000萬(wàn)個(gè)神經(jīng)元，而同期的IBM的“TrueNorth”只能模擬100萬(wàn)個(gè)。

基于類(lèi)腦芯片技術(shù)，西井科技開(kāi)發(fā)出了“DeepWell”和“VestWell”兩款人工智能芯片，DeepWell峰值算力1.8Tops，單核功耗500mW，雙核功耗1W；VestWell芯片峰值算力4Tops，功耗小于2W。

相比NVIDIA Xavier、地平線征程2 等幾十TOPS算力的產(chǎn)品，西井科技的這兩款芯片確實(shí)有點(diǎn)寒磣。但這兩款芯片能夠?qū)崿F(xiàn)片上學(xué)習(xí)，可以隨時(shí)新增樣本進(jìn)行增量訓(xùn)練來(lái)提升推理準(zhǔn)確率。

目前的自動(dòng)駕駛算法都是通過(guò)高性能服務(wù)器進(jìn)行模型訓(xùn)練，然后將訓(xùn)練好的模型再部署到車(chē)載硬件之中。西井科技的芯片的優(yōu)勢(shì)在于可以自行進(jìn)化，具體說(shuō)來(lái)，西井科技人工智能芯片的片上學(xué)習(xí)特性實(shí)現(xiàn)了模型訓(xùn)練過(guò)程的本地化，即機(jī)器學(xué)習(xí)在終端芯片上就能直接完成，通過(guò)芯片端的不斷學(xué)習(xí)和完善，不斷提升計(jì)算判斷準(zhǔn)確率，可以實(shí)現(xiàn)自我進(jìn)化。相比于其他芯片OTA升級(jí)，西井科技的芯片屬于另辟捷徑。

9.深鑒科技DPU

深鑒科技由清華團(tuán)隊(duì)創(chuàng)辦，成立于2016年，其產(chǎn)品稱(chēng)作“深度學(xué)習(xí)處理單元”（DeepProcessing Unit，DPU），目標(biāo)是以ASIC級(jí)別的功耗，來(lái)達(dá)到優(yōu)于GPU的性能，目前第一批產(chǎn)品基于FPGA平臺(tái)。2018年7月17日，深鑒科技被全球最大的 FPGA 廠商賽靈思宣布收購(gòu)。

深鑒科技著力于打造基于DPU的端到端的深度學(xué)習(xí)硬件解決方案，除了承載在硬件模塊（定制的PCB板）上的DPU的芯片架構(gòu)外，還打造了針對(duì)該架構(gòu)的DPU壓縮編譯工具鏈SDK。

自 2016 年成立以來(lái)，深鑒科技一直基于賽靈思的技術(shù)平臺(tái)開(kāi)發(fā)機(jī)器學(xué)習(xí)解決方案，推出的兩個(gè)用于深度學(xué)習(xí)處理器的底層架構(gòu)——亞里士多德架構(gòu)和笛卡爾架構(gòu)的 DPU 產(chǎn)品，都是基于賽靈思 FPGA 器件。

亞里士多德架構(gòu)

笛卡爾架構(gòu)

基于上述兩個(gè)硬件架構(gòu)，深鑒科技也發(fā)布了數(shù)款 DPU 硬件產(chǎn)品產(chǎn)品。在人臉識(shí)別方面，深鑒科技分別推出了 DP-1200-F01 人臉檢測(cè)識(shí)別模組和DP-2100-F16人臉?lè)治鼋鉀Q方案。隨后，深鑒科技又推出了視頻結(jié)構(gòu)化解決方案 DP-2100-O16，它可以做到 16 路 1080p 高清視頻的實(shí)時(shí)視頻結(jié)構(gòu)化，可以做到人、車(chē)、非機(jī)動(dòng)車(chē)的檢測(cè)、跟蹤和屬性分析。

在硬件的基礎(chǔ)之上，深鑒科技又開(kāi)發(fā)出面向上述 DPU 的深度神經(jīng)網(wǎng)絡(luò)開(kāi)發(fā)套件 DNNDK（Deep Neural Network Development Kit），而 DNNDK 也是國(guó)內(nèi)第一款專(zhuān)門(mén)為深度學(xué)習(xí)而開(kāi)發(fā)的 SDK。

10.XILINX SoC MP SoC

Xilinx賽靈思是FPGA的先行者和領(lǐng)導(dǎo)者，并創(chuàng)造了多項(xiàng)行業(yè)第一，比如全球首款FPGA、首款硬件/軟件可編程的SoC、首款多處理器SoC（MPSoC，在FPGA上整合了ARM的CPU內(nèi)核，還有Mali系列的GPU等）、首款RFSoC（將通信級(jí)RF采樣數(shù)據(jù)轉(zhuǎn)換器、SD-FEC內(nèi)核、ARM處理器以及FPGA 架構(gòu)整合到單芯片器件中）。

2018年7月，賽靈思收購(gòu)深鑒科技被認(rèn)為是為了進(jìn)一步加強(qiáng)在ADAS/自動(dòng)駕駛汽車(chē)市場(chǎng)的布局。

在汽車(chē) ADAS 和自動(dòng)駕駛解決方案上，賽靈思有針對(duì)自動(dòng)駕駛中央控制器的Zynq UltraScale+ MPSoC、針對(duì)車(chē)載前置攝像頭的Zynq-7000 /Zynq UltraScale+ MPSoC 和針對(duì)多傳感器融合系統(tǒng)的 Zynq UltraScale+ MPSoC。

賽靈思2019年11月宣布推出兩款16nm汽車(chē)級(jí)芯片 Zynq UltraScale+MPSoC 7EV 和 11EG。支持L2至L4級(jí)自動(dòng)駕駛系統(tǒng)。MPSoC采用了64位四核ARMCortex A53和雙核ARM Cortex-R5高性能處理器，并集成了賽靈思的UltraScale架構(gòu)。到目前為止，XA系列MPSoC已經(jīng)被包括戴姆勒奔馳在內(nèi)的29個(gè)汽車(chē)品牌以及Aptiv、Autoliv、博世和大陸集團(tuán)等頂級(jí)零部件供應(yīng)商廣泛使用。

11.特斯拉FSD芯片

特斯拉屬于汽車(chē)行業(yè)內(nèi)Bug一樣的存在，汽車(chē)、火箭、芯片等等，什么都都可以搞，而且做的還不差，特斯拉早期也是和芯片供應(yīng)商合作，專(zhuān)心做整車(chē)，但是陸續(xù)發(fā)現(xiàn)芯片供應(yīng)商不給力之后，便“拋棄”了Mobileye和NVIDIA，開(kāi)始自研AI芯片，特斯拉在2019年4月發(fā)布了首款自動(dòng)駕駛芯片F(xiàn)SD（Full Self Driving全自動(dòng)駕駛），并且是直接以量產(chǎn)的形式發(fā)布，F(xiàn)SD被馬斯克稱(chēng)為“世界上最好的芯片”，這款芯片除了常規(guī)的CPU和GPU之外，還配備了兩個(gè)神經(jīng)網(wǎng)絡(luò)處理器（NNP），算力為144TOPS，功耗72W，能效比2TOPS/W，就目前來(lái)說(shuō)，確實(shí)是量產(chǎn)車(chē)最好的自動(dòng)駕駛芯片。

FSD 芯片采用了 14 nm FinFET CMOS 工藝制造，尺寸為 260 mm，具有 60 億個(gè)晶體管和2.5 億個(gè)邏輯門(mén)，F(xiàn)SD有兩個(gè)神經(jīng)網(wǎng)絡(luò)加速器NNP，支持 32 位和 64 位浮點(diǎn)運(yùn)算的圖形芯片，以及時(shí)鐘頻率為 2.2 GHz 的十幾款 Arm A72 64 位 CPU，性能是上一代的 2.5 倍。

此外，F(xiàn)SD 還有一個(gè)安全芯片可確保系統(tǒng)僅運(yùn)行由 Tesla 加密的代碼以及專(zhuān)用的 H.265 視頻編碼器。

與上一代硬件相比，F(xiàn)SD的功耗降低了約1.25 倍，整體成本降低了 80％。馬斯克表示，F(xiàn)SD 每英里的功耗約為 250 W。

FSD芯片中自研的最重要的部分是Neural Network Processor，每顆芯片有兩個(gè)NNP，每個(gè)NNP有一個(gè)96x96個(gè)MAC的矩陣，32MB SRAM，工作頻率2GHz。所以一個(gè)NNP的處理能力是96x96x2(OPs)x2(GHz)= 36.864TOPS，單芯片算力72TOPS，F(xiàn)SD硬件板子算力144TOPS。

12.NVIDIA Xavier & Orin & A100

NVIDIA GTC 2020因?yàn)橐咔樵蛟邳S教主的廚房進(jìn)行，此次發(fā)布了NVIDIA第八代架構(gòu)Ampere（安培）、以及基于安培架構(gòu)的第一款GPU A100。A100絕對(duì)是目前全球最大的7nm芯片，540億個(gè)晶體管，3D 堆疊技術(shù)，加上高達(dá) 826 平方毫米的芯片面積，同時(shí)支持 TF32 和 BF16 格式，擁有438 個(gè)第三代 Te那個(gè)nsor Core，支持虛擬成為 77 個(gè) GPU 來(lái)執(zhí)行不同的任務(wù)。算力達(dá)到2000TOPS，相比Volta架構(gòu)提升了高達(dá)20倍的性能，可以同時(shí)滿足AI訓(xùn)練和推理的需求。

2019年12月，NVIDIA推出了面向ADAS和自動(dòng)駕駛領(lǐng)域的新一代SOC Orin，Orin SOC擁有170億個(gè)晶體管，搭載NVDIA下一代GPU（即基于Ampere架構(gòu)的GPU）和Arm Hercules CPU核心，可以提供200TOPS是運(yùn)算能力，是上一代Xavier SOC的7倍，功耗45W，2022年交付，面向L2+級(jí)自動(dòng)駕駛場(chǎng)景。

NVIDIA在2018年CES上推出了Xavier平臺(tái)，號(hào)稱(chēng)是是“世界上最強(qiáng)大的SoC（片上系統(tǒng)）”，目前Xavier也確實(shí)是自動(dòng)駕駛AI芯片領(lǐng)域絕對(duì)的首選，Xavier可處理來(lái)自車(chē)輛雷達(dá)、攝像頭、激光雷達(dá)和超聲波系統(tǒng)的L5級(jí)自主駕駛數(shù)據(jù)，是目前自動(dòng)駕駛領(lǐng)域應(yīng)用最多的AI芯片，也是最早投入量產(chǎn)的AI芯片。

Xavier SoC基于臺(tái)積電12nm工藝，集成90億顆晶體管，芯片面積350平方毫米，CPU采用NVIDIA自研8核ARM64架構(gòu)（代號(hào)Carmel），GPU采用512顆CUDA的Volta，支持FP32/FP16/INT8，20W功耗下單精度浮點(diǎn)性能1.3TFLOPS，Tensor核心性能20TOPs，解鎖到30W后可達(dá)30TOPs。

Xavier 內(nèi)有六種不同的處理器：Valta TensorCoreGPU，八核ARM64 CPU，雙NVDLA 深度學(xué)習(xí)加速器，圖像處理器，視覺(jué)處理器和視頻處理器。這些處理器使其能夠同時(shí)、且實(shí)時(shí)地處理數(shù)十種算法，以用于傳感器處理、測(cè)距、定位和繪圖、視覺(jué)和感知以及路徑規(guī)劃。

TÜVSÜD已確認(rèn)NVIDIA Xavier 系統(tǒng)芯片符合ASIL C 等級(jí)的ISO 26262隨機(jī)硬件完整性，并達(dá)到了ASIL D等級(jí)的系統(tǒng)處理能力要求（最嚴(yán)格的功能安全標(biāo)準(zhǔn)）。

13.Mobileye EyeQ系列

在自動(dòng)駕駛芯片領(lǐng)域，Mobileye的EyeQ系列則是典型ASIC芯片的代表，隨著自動(dòng)駕駛芯片領(lǐng)域的競(jìng)爭(zhēng)越來(lái)越激烈以及主機(jī)廠對(duì)于AI芯片的受控性要求越來(lái)越高，Mobileye 逐漸從過(guò)去的一體式視覺(jué)芯片+算法供應(yīng)商的“黑匣子”模式轉(zhuǎn)變?yōu)殚_(kāi)放EyeQ5芯片（即允許第三方代碼運(yùn)行）。

Mobileye是Intel在自動(dòng)駕駛領(lǐng)域布局的重要一環(huán)，從處理器芯片來(lái)看，Intel的布局已經(jīng)完善，包括Mobileye的ADAS視覺(jué)處理， Altera的FPGA處理，以及英特爾自身的至強(qiáng)Xeon等型號(hào)的處理器，可以形成自動(dòng)駕駛整個(gè)硬件部分的系統(tǒng)性解決方案。

Mobileye自主研發(fā)設(shè)計(jì)的EyeQ系列芯片，由ST公司生產(chǎn)供應(yīng)。量產(chǎn)型號(hào)有EyeQ1至EyeQ4，占據(jù)了全球范圍內(nèi)ADAS市場(chǎng)的60%左右份額。目前性能最高的EyeQ4的算力為2.5 TOPS，功耗為3W,能效0.83 TOPS/W。EyeQ5正在開(kāi)發(fā)進(jìn)行中，按照Mobileye的計(jì)劃在2020年面世，目的是對(duì)標(biāo)NVIDIA Xavier。EyeQ5采用7nm FinFET工藝制造。設(shè)計(jì)計(jì)算性能達(dá)到了24TOPS，功耗為10W，芯片能效是Xavier的2.4倍。EyeQ5芯片將裝備8枚多線程CPU內(nèi)核，同時(shí)還會(huì)搭載18枚Mobileye的下一代視覺(jué)處理器。據(jù)Mobileye消息，EyeQ5 SOC裝備有四種異構(gòu)的全編程加速器，分別對(duì)專(zhuān)有的算法進(jìn)行了優(yōu)化，包括有：計(jì)算機(jī)視覺(jué)、信號(hào)處理和機(jī)器學(xué)習(xí)等。Eyeq5 SOC同時(shí)實(shí)現(xiàn)了兩個(gè)PCI-E端口以支持多處理器間通信。這種架構(gòu)嘗試為每一個(gè)計(jì)算任務(wù)適配最合適的計(jì)算單元，硬件資源的多樣性使應(yīng)用程序能夠節(jié)省計(jì)算時(shí)間并提高計(jì)算效能。

按照Mobileye的計(jì)劃，到2020年中會(huì)向合作伙伴提供一套完整的自動(dòng)駕駛汽車(chē)子系統(tǒng)，包括計(jì)算機(jī)視覺(jué)套件：360度/12個(gè)攝像頭/測(cè)距300碼的視覺(jué)系統(tǒng)和多芯片交鑰匙解決方案等。

另外提一句，英特爾計(jì)劃將EyeQ5與Atom處理器結(jié)合起來(lái)，開(kāi)發(fā)用于自動(dòng)駕駛的人工智能計(jì)算平臺(tái)。兩個(gè)EyeQ5 soc和一個(gè)英特爾Atom（凌動(dòng)）處理器就足以實(shí)現(xiàn)5級(jí)自動(dòng)駕駛。

14.安霸Ambarella CV2 SOC

安霸是一家高清影像芯片研發(fā)商，主要提供低功耗、高清視頻壓縮與圖像處理的解決方案。致力于提供超低碼率與極小功耗下的高畫(huà)質(zhì)影像技術(shù)。

Ambarella在2018年推出了名為CV2的車(chē)規(guī)級(jí)SoC，專(zhuān)用于提供深度神經(jīng)網(wǎng)絡(luò)(DNN)和立體視覺(jué)處理，瞄準(zhǔn)ADAS和自動(dòng)駕駛車(chē)市場(chǎng)。目標(biāo)是對(duì)標(biāo)Mobileye。結(jié)合VisLab的經(jīng)驗(yàn)和技術(shù)，Ambarella在CV2芯片中整合了先進(jìn)的計(jì)算機(jī)視覺(jué)、圖像處理、4Kp60視頻編碼與立體視覺(jué)技術(shù)。CV2可提供較CV1更高20倍的深度神經(jīng)網(wǎng)絡(luò)性能。

Ambarella自稱(chēng)擁有兩項(xiàng)競(jìng)爭(zhēng)優(yōu)勢(shì)，一是Ambarella于2015年收購(gòu)的歐洲計(jì)算機(jī)視覺(jué)與智能汽車(chē)控制系統(tǒng)開(kāi)發(fā)商VisLab開(kāi)發(fā)的新型計(jì)算機(jī)視覺(jué)架構(gòu)。二是Ambarella自研的低功耗、高解析(HD)與超高解析(Ultra HD)視覺(jué)處理芯片。

CV2的模塊示意圖

CV2設(shè)計(jì)在芯片中支持4個(gè)立體相機(jī)和4個(gè)單眼相機(jī)，將由三星(Samsung)以10nm工藝制造。而CV1采用14nmCMOS工藝制造。

安霸的芯片是基于CVflow架構(gòu)的，這是一個(gè)為像立體處理、深度神經(jīng)網(wǎng)絡(luò)這樣的計(jì)算機(jī)視覺(jué)算法而優(yōu)化的。和DSP（數(shù)字信號(hào)處理器）或GPU相比，CVflow的設(shè)計(jì)能夠讓每核，或者說(shuō)每個(gè)處理單元的性能提高不止一個(gè)層次。

2019年1月，安霸推出了CVFLOW系列最新的芯片上CV25攝像系統(tǒng)（SoC）。

在CES 2020上，Ambarella 演示了使用 CV2、VC22 的各種解決方案，CV2FS和 CV22FS，本質(zhì)上是基于 CV2 和 CV22 功能的全新設(shè)計(jì)。

CV22FS和CV2FS的CVflow架構(gòu)以每秒80幀的速度，提供8兆像素或更高分辨率的計(jì)算機(jī)視覺(jué)處理功能，用于遠(yuǎn)距離、高精度目標(biāo)識(shí)別。每個(gè)系統(tǒng)芯片都包括一臺(tái)用于同時(shí)定位與地圖構(gòu)建（SLAM）以及估計(jì)距離和深度的稠密光流法加速器。多通道高速傳感器輸入與安霸的圖像信號(hào)處理（ISP）通道為攝像頭輸入提供了必要的支持。安霸計(jì)劃于2020年上半年向客戶提供CV22FS和CV2FS樣品。

15.Intel/Altera基于FPGA的 SoC

英特爾2015年收購(gòu)Altera。目前Altera的自動(dòng)駕駛 FPGA 芯片已經(jīng)量產(chǎn)。Altera 的 FPGA產(chǎn)品共有四大系列，分別是頂配的 Stratix 系列（近萬(wàn)美元）、成本與性能平衡的 Arria 系列（2000~5000 美元）、廉價(jià)的 Cyclone 系列（10~20 美元）、以及 MAX 系列CPLD。

Waymo就是采用英特爾CPU+Altera FPGA的方案來(lái)解決自動(dòng)駕駛所需要的數(shù)據(jù)融合和算法處理。奧迪全新A8車(chē)型上搭載的zFAS域控制器就使用了Altera提供的FPGA芯片-Cyclonev Soc。

16.Google TPU

TPU，Tensor Processing Unit，全名為張量處理單元。是 Google 專(zhuān)為機(jī)器學(xué)習(xí)而定制的一款A(yù)SIC芯片。專(zhuān)門(mén)針對(duì)加速和擴(kuò)大使用 TensorFlow 編程的機(jī)器學(xué)習(xí)工作負(fù)載進(jìn)行了優(yōu)化。Google 在 2016 年 5 月的開(kāi)發(fā)者 I/O 大會(huì)上正式發(fā)布TPU1，并在2017年推出了 TPU2，又稱(chēng)Cloud TPU。TPU2 既可以用于 training，又可以用于 inference。每個(gè) Cloud TPU 由四個(gè)定制的 ASIC 構(gòu)成，單個(gè) Cloud TPU 的浮點(diǎn)計(jì)算能力可以達(dá)到 180 teraflops（萬(wàn)億次每秒），內(nèi)存寬帶 64GB。

2018年TPU 3.0面世，性能相比TPU 2.0有8倍提升。并且2018年7月谷歌又發(fā)布了Edge TPU芯片搶攻邊緣計(jì)算市場(chǎng)。

在2019年5月的谷歌I/O開(kāi)發(fā)者大會(huì)上，Google以1000個(gè)TPUv3組成的TPUv3 Pod取代了本應(yīng)出現(xiàn)在發(fā)布會(huì)上的第四代TPU，目前關(guān)于TPU的新的規(guī)劃尚不得而知。

TPU經(jīng)過(guò)了專(zhuān)門(mén)深度機(jī)器學(xué)習(xí)方面的訓(xùn)練，能加速其第二代人工智能系統(tǒng)TensorFlow的運(yùn)行，而且效率也大大超過(guò)GPU，Google的深層神經(jīng)網(wǎng)絡(luò)就是由TensorFlow引擎驅(qū)動(dòng)的。TPU執(zhí)行每個(gè)操作所需的晶體管數(shù)量更少，自然效率更高。

TPU與同期的CPU和GPU相比，可以提供15-30倍的性能提升，以及30-80倍的效率（性能/瓦特）提升。

17.NXP恩智浦的S32V系列SoC

恩智浦基于自研第二代視覺(jué)專(zhuān)用處理芯片S32V234設(shè)計(jì)開(kāi)發(fā)了一款自動(dòng)駕駛開(kāi)發(fā)平臺(tái)BlueBox，集成了S32V234汽車(chē)視覺(jué)和傳感器融合處理器、LS2084A 嵌入式計(jì)算處理器、 S32R27 雷達(dá)微控制器。

S32V234 視覺(jué)處理器，擁有 CPU(4 顆 ARM CortexA53 和 1 顆M4)、3D GPU(Vivante GC3000)和視覺(jué)加速單元(2 顆 APEX-2vision accelerator)，支持4 路攝像頭?？捎糜谇耙晹z像頭、后視攝像頭、環(huán)視系統(tǒng)、傳感器融合系統(tǒng)等，能實(shí)時(shí) 3D建模，計(jì)算能力為 50GFLOPs。同時(shí)， S32V234 芯片預(yù)留了支持毫米波雷達(dá)、激光雷達(dá)、超聲波的接口，可實(shí)現(xiàn)多傳感器數(shù)據(jù)融合，最高可支持 ISO26262 ASIL-C 標(biāo)準(zhǔn)。

LS2088A內(nèi)嵌式處理器負(fù)責(zé)行高性能運(yùn)算，由8個(gè)64位ARM Cortex-A72內(nèi)核組成，配合頻率2GHz的特制加速器、高性能通信接口和DDR4內(nèi)存控制器，延時(shí)極低。

由于NXP S32234芯片本身設(shè)計(jì)架構(gòu)問(wèn)題造成算力不足，以及生態(tài)工具鏈欠缺較多，目前該芯片已經(jīng)被邊緣化。

最近有消息稱(chēng)，NXP開(kāi)始與臺(tái)積電合作，借助臺(tái)積電5nm技術(shù)的增強(qiáng)版N5P的打造新一代汽車(chē)級(jí)芯片，預(yù)計(jì)2021年推出，NXP的這一舉措使汽車(chē)處理平臺(tái)一舉跨越到5nm，對(duì)整個(gè)行業(yè)來(lái)說(shuō)都是一個(gè)質(zhì)的飛躍。對(duì)NXP來(lái)說(shuō)，這將是一次重新站到汽車(chē)芯片行業(yè)“制高點(diǎn)”的絕佳機(jī)會(huì)。

18.TI德州儀器TDAx系列SoC

TI的自動(dòng)駕駛芯片方案基于DSP，主要面向ADAS市場(chǎng)。主要產(chǎn)品是TDAx 系列，包括TDA2x、TDA3x、TDA2Eco，以及今年發(fā)布的TDA4VM等，基于異構(gòu)硬件和通用軟件架構(gòu)。TDA2x于2013年10月發(fā)布，主要面向中到中高級(jí)市場(chǎng)，配置了2顆ARM Cortex-A15內(nèi)核與4顆 Cortex-M4內(nèi)核、2顆TI定浮點(diǎn)C66xDSP 內(nèi)核、4顆EVE視覺(jué)加速器核心，以及Imagination SGX544 GPU，主要應(yīng)用于前置攝像頭信息處理，包括車(chē)道報(bào)警、防撞檢測(cè)、自適應(yīng)巡航以及自動(dòng)泊車(chē)系統(tǒng)等。

TDA3x于2014年10月發(fā)布，主要面向中到中低級(jí)市場(chǎng)，其縮減了包括雙核A15及SGX544 GPU，主要應(yīng)用在后置攝像頭、2D或2.5D環(huán)視等。

在CES 2020上，TI發(fā)布了基于Jacinto™7架構(gòu)的TDA4VM處理器系列，將TI行業(yè)領(lǐng)先的DSP和EVE內(nèi)核整合到單個(gè)高性能內(nèi)核中，并增加了浮點(diǎn)矢量計(jì)算功能，該款SoC包含通用處理CPU、C7 DSP MMA深度學(xué)習(xí)加速器、VPAC DMPAC視覺(jué)加速器、ISP和以太網(wǎng)交換機(jī)以及PCIe交換機(jī)等。在功耗方面，TDA4VM處理器僅用5到20W的功率和性能效率即可執(zhí)行高性能ADAS計(jì)算，無(wú)需主動(dòng)冷卻。

19.瑞薩 R-Car V3H

“R-Car”是瑞薩電子株式會(huì)社專(zhuān)為自動(dòng)駕駛汽車(chē)計(jì)算而設(shè)計(jì)的系統(tǒng)級(jí)芯片（SoC）系列，主要用于汽車(chē)信息系統(tǒng)。Renesas瑞薩電子在2018年推出新款R-Car V3H SoC。R-Car V3H以較低的功耗為汽車(chē)前視視覺(jué)系統(tǒng)提供強(qiáng)大的計(jì)算性能和人工智能處理能力，適用于L3、L4級(jí)自動(dòng)駕駛。R-Car V3H主要針對(duì)立體前視攝像頭應(yīng)用進(jìn)行了優(yōu)化，其計(jì)算機(jī)視覺(jué)性能是2017年4月推出的面向NCAP前視攝像頭的R-CarV3M SoC的5倍。

R-Car V3H SoC專(zhuān)注于對(duì)計(jì)算機(jī)視覺(jué)處理進(jìn)行架構(gòu)優(yōu)化，支持從有條件自動(dòng)駕駛到高度自動(dòng)駕駛的所有ADAS相關(guān)功能。R-Car V3H運(yùn)用瑞薩基于IMP-X5+圖像識(shí)別引擎和專(zhuān)用硬件加速器的異構(gòu)計(jì)算機(jī)視覺(jué)內(nèi)核概念，用包括稠密光流注3、稠密立體視差注4和對(duì)象分類(lèi)注5在內(nèi)的算法實(shí)現(xiàn)了先進(jìn)的感知功能。集成的CNN注6IP以?xún)H0.3W的業(yè)界領(lǐng)先低功耗加快了深度學(xué)習(xí)，實(shí)現(xiàn)了2倍于R-Car V3M的深度神經(jīng)網(wǎng)絡(luò)性能。

20.Arm 自動(dòng)駕駛芯片Cortex-A76AE

作為一個(gè)移動(dòng)芯片基礎(chǔ)技術(shù)公司，本身并不制造芯片，而是通過(guò)研究微控制器芯片的核心技術(shù)，然后授權(quán)給各大芯片廠商。

自1996年，Arm生產(chǎn)的通用型、實(shí)時(shí)型處理器就開(kāi)始被各大車(chē)輛制造商使用。現(xiàn)在Arm的半導(dǎo)體知識(shí)產(chǎn)權(quán)（IP）已廣泛應(yīng)用于ADAS系統(tǒng)（如防撞、巡航控制等）、連接、信息娛樂(lè)、動(dòng)力總成控制和汽車(chē)其他組件。

2018年9月，Arm推出了“安全就緒”（Safety Ready）計(jì)劃，旨在為自動(dòng)駕駛汽車(chē)提供解決方案。并推出了代號(hào)為Cortex-A76AE的產(chǎn)品，作為第一款專(zhuān)為自動(dòng)駕駛汽車(chē)打造的處理器。

Cortex-A76AE處理器允許芯片制造商設(shè)計(jì)具有安全功能的芯片，使自動(dòng)駕駛汽車(chē)能夠滿足最嚴(yán)格的安全要求，能將自動(dòng)躲避等特性應(yīng)用到汽車(chē)上。AE，即“Automotive Enhanced(自動(dòng)駕駛增強(qiáng))”。該處理器采用臺(tái)積電7nm工藝技術(shù)制造的16核Cortex-A76AE SoC具有超過(guò)250 KDMIPS的計(jì)算性能，功耗30W，足以滿足當(dāng)今應(yīng)用需求。如果用戶想要更高的性能，可以構(gòu)建更多內(nèi)核，甚至多個(gè)SoC。該內(nèi)核具備Arm v8.2微體系結(jié)構(gòu)的所有功能特性，包括可靠性、可用性和可維護(hù)性，并采用了分核-鎖步（Split-Lock）模式來(lái)確保可靠性。

并且，基于Cortex-A76AE的SoC可擴(kuò)展至最多64核。除了含有通用計(jì)算核外，Arm的自主計(jì)算復(fù)合體還集成了Mali-G76 GPU、ARM的ML處理器和其他必要的IP。此外，所有復(fù)合體支持Arm的內(nèi)存虛擬化和保護(hù)技術(shù)，可以完美實(shí)現(xiàn)ML和NN加速器的運(yùn)行。

Arm 在Cortex-A76AE之后又推出新款適應(yīng)自動(dòng)駕駛的處理器產(chǎn)品Cortex-A65AE。按照Arm公司計(jì)劃，第一批使用Cortex-A76AE處理器的汽車(chē)將于2020年上路，Cortex-A65AE也將于2020年上市。

21.高通Snapdragon Ride

Qualcomm高通公司此前在 2017 年披露了其研發(fā)自動(dòng)駕駛汽車(chē)芯片的計(jì)劃，2018 年，因?yàn)楸O(jiān)管原因，高通公司收購(gòu)荷蘭恩智浦公司遭到失敗。2020年1月5日，在美國(guó)拉斯維加斯舉行的消費(fèi)電子展(CES)上高通發(fā)布了全新的自動(dòng)駕駛平臺(tái)Snapdragon Ride，旨在處理從車(chē)道控制、自動(dòng)泊車(chē)等自動(dòng)駕駛所需的各項(xiàng)任務(wù)，高通預(yù)計(jì)其可在2023年上路。

Snapdragon Ride平臺(tái)包含多個(gè)SOC（系統(tǒng)級(jí)芯片）選項(xiàng)，包括深度學(xué)習(xí)加速器和自動(dòng)駕駛軟件Stack，能夠支持高級(jí)駕駛輔助系統(tǒng)ADAS功能，比如車(chē)道保持以及在自動(dòng)駕駛出租車(chē)（Robotaxi）上的全自動(dòng)駕駛的應(yīng)用等功能。

根據(jù)高通介紹，Snapdragon Ride平臺(tái)基于一系列不同的驍龍SoC和加速器建立，采用了可擴(kuò)展且模塊化的高性能異構(gòu)多核CPU、高能效的AI與計(jì)算機(jī)視覺(jué)引擎，以及業(yè)界領(lǐng)先的GPU?；诓煌腟oC和加速器的組合，平臺(tái)能夠根據(jù)自動(dòng)駕駛的每個(gè)細(xì)分市場(chǎng)的需求進(jìn)行匹配，并提供業(yè)界領(lǐng)先的散熱效率，包括從面向L1/L2級(jí)別應(yīng)用的30 TOPS等級(jí)的設(shè)備，到面向L4/L5級(jí)別駕駛、超過(guò)700 TOPS的功耗130瓦的設(shè)備。因此該平臺(tái)可支持被動(dòng)或風(fēng)冷的散熱設(shè)計(jì)，從而實(shí)現(xiàn)成本降低、可靠性提升，省去昂貴的液冷系統(tǒng)，并簡(jiǎn)化汽車(chē)設(shè)計(jì)以及延長(zhǎng)電動(dòng)汽車(chē)的行駛里程。Snapdragon Ride的一系列SoC和加速器專(zhuān)為功能安全ASIL-D級(jí)（汽車(chē)安全完整性等級(jí)D級(jí)）系統(tǒng)而設(shè)計(jì)。

Snapdragon Ride將于2020年上半年交付汽車(chē)制造商和一級(jí)供應(yīng)商進(jìn)行前期開(kāi)發(fā)。Qualcomm Technologies預(yù)計(jì)搭載Snapdragon Ride的汽車(chē)將于2023年投入生產(chǎn)。

中國(guó)公司在AI芯片領(lǐng)域的探索在近幾年呈現(xiàn)爆發(fā)趨勢(shì)，頭部企業(yè)有華為、地平線、寒武紀(jì)、西井科技、百度等，另有其他國(guó)產(chǎn)公司在人工智能、語(yǔ)音識(shí)別、視覺(jué)處理方面發(fā)力，如芯馳科技、黑芝麻、中星微電子、比特大陸、杭州中天微等等。總體來(lái)看，中國(guó)公司在AI芯片領(lǐng)域已經(jīng)占據(jù)不少席位，中國(guó)自動(dòng)駕駛芯片在性能和功耗上和外國(guó)芯片相比并不差，但是如果想要達(dá)到世界領(lǐng)先水平，甚至趕超NVIDIA、Tesla、TI、Xilinx等還有很長(zhǎng)的路要走。而從研發(fā)設(shè)計(jì)到真正上車(chē)量產(chǎn)，更需要深度的測(cè)試驗(yàn)證和積累。

首先，國(guó)產(chǎn)芯片企業(yè)想要有所建樹(shù)，必須要有長(zhǎng)期研發(fā)投入的思想準(zhǔn)備，也就是燒錢(qián)和時(shí)間，在沒(méi)有積累的基礎(chǔ)上做AI芯片研發(fā)，所要攻克的難關(guān)數(shù)不勝數(shù)。這種長(zhǎng)期投入一方面是大筆資金投入和高產(chǎn)出的正向循環(huán)；另一方面則體現(xiàn)在芯片架構(gòu)設(shè)計(jì)、底層軟件和操作系統(tǒng)的設(shè)計(jì)能力上，需要不斷的積累和高忍耐度。

其次，中國(guó)有句老說(shuō)貪多嚼不爛，國(guó)內(nèi)芯片企業(yè)如果想在AI芯片領(lǐng)域分食蛋糕甚至趕超國(guó)際對(duì)手，必須在一個(gè)垂直領(lǐng)域做精做深，真正的深耕進(jìn)去，并且要真正做到全棧的方案和產(chǎn)品給到用戶，提供的是一個(gè)可供量產(chǎn)化的產(chǎn)品而不是一個(gè)DEMO，必須要讓它能真正應(yīng)用。

第三，生態(tài)的建立，國(guó)外芯片企業(yè)基本上都有自己的一套體系和生態(tài)系統(tǒng)，華為基于自身多年ICT的積累可以快速推出麒麟、昇騰、鯤鵬等系列芯片，但是在生態(tài)方面依然欠缺，體現(xiàn)在軟件、操作系統(tǒng)、體系架構(gòu)、輔助件、工具鏈等等。因此國(guó)內(nèi)芯片廠商必須進(jìn)行AI芯片相關(guān)軟硬件生態(tài)的建立，以及用戶體系的培養(yǎng)。比如NXP、Intel在國(guó)內(nèi)高校多年發(fā)展課程體系、認(rèn)證體系等，華為在近幾年也有意識(shí)的開(kāi)展和高校和科研院所的戰(zhàn)略性合作，這一舉措絕對(duì)是影響深遠(yuǎn)的。

第四，制程工藝，我們已知去年發(fā)生的中興遭遇芯片斷供，華為在美國(guó)的黑手下也面臨芯片供應(yīng)商不能供貨問(wèn)題，這里主要涉及到芯片的制程工藝，目前芯片制造工藝主流水平是7-14m，而大名鼎鼎的臺(tái)積電早就量產(chǎn)7nm芯片，5nm工藝也進(jìn)入了量產(chǎn)階段，目前正在研究2nm工藝。中國(guó)芯片企業(yè)只能做到14nm，也只有中芯國(guó)際能做，因此中國(guó)缺乏生產(chǎn)最先進(jìn)的7納米和更小芯片的能力。就目前來(lái)看華為面臨的問(wèn)題也是整個(gè)中國(guó)芯片行業(yè)面臨的問(wèn)題，雖然目前華為繞開(kāi)美國(guó)制裁禁令的可能性不大，但是這里面的關(guān)鍵問(wèn)題是中國(guó)芯片企業(yè)能以多快的速度建立國(guó)內(nèi)芯片世界一流工藝制造能力。

雖然我們很樂(lè)觀的對(duì)中國(guó)芯片行業(yè)的發(fā)展非?？春?，但是，中國(guó)AI芯片想要達(dá)到世界一流水平甚至實(shí)現(xiàn)趕超，還有很長(zhǎng)的路要走。人工智能行業(yè)催生了這個(gè)過(guò)程，但是天賦不能與經(jīng)驗(yàn)，積累同樣重要，更何況國(guó)內(nèi)企業(yè)一直缺課，能不能盡快補(bǔ)上來(lái)并且追過(guò)去，就看國(guó)內(nèi)企業(yè)如何發(fā)力了。

《風(fēng)語(yǔ)辰學(xué)習(xí)筆記》專(zhuān)輯

智能汽車(chē)不僅僅是當(dāng)下的熱門(mén)，也是未來(lái)趨勢(shì)所在，作為一個(gè)汽車(chē)電控工程師，研究、設(shè)計(jì)、產(chǎn)品，這是工作；但是拆解、分析，形成自己的設(shè)計(jì)語(yǔ)言，這是興趣。每個(gè)階段有不同的收貨，整理一下，記個(gè)筆記，給自己烙個(gè)印，也分享一下，共勉！

作者：風(fēng)語(yǔ)辰（知乎號(hào)）

公眾號(hào)：智能汽車(chē)電子技術(shù)

分享到：

微信“掃一掃”
分享到朋友圈

下一篇：電動(dòng)汽車(chē)底盤(pán)平臺(tái)的開(kāi)發(fā)需求和實(shí)施策略
上一篇：華為HiCar車(chē)機(jī)系統(tǒng)正式上線！

點(diǎn)贊 0 反對(duì) 0 舉報(bào) 0 收藏 0 評(píng)論 0

汽車(chē)測(cè)試網(wǎng)V課堂
微信公眾號(hào)
汽車(chē)測(cè)試網(wǎng)手機(jī)站

相關(guān)閱讀

0 條相關(guān)評(píng)論

• 瓦力大作戰(zhàn)｜輕科普——誤碼儀（BERT）架構(gòu)及測(cè)試原理解析	• 為什么 HUD 合規(guī)真正“卡人”的不是參數(shù)，而是證據(jù)鏈
• 輔助駕駛撞扛樹(shù)枝老人、撞環(huán)衛(wèi)工人是預(yù)期功能安全應(yīng)該覆蓋	• 大推力直驅(qū)技術(shù)助力EPS安全測(cè)試，為你的安全出行 “保駕護(hù)
• 單機(jī)體積，雙倍效能！激光切割機(jī)玩轉(zhuǎn)“降本增效”	• 同步難？空間擠？這款雙出軸電機(jī)，是你雙十二的“必囤”硬
• 即刻探索8臺(tái)機(jī)器人如何解放數(shù)百名工人！	• 考慮驅(qū)動(dòng)單元性能變化的分布式驅(qū)動(dòng)智能車(chē)輛強(qiáng)化學(xué)習(xí)增強(qiáng)運(yùn)
• eVTOL/飛行汽車(chē)→低噪聲氣動(dòng)設(shè)計(jì)與主動(dòng)降噪控制策略1/3	• 比亞迪車(chē)輛避撞專(zhuān)利公布

日本无码免费高清在线|成人日本在线观看高清|A级片免费视频操逼欧美|全裸美女搞黄色大片网站|免费成人a片视频|久久无码福利成人激情久久|国产视频一二国产在线v|av女主播在线观看|五月激情影音先锋|亚洲一区天堂av

全球自動(dòng)駕駛AI芯片最新、最全盤(pán)點(diǎn)

微信公眾號(hào)

編輯推薦

最新資訊

國(guó)內(nèi)首個(gè)“路空一體”國(guó)家質(zhì)檢中心落戶廣東

全國(guó)156個(gè)！IAE智行眾維入選！工信部2025年

瓦力大作戰(zhàn)｜輕科普——誤碼儀（BERT）架構(gòu)

是德科技推出適用于AI數(shù)據(jù)中心的Scale-Up驗(yàn)

“汽車(chē)爬坡試驗(yàn)方法”將有國(guó)家標(biāo)準(zhǔn)

日本无码免费高清在线|成人日本在线观看高清|A级片免费视频操逼欧美|全裸美女搞黄色大片网站|免费成人a片视频|久久无码福利成人激情久久|国产视频一二国产在线v|av女主播在线观看|五月激情影音先锋|亚洲一区天堂av

全球自動(dòng)駕駛AI芯片最新、最全盤(pán)點(diǎn)

微信公眾號(hào)

編輯推薦

最新資訊

國(guó)內(nèi)首個(gè)“路空一體”國(guó)家質(zhì)檢中心落戶廣東

全國(guó)156個(gè)！IAE智行眾維入選！工信部2025年

瓦力大作戰(zhàn)｜輕科普——誤碼儀（BERT）架構(gòu)

是德科技推出適用于AI數(shù)據(jù)中心的Scale-Up驗(yàn)

“汽車(chē)爬坡試驗(yàn)方法”將有國(guó)家標(biāo)準(zhǔn)

全球自動(dòng)駕駛AI芯片最新、最全盤(pán)點(diǎn)

全國(guó)156個(gè)！IAE智行眾維入選！工信部2025年