日本无码免费高清在线|成人日本在线观看高清|A级片免费视频操逼欧美|全裸美女搞黄色大片网站|免费成人a片视频|久久无码福利成人激情久久|国产视频一二国产在线v|av女主播在线观看|五月激情影音先锋|亚洲一区天堂av

  • 手機(jī)站
  • 小程序

    汽車(chē)測(cè)試網(wǎng)

  • 公眾號(hào)
    • 汽車(chē)測(cè)試網(wǎng)

    • 在線課堂

    • 電車(chē)測(cè)試

全球自動(dòng)駕駛AI芯片最新、最全盤(pán)點(diǎn)

2020-07-13 21:37:30·  來(lái)源:汽車(chē)電子與軟件  
 
一.引言自動(dòng)駕駛汽車(chē)的智能化取決于算法,因此有軟件定義汽車(chē)的概念出現(xiàn)并且大為盛行,但是要想實(shí)現(xiàn)軟件定義汽車(chē),必須要有一個(gè)可以承載高度智能化且運(yùn)算量龐大
一.  引言
 
自動(dòng)駕駛汽車(chē)的智能化取決于算法,因此有軟件定義汽車(chē)的概念出現(xiàn)并且大為盛行,但是要想實(shí)現(xiàn)軟件定義汽車(chē),必須要有一個(gè)可以承載高度智能化且運(yùn)算量龐大的AI算法的硬件計(jì)算平臺(tái)或者叫域控制器,而無(wú)論是硬件計(jì)算平臺(tái)還是域控制器,都離不開(kāi)芯片。自動(dòng)駕駛從L0到L5,隨著功能的完善和性能的提升,帶來(lái)更好的智能和科技體驗(yàn)的同時(shí),也對(duì)AI芯片的算力和性能提出更高的需求。
之前的文檔曾提到,L2或者說(shuō)ADAS需要的AI計(jì)算力<10TOPS,L3需要的AI計(jì)算力為30~60TOPS,L4需要的AI計(jì)算力>100TOPS,L5需要的AI計(jì)算力為500-1000TOPS。
對(duì)于域控制器而言,硬件大體可分為三部分:承擔(dān)環(huán)境感知和深度學(xué)習(xí)等超大算力需求的AI處理芯片、負(fù)責(zé)控制決策和邏輯運(yùn)算的CPU、以及負(fù)責(zé)功能安全和車(chē)輛控制的MCU。
第一部分通常是GPU或TPU,承擔(dān)大規(guī)模浮點(diǎn)數(shù)并行計(jì)算需求,主要用于環(huán)境感知和信息融合,如Xavier的GPU單元、昇騰310、地平線BPU等。
第二部分大多為ARM架構(gòu),類(lèi)似于CPU,主要負(fù)責(zé)邏輯運(yùn)算和決策控制,處理高精度浮點(diǎn)數(shù)串行計(jì)算。
第三部分主要負(fù)責(zé)可靠性和車(chē)輛控制,目前用的較多的就是Infineon的TC297或者TC397。
第三部分MCU目前大部分域控制器或者計(jì)算平臺(tái)都會(huì)選擇Infineon的TriCore系列TC397或者TC297,比如華為、地平線、德賽西威、優(yōu)控智行等。第二部分大多是ARM架構(gòu)處理器,或者和第一部分AI計(jì)算模塊集成到一個(gè)SoC上,而第一部分目前正處在風(fēng)頭浪尖或者說(shuō)行業(yè)變革和技術(shù)路線探索的階段,前面也專(zhuān)門(mén)整理了一篇文章講被稱(chēng)為AI芯片的各種xPU。
本文盤(pán)一下,目前可供選擇用于設(shè)計(jì)域控制器或計(jì)算平臺(tái)的AI芯片種類(lèi)和廠家,雖然目前的芯片最高也僅能滿足部分L3、L4級(jí)自動(dòng)駕駛AI計(jì)算所需。
 
二. 自動(dòng)駕駛AI芯片盤(pán)點(diǎn)
 
1.  華為MDC和昇騰Ascend芯片
 
華為在2018年推出MDC智能駕駛計(jì)算平臺(tái)以及高階自動(dòng)駕駛?cè)珬=鉀Q方案,包括MDC300和MDC600兩個(gè)平臺(tái),分別對(duì)應(yīng)L3和L4級(jí)自動(dòng)駕駛。
華為MDC300由華為昇騰Ascend310芯片、華為鯤鵬芯片和Infineon的TC397三部分構(gòu)成,算力在64Tops 左右,滿足L3級(jí)自動(dòng)駕駛算力需求。MDC600基于8顆昇騰310 AI芯片,同時(shí)還整合了CPU和相應(yīng)的ISP模塊,算力高達(dá)352TOPS。
華為MDC相對(duì)于其他平臺(tái)而言,最大的優(yōu)勢(shì)在于其統(tǒng)一的系統(tǒng)架構(gòu)便于功能擴(kuò)展和適配多種場(chǎng)景應(yīng)用。并且華為MDC智能駕駛計(jì)算平臺(tái)已經(jīng)于2020年1月16日通過(guò)了德國(guó)萊茵頒發(fā)的ISO26262功能安全管理認(rèn)證,達(dá)到ASIL-D級(jí)標(biāo)準(zhǔn)。
華為依托其ICT行業(yè)的經(jīng)驗(yàn)積累,目前已經(jīng)建立起了完善的芯片體系,包括專(zhuān)為5G提供支持的巴龍系列芯片、基于全新達(dá)芬奇架構(gòu)研發(fā)的昇騰Ascend系列AI芯片、在手機(jī)上搭載的CPU處理器芯片麒麟系列,以及服務(wù)器級(jí)處理器芯片鯤鵬系列。其中,昇騰系列AI芯片主打AI算力需求。
昇騰310使用了華為自研的高效靈活CISC指令集,每個(gè)AI核心可以在1個(gè)周期內(nèi)完成4096次MAC計(jì)算,集成了張量、矢量、標(biāo)量等多種運(yùn)算單元,支持多種混合精度計(jì)算,支持訓(xùn)練及推理兩種場(chǎng)景的數(shù)據(jù)精度運(yùn)算。
   
 
           
作為NPU,昇騰310集成了FPGA和ASIC兩款芯片的優(yōu)點(diǎn),包括ASIC的低功耗以及FPGA的可編程、靈活性高等特點(diǎn),從而其統(tǒng)一架構(gòu)可以適配多種場(chǎng)景,功耗范圍從幾十毫瓦到幾百瓦,彈性多核堆疊,可在多種場(chǎng)景下提供最優(yōu)能耗比。
相較而言,英偉達(dá)的Xavier 算力為30TOPS,功耗則達(dá)30W,能效為1 TOPS/W,相比之下,華為昇騰310 算力為16 TOPS,功耗僅為8W,能效為2 TOPS/W。
華為自研的昇騰Ascend芯片,支持接入與實(shí)時(shí)處理更多的外部傳感器數(shù)據(jù)流(如攝像頭、毫米波雷達(dá)、激光雷達(dá)、GPS等),為自動(dòng)駕駛提供更安全可靠的計(jì)算力支持,能夠應(yīng)付處理更復(fù)雜路況。搭載昇騰芯片的MDC相比其他計(jì)算平臺(tái)具備高性能。高能效、高安全性和確定性低延時(shí)等優(yōu)勢(shì)。
 
2.  華為海思(HiSilicon)麒麟芯片
 
說(shuō)到華為,順道提一下成立于2004年的華為海思,以及大名鼎鼎的麒麟系列芯片。
海思推出的第一款片上SoC是麒麟910,作為智能移動(dòng)端SoC,麒麟910除了CPU還包括基帶(baseband)、圖形處理器(GPU)、數(shù)字信號(hào)處理器(DSP)、圖像信號(hào)處理器(ISP)等重要模塊。
2017年9月,華為在德國(guó)柏林國(guó)際電子消費(fèi)品展覽會(huì)(IFA)上正式推出其新款A(yù)I芯片“麒麟970”(Kirin 970)。麒麟970采用TSMC10nm 工藝,內(nèi)部集成了55億個(gè)晶體管,功耗降低了20%,并實(shí)現(xiàn)了1.2Gbps 峰值下載速率。麒麟970基于寒武紀(jì)的 NPU架構(gòu)打造,創(chuàng)新設(shè)計(jì)了 HiAI 移動(dòng)計(jì)算架構(gòu),其AI性能密度大幅優(yōu)于CPU和GPU。相較于四個(gè)Cortex-A73核心,處理相同AI任務(wù),麒麟970擁有約50倍能效和 25倍性能優(yōu)勢(shì)。并且,華為海思陸續(xù)推出麒麟980/985/990等系列SoC,全部針對(duì)AI計(jì)算做了優(yōu)化設(shè)計(jì),采用華為自研NPU架構(gòu),性能得到大幅度提升。
 
近日,有消息稱(chēng)華為已經(jīng)與比亞迪簽訂了合作協(xié)議,未來(lái)的比亞迪新車(chē)將用上華為的麒麟芯片。
但是令人驚訝的是,華為首款上車(chē)的芯片不是成熟的麒麟970,也不是最新的990,而是比較早的一款芯片麒麟710A。麒麟710芯片發(fā)布于2018年7月,它采用8核心設(shè)計(jì),包括四個(gè)A73大核心和四個(gè)A53小核心,大核心的頻率為2.2GHz;定位較低、核心較老的麒麟710A在麒麟710的基礎(chǔ)上發(fā)展而來(lái),架構(gòu)和核心未變,但是工藝制程從12nm變?yōu)?4nm,大核心的頻率也降低到了2.0GHz。
為何選擇麒麟710A這款工藝水平退步的過(guò)時(shí)芯片來(lái)上車(chē)?
我們知道由于美國(guó)針對(duì)華為的種種舉措,華為的供應(yīng)商渠道受到嚴(yán)重影響,尤其是芯片代工方面,之前的臺(tái)積電已經(jīng)靠不住了,華為的芯片只能轉(zhuǎn)為國(guó)產(chǎn)代工,而國(guó)內(nèi)唯一可以承擔(dān)這個(gè)重任的只有中芯國(guó)際,但是中芯國(guó)際的工藝只能到14nm,對(duì)于7nm的麒麟970等芯片有心無(wú)力,選來(lái)選去,也就是麒麟710A合適了。
但是從應(yīng)用需求來(lái)說(shuō),目前麒麟710A可以滿足當(dāng)前智能汽車(chē)車(chē)機(jī)系統(tǒng)對(duì)于功能性能方面的要求,主要是圖像和影音處理,以及交互流暢性等。其競(jìng)爭(zhēng)對(duì)手有同級(jí)別的Intel Atom A3950、高通的驍龍820A芯片等均已開(kāi)始裝車(chē)量產(chǎn)了,比如理想ONE、領(lǐng)克05、小鵬P7等。但是麒麟710A在正式量產(chǎn)裝車(chē)之前,也需要先通過(guò)車(chē)規(guī)級(jí)認(rèn)證。
3.  地平線機(jī)器人征程芯片
 
地平線成立于2015年7月,由前百度研究院副院長(zhǎng)、百度深度學(xué)習(xí)實(shí)驗(yàn)室主任余凱創(chuàng)辦,致力于為B端用戶提供涉及算法和硬件在內(nèi)完整的嵌入式人工智能解決方案(機(jī)器人大腦)。
 
2017年12月底,地平線發(fā)布了中國(guó)首款全球領(lǐng)先的嵌入式人工智能芯片——面向智能駕駛的征程(Journey)1.0處理器和面向智能攝像頭的旭日(Sunrise)1.0 處理器,還有針對(duì)智能駕駛、智能城市和智能商業(yè)三大應(yīng)用場(chǎng)景的人工智能解決方案。
 
2019年8月,地平線宣布量產(chǎn)中國(guó)首款車(chē)規(guī)級(jí)AI芯片——征程二代。Journey 2芯片搭載地平線自主創(chuàng)新研發(fā)的高性能計(jì)算架構(gòu)BPU2.0(Brain Processing Unit),采用臺(tái)積電 28nm 制程工藝,每TOPS算力可達(dá)同等算力GPU的10倍以上,視覺(jué)感知可以實(shí)現(xiàn)識(shí)別精度>99%,延遲<100 毫秒。征程二代主要面向ADAS市場(chǎng)感知方案,可提供超過(guò)4 TOPS的等效算力,典型功耗僅2W。主要用于自動(dòng)駕駛中對(duì)車(chē)輛、行人和道路環(huán)境等目標(biāo)的感知,類(lèi)似MobileyeQ系列芯片。
 
CES2020上地平線發(fā)布了Matrix2平臺(tái),基于自研Journey征程2芯片,算力達(dá)到16Tops。同時(shí)地平線計(jì)劃2020年底推出征程5,96Tops算力,15W功耗,支持16路攝像頭,對(duì)標(biāo)特斯拉FSD。
基于自研計(jì)算平臺(tái)與產(chǎn)品矩陣,目前地平線已支持 L2、L3、L4 等不同級(jí)別自動(dòng)駕駛的解決方案。在智能駕駛領(lǐng)域,地平線同全球四大汽車(chē)市場(chǎng)(美國(guó)、德國(guó)、日本和中國(guó))的業(yè)務(wù)聯(lián)系不斷加深,目前已賦能合作伙伴包括奧迪、博世、長(zhǎng)安、比亞迪、上汽、廣汽等國(guó)內(nèi)外的頂級(jí)Tier1s,OEMs廠商。
4.  寒武紀(jì)Cambricon-1M/MLU100
 
寒武紀(jì)科技創(chuàng)立于2016年3月,前身是中國(guó)科學(xué)院計(jì)算技術(shù)研究所下一個(gè)課題小組,是最早進(jìn)入AI計(jì)算領(lǐng)域的芯片公司,其主要方向是高性能服務(wù)器芯片、高性能終端芯片和服務(wù)機(jī)器人芯片,但寒武紀(jì)的重點(diǎn)在人工智能領(lǐng)域,早在2016年就發(fā)布了首款商用深度學(xué)習(xí)處理器寒武紀(jì)1A。寒武紀(jì)在2018產(chǎn)品發(fā)布會(huì)上發(fā)布了多個(gè)IP產(chǎn)品——采用7nm工藝的終端芯片Cambricon-1M、云端智能芯片MLU100等。
 
Cambricon-1M處理器IP屬于第三代產(chǎn)品,主打的是智能駕駛領(lǐng)域,后將應(yīng)用領(lǐng)域拓寬到了智能手機(jī)、智能音箱、攝像頭、自動(dòng)駕駛等方面。Cambricon-1M的int 8(8位運(yùn)算)效能比高達(dá)達(dá)5Tops/W每瓦5萬(wàn)億次運(yùn)算),并且提供了2Tops、4Tops、8Tops三種尺寸的處理器內(nèi)核,以滿足不同需求。1M還將支持CNN、RNN、SVM、k-NN等多種深度學(xué)習(xí)模型與機(jī)器學(xué)習(xí)算法的加速,能夠完成視覺(jué)、語(yǔ)音、自然語(yǔ)言處理等任務(wù)。通過(guò)靈活配置1M處理器,可以實(shí)現(xiàn)多線和復(fù)雜自動(dòng)駕駛?cè)蝿?wù)的資源最大化利用。它還支持終端的訓(xùn)練,以此避免敏感數(shù)據(jù)的傳輸和實(shí)現(xiàn)更快的響應(yīng)。
寒武紀(jì)首款云端智能芯片Cambricon MLU100采用寒武紀(jì)最新的MLU V01架構(gòu)和臺(tái)積電16nm工藝,可工作在平衡模式(主頻 1Ghz)和高性能模式(主頻1.3GHz)兩種不同模式下,等效理論峰值速度則分別可以達(dá)到128萬(wàn)億次定點(diǎn)運(yùn)算和166.4萬(wàn)億次定點(diǎn)運(yùn)算,而其功耗為80w和110w。MLU100云端芯片同樣具備高通用性,可支持各類(lèi)深度學(xué)習(xí)和常用機(jī)器學(xué)習(xí)算法。
5.  百度昆侖AI芯片
2018年7月4日百度在其開(kāi)發(fā)者大會(huì)上發(fā)布百度首款A(yù)I芯片——昆侖。百度介紹昆侖是中國(guó)首款云端全功能AI芯片,基于百度CPU,GPU和FPGA加速器,采用百度自研XPU神經(jīng)處理器架構(gòu),通過(guò)長(zhǎng)達(dá)8年的研發(fā)20多次的迭代產(chǎn)生。設(shè)計(jì)性能在100W以上的功耗提供260Tops算力,內(nèi)存帶寬達(dá)到了512GB/s,核心數(shù)有數(shù)萬(wàn)個(gè)。。據(jù)說(shuō)昆侖芯片將由三星代工,采用14nm工藝。
2019年12月18日三星官方宣布,百度首款 AI 芯片昆侖已經(jīng)完成研發(fā),由三星代工最早將于2020年初實(shí)現(xiàn)量產(chǎn)。這款百度自主研發(fā)的面向云、邊緣和人工智能的SoC目前是設(shè)計(jì)性能最高的SoC。
 
昆侖芯片采用了I-Cube封裝方案,通過(guò)I-Cube技術(shù)將邏輯芯片和高帶寬存儲(chǔ)器與插入器連接,再利用三星的差異化解決方案可以實(shí)現(xiàn)在最小尺寸上提供更高的密度/帶寬。
在算力方面,昆侖芯片提供512 GBps的內(nèi)存帶寬,在150W的功率下實(shí)現(xiàn)260Tops算力;它支持針對(duì)自然語(yǔ)言處理的預(yù)訓(xùn)練模型 Ernie,推理速度比傳統(tǒng) GPU/FPGA 加速模型快 3 倍。
借助昆侖,百度可以支持包括大規(guī)模人工智能計(jì)算在內(nèi)的多種功能,例如搜索排序、語(yǔ)音識(shí)別、圖像處理、自然語(yǔ)言處理、自動(dòng)駕駛和 PaddlePaddle 等深度學(xué)習(xí)平臺(tái)。
6.  芯馳科技9系列SoC
 
5月28日,南京芯馳半導(dǎo)體科技有限公司SemiDrive(簡(jiǎn)稱(chēng)“芯馳科技”)正式對(duì)外發(fā)布9系列X9、V9、G9三大汽車(chē)芯片產(chǎn)品,提供了針對(duì)汽車(chē)的協(xié)同一體化解決方案,覆蓋了智能座艙、智能駕駛、中央網(wǎng)關(guān)三大核心應(yīng)用。
據(jù)芯馳科技介紹,X9、V9、G9均是域控級(jí)別的大型SOC芯片,單顆芯片可以替代多個(gè)傳統(tǒng)ECU,可以支持QNX、 Linux、Android等多種車(chē)載OS,也可支持AutoSAR,滿足客戶對(duì)產(chǎn)品進(jìn)行靈活適配的需求,適應(yīng)未來(lái)智能汽車(chē)發(fā)展的需求。
其中,X9系列芯片用來(lái)支持未來(lái)智能座艙:X9中采用了Imagination的PowerVR Series9XM圖形處理器(GPU),一顆X9芯片可以同時(shí)支持多塊高清屏幕,具備語(yǔ)音交互、手勢(shì)識(shí)別,駕駛員狀態(tài)監(jiān)控等功能。
V9系列芯片定義為自動(dòng)駕駛的核心大腦,作為域控制器核心,V9內(nèi)置高性能視覺(jué)引擎,支持多達(dá)18個(gè)攝像頭輸入,不僅能滿足ADAS應(yīng)用需求,還能給未來(lái)更高級(jí)別的自動(dòng)駕駛和無(wú)人駕駛留有充足的擴(kuò)展空間。
G9系列芯片是作為未來(lái)汽車(chē)的智慧信息樞紐;為智能座艙、域控制器及其他模塊起到交互連接作用,同時(shí),G9還可連接外部網(wǎng)絡(luò),支持OTA在線升級(jí)。
V9系列處理器是集成了最新的高性能引擎,包括64-bitArm® Cortex®-A55內(nèi)核,V8.2架構(gòu)CPU;高性能PowerVR GPU;CV專(zhuān)用視覺(jué)處理引擎等,能夠滿足新一代智能駕駛輔助系統(tǒng)應(yīng)用對(duì)強(qiáng)大的計(jì)算能力日益增長(zhǎng)的需求。此外,V9系列處理器集成了千兆以太網(wǎng),CAN-FD, 能夠以較低的成本與車(chē)載系統(tǒng)進(jìn)行無(wú)縫銜接。該款處理器還支持MIPI-CSI和并口CSI,能夠支持?jǐn)z像頭輸入,包括360°環(huán)視影像系統(tǒng)、前視攝像、后視攝像和車(chē)內(nèi)攝像系統(tǒng)。
位于英國(guó)的Imagination為芯馳科技提供GPU支持,針對(duì)芯馳科技的自動(dòng)駕駛芯片,Imagination的最新一代神經(jīng)網(wǎng)絡(luò)加速器(NNA)PowerVR Series3NX可以提供最高達(dá)160TOPS的算力;針對(duì)其高端座艙芯片,Imagination最新發(fā)布的IMG A系列(IMG A-Series)GPU可以提供更高的性能、更快的處理速度和更低的功耗。
另外,芯馳科技號(hào)稱(chēng)是中國(guó)中國(guó)第一家獲得TÜV萊茵頒發(fā)的ISO 26262:2018版功能安全管理體系證書(shū)的企業(yè)。
7.  黑芝麻華山二號(hào)
 
2020年6月15日晚,黑芝麻科技發(fā)布了自研的車(chē)規(guī)級(jí)芯片重磅產(chǎn)品,華山二號(hào)A1000和華山二號(hào)A1000L,這是黑芝麻繼華山一號(hào)之后的第二代產(chǎn)品。兩顆芯片都采用臺(tái)積電16nm工藝,支持車(chē)規(guī)級(jí)AEC-Q100標(biāo)準(zhǔn)和支持多項(xiàng)傳感器。
華山二號(hào)A1000對(duì)標(biāo)特斯拉,具有8個(gè)CPU核,單顆可提供40 TOPS的算力,功耗8-10W。據(jù)黑芝麻智能科技消息,A1000是全球頂尖的包含功能安全的高性能車(chē)規(guī)級(jí)SOC芯片,也是中國(guó)目前第一顆能夠量產(chǎn)的,滿足自動(dòng)駕駛L3/L4級(jí)別要求車(chē)規(guī)級(jí)芯片。華山二號(hào)A1000在L3級(jí)別上對(duì)標(biāo)Tesla,其功耗僅有Tesla FSD的四分之一,面積只有三分之一,成本也只有四分之一,是一款高性?xún)r(jià)比落地產(chǎn)品。到2021年底,搭載黑芝麻華山二號(hào)芯片的車(chē)型或?qū)⒄搅慨a(chǎn)。
 
對(duì)比而言,特斯拉FSD算力144TOPS,功耗72W,能效比2TOPS/W;英偉達(dá)Xavier算力30TOPS,功耗30W,能耗比1TOPS/W。而華山二號(hào)A1000單芯片能效比超過(guò)6TOPS/W ,雙芯片疊加組成的域控制器能效比也超過(guò)5TOPS/W。
 
根據(jù)黑芝麻給出的計(jì)算平臺(tái)方案,單顆A1000L芯片適用于低等級(jí)級(jí)ADAS輔助駕駛;單顆A1000芯片適用于L2+自動(dòng)駕駛;雙A1000芯片互聯(lián)組成的域控制器可支持L3級(jí)別自動(dòng)駕駛;四顆A1000芯片疊加可用于未來(lái)L4級(jí)別自動(dòng)駕駛。
 
8.  西井科技westwell類(lèi)腦芯片
西井科技創(chuàng)辦于2015年,它起初是一家做類(lèi)腦芯片的廠商。所謂的類(lèi)腦芯片簡(jiǎn)單來(lái)說(shuō)就是以人腦的工作方式設(shè)計(jì)制造出來(lái)的芯片。
類(lèi)腦芯片模仿的是大腦神經(jīng)元的工作形式,馮•諾依曼結(jié)構(gòu)處理器芯片不同,與大腦的處理單元是神經(jīng)元,內(nèi)存就是突觸。神經(jīng)元和突觸是物理相連的,所以每個(gè)神經(jīng)元計(jì)算都是本地的,而從全局來(lái)看神經(jīng)元們是分布式在工作。類(lèi)腦芯片由于具有本地計(jì)算和分布式工作的特點(diǎn),所以在工作效率和能耗上相比馮•諾依曼結(jié)構(gòu)處理器芯片更有優(yōu)勢(shì)。
西井科技早期開(kāi)發(fā)了“DeepSouth”類(lèi)腦芯片,是全球首塊可商用5000萬(wàn)類(lèi)腦“神經(jīng)元”芯片,可以模擬5000萬(wàn)個(gè)神經(jīng)元,而同期的IBM的“TrueNorth”只能模擬100萬(wàn)個(gè)。
基于類(lèi)腦芯片技術(shù),西井科技開(kāi)發(fā)出了“DeepWell”和“VestWell”兩款人工智能芯片,DeepWell峰值算力1.8Tops,單核功耗500mW,雙核功耗1W;VestWell芯片峰值算力4Tops,功耗小于2W。
相比NVIDIA Xavier、地平線征程2 等幾十TOPS算力的產(chǎn)品,西井科技的這兩款芯片確實(shí)有點(diǎn)寒磣。但這兩款芯片能夠?qū)崿F(xiàn)片上學(xué)習(xí),可以隨時(shí)新增樣本進(jìn)行增量訓(xùn)練來(lái)提升推理準(zhǔn)確率。
目前的自動(dòng)駕駛算法都是通過(guò)高性能服務(wù)器進(jìn)行模型訓(xùn)練,然后將訓(xùn)練好的模型再部署到車(chē)載硬件之中。西井科技的芯片的優(yōu)勢(shì)在于可以自行進(jìn)化,具體說(shuō)來(lái),西井科技人工智能芯片的片上學(xué)習(xí)特性實(shí)現(xiàn)了模型訓(xùn)練過(guò)程的本地化,即機(jī)器學(xué)習(xí)在終端芯片上就能直接完成,通過(guò)芯片端的不斷學(xué)習(xí)和完善,不斷提升計(jì)算判斷準(zhǔn)確率,可以實(shí)現(xiàn)自我進(jìn)化。相比于其他芯片OTA升級(jí),西井科技的芯片屬于另辟捷徑。
9.深鑒科技DPU
深鑒科技由清華團(tuán)隊(duì)創(chuàng)辦,成立于2016年,其產(chǎn)品稱(chēng)作“深度學(xué)習(xí)處理單元”(DeepProcessing Unit,DPU),目標(biāo)是以ASIC級(jí)別的功耗,來(lái)達(dá)到優(yōu)于GPU的性能,目前第一批產(chǎn)品基于FPGA平臺(tái)。2018年7月17日,深鑒科技被全球最大的 FPGA 廠商賽靈思宣布收購(gòu)。
深鑒科技著力于打造基于DPU的端到端的深度學(xué)習(xí)硬件解決方案,除了承載在硬件模塊(定制的PCB板)上的DPU的芯片架構(gòu)外,還打造了針對(duì)該架構(gòu)的DPU壓縮編譯工具鏈SDK。
自 2016 年成立以來(lái),深鑒科技一直基于賽靈思的技術(shù)平臺(tái)開(kāi)發(fā)機(jī)器學(xué)習(xí)解決方案,推出的兩個(gè)用于深度學(xué)習(xí)處理器的底層架構(gòu)——亞里士多德架構(gòu)和笛卡爾架構(gòu)的 DPU 產(chǎn)品,都是基于賽靈思 FPGA 器件。
 
亞里士多德架構(gòu)
 
笛卡爾架構(gòu)
基于上述兩個(gè)硬件架構(gòu),深鑒科技也發(fā)布了數(shù)款 DPU 硬件產(chǎn)品產(chǎn)品。在人臉識(shí)別方面,深鑒科技分別推出了 DP-1200-F01 人臉檢測(cè)識(shí)別模組和DP-2100-F16人臉?lè)治鼋鉀Q方案。隨后,深鑒科技又推出了視頻結(jié)構(gòu)化解決方案 DP-2100-O16,它可以做到 16 路 1080p 高清視頻的實(shí)時(shí)視頻結(jié)構(gòu)化,可以做到人、車(chē)、非機(jī)動(dòng)車(chē)的檢測(cè)、跟蹤和屬性分析。
在硬件的基礎(chǔ)之上,深鑒科技又開(kāi)發(fā)出面向上述 DPU 的深度神經(jīng)網(wǎng)絡(luò)開(kāi)發(fā)套件 DNNDK(Deep Neural Network Development Kit),而 DNNDK 也是國(guó)內(nèi)第一款專(zhuān)門(mén)為深度學(xué)習(xí)而開(kāi)發(fā)的 SDK。
10.XILINX SoC MP SoC
Xilinx賽靈思是FPGA的先行者和領(lǐng)導(dǎo)者,并創(chuàng)造了多項(xiàng)行業(yè)第一,比如全球首款FPGA、首款硬件/軟件可編程的SoC、首款多處理器SoC(MPSoC,在FPGA上整合了ARM的CPU內(nèi)核,還有Mali系列的GPU等)、首款RFSoC(將通信級(jí)RF采樣數(shù)據(jù)轉(zhuǎn)換器、SD-FEC內(nèi)核、ARM處理器以及FPGA 架構(gòu)整合到單芯片器件中)。
2018年7月,賽靈思收購(gòu)深鑒科技被認(rèn)為是為了進(jìn)一步加強(qiáng)在ADAS/自動(dòng)駕駛汽車(chē)市場(chǎng)的布局。
在汽車(chē) ADAS 和自動(dòng)駕駛解決方案上,賽靈思有針對(duì)自動(dòng)駕駛中央控制器的Zynq UltraScale+ MPSoC、針對(duì)車(chē)載前置攝像頭的Zynq-7000 /Zynq UltraScale+ MPSoC 和針對(duì)多傳感器融合系統(tǒng)的 Zynq UltraScale+ MPSoC。
賽靈思2019年11月宣布推出兩款16nm汽車(chē)級(jí)芯片 Zynq UltraScale+MPSoC 7EV 和 11EG。支持L2至L4級(jí)自動(dòng)駕駛系統(tǒng)。MPSoC采用了64位四核ARMCortex A53和雙核ARM Cortex-R5高性能處理器,并集成了賽靈思的UltraScale架構(gòu)。到目前為止,XA系列MPSoC已經(jīng)被包括戴姆勒奔馳在內(nèi)的29個(gè)汽車(chē)品牌以及Aptiv、Autoliv、博世和大陸集團(tuán)等頂級(jí)零部件供應(yīng)商廣泛使用。
 
 
11.特斯拉FSD芯片
特斯拉屬于汽車(chē)行業(yè)內(nèi)Bug一樣的存在,汽車(chē)、火箭、芯片等等,什么都都可以搞,而且做的還不差,特斯拉早期也是和芯片供應(yīng)商合作,專(zhuān)心做整車(chē),但是陸續(xù)發(fā)現(xiàn)芯片供應(yīng)商不給力之后,便“拋棄”了Mobileye和NVIDIA,開(kāi)始自研AI芯片,特斯拉在2019年4月發(fā)布了首款自動(dòng)駕駛芯片F(xiàn)SD(Full Self Driving全自動(dòng)駕駛),并且是直接以量產(chǎn)的形式發(fā)布,F(xiàn)SD被馬斯克稱(chēng)為“世界上最好的芯片”, 這款芯片除了常規(guī)的CPU和GPU之外,還配備了兩個(gè)神經(jīng)網(wǎng)絡(luò)處理器(NNP),算力為144TOPS,功耗72W,能效比2TOPS/W,就目前來(lái)說(shuō),確實(shí)是量產(chǎn)車(chē)最好的自動(dòng)駕駛芯片。
 
FSD 芯片采用了 14 nm FinFET CMOS 工藝制造,尺寸為 260 mm,具有 60 億個(gè)晶體管和2.5 億個(gè)邏輯門(mén),F(xiàn)SD有兩個(gè)神經(jīng)網(wǎng)絡(luò)加速器NNP,支持 32 位和 64 位浮點(diǎn)運(yùn)算的圖形芯片,以及時(shí)鐘頻率為 2.2 GHz 的十幾款 Arm A72 64 位 CPU,性能是上一代的 2.5 倍。
此外,F(xiàn)SD 還有一個(gè)安全芯片可確保系統(tǒng)僅運(yùn)行由 Tesla 加密的代碼以及專(zhuān)用的 H.265 視頻編碼器。
與上一代硬件相比,F(xiàn)SD的功耗降低了約1.25 倍,整體成本降低了 80%。馬斯克表示,F(xiàn)SD 每英里的功耗約為 250 W。
FSD芯片中自研的最重要的部分是Neural Network Processor,每顆芯片有兩個(gè)NNP,每個(gè)NNP有一個(gè)96x96個(gè)MAC的矩陣,32MB SRAM,工作頻率2GHz。所以一個(gè)NNP的處理能力是96x96x2(OPs)x2(GHz)= 36.864TOPS,單芯片算力72TOPS,F(xiàn)SD硬件板子算力144TOPS。
12.NVIDIA Xavier & Orin & A100
 
NVIDIA GTC 2020因?yàn)橐咔樵蛟邳S教主的廚房進(jìn)行,此次發(fā)布了NVIDIA第八代架構(gòu)Ampere(安培)、以及基于安培架構(gòu)的第一款GPU A100。A100絕對(duì)是目前全球最大的7nm芯片,540億個(gè)晶體管,3D 堆疊技術(shù),加上高達(dá) 826 平方毫米的芯片面積,同時(shí)支持 TF32 和 BF16 格式,擁有438 個(gè)第三代 Te那個(gè)nsor Core,支持虛擬成為 77 個(gè) GPU 來(lái)執(zhí)行不同的任務(wù)。算力達(dá)到2000TOPS,相比Volta架構(gòu)提升了高達(dá)20倍的性能,可以同時(shí)滿足AI訓(xùn)練和推理的需求。
2019年12月,NVIDIA推出了面向ADAS和自動(dòng)駕駛領(lǐng)域的新一代SOC Orin,Orin SOC擁有170億個(gè)晶體管,搭載NVDIA下一代GPU(即基于Ampere架構(gòu)的GPU)和Arm Hercules CPU核心,可以提供200TOPS是運(yùn)算能力,是上一代Xavier SOC的7倍,功耗45W,2022年交付,面向L2+級(jí)自動(dòng)駕駛場(chǎng)景。
NVIDIA在2018年CES上推出了Xavier平臺(tái),號(hào)稱(chēng)是是“世界上最強(qiáng)大的SoC(片上系統(tǒng))”,目前Xavier也確實(shí)是自動(dòng)駕駛AI芯片領(lǐng)域絕對(duì)的首選,Xavier可處理來(lái)自車(chē)輛雷達(dá)、攝像頭、激光雷達(dá)和超聲波系統(tǒng)的L5級(jí)自主駕駛數(shù)據(jù),是目前自動(dòng)駕駛領(lǐng)域應(yīng)用最多的AI芯片,也是最早投入量產(chǎn)的AI芯片。
 
Xavier SoC基于臺(tái)積電12nm工藝,集成90億顆晶體管,芯片面積350平方毫米,CPU采用NVIDIA自研8核ARM64架構(gòu)(代號(hào)Carmel),GPU采用512顆CUDA的Volta,支持FP32/FP16/INT8,20W功耗下單精度浮點(diǎn)性能1.3TFLOPS,Tensor核心性能20TOPs,解鎖到30W后可達(dá)30TOPs。
Xavier 內(nèi)有六種不同的處理器:Valta TensorCoreGPU,八核ARM64 CPU,雙NVDLA 深度學(xué)習(xí)加速器,圖像處理器,視覺(jué)處理器和視頻處理器。這些處理器使其能夠同時(shí)、且實(shí)時(shí)地處理數(shù)十種算法,以用于傳感器處理、測(cè)距、定位和繪圖、視覺(jué)和感知以及路徑規(guī)劃。
TÜVSÜD已確認(rèn)NVIDIA Xavier 系統(tǒng)芯片符合ASIL C 等級(jí)的ISO 26262隨機(jī)硬件完整性,并達(dá)到了ASIL D等級(jí)的系統(tǒng)處理能力要求(最嚴(yán)格的功能安全標(biāo)準(zhǔn))。
13.Mobileye EyeQ系列
在自動(dòng)駕駛芯片領(lǐng)域,Mobileye的EyeQ系列則是典型ASIC芯片的代表,隨著自動(dòng)駕駛芯片領(lǐng)域的競(jìng)爭(zhēng)越來(lái)越激烈以及主機(jī)廠對(duì)于AI芯片的受控性要求越來(lái)越高,Mobileye 逐漸從過(guò)去的一體式視覺(jué)芯片+算法供應(yīng)商的“黑匣子”模式轉(zhuǎn)變?yōu)殚_(kāi)放EyeQ5芯片(即允許第三方代碼運(yùn)行)。
 
Mobileye是Intel在自動(dòng)駕駛領(lǐng)域布局的重要一環(huán),從處理器芯片來(lái)看,Intel的布局已經(jīng)完善,包括Mobileye的ADAS視覺(jué)處理, Altera的FPGA處理,以及英特爾自身的至強(qiáng)Xeon等型號(hào)的處理器,可以形成自動(dòng)駕駛整個(gè)硬件部分的系統(tǒng)性解決方案。
Mobileye自主研發(fā)設(shè)計(jì)的EyeQ系列芯片,由ST公司生產(chǎn)供應(yīng)。量產(chǎn)型號(hào)有EyeQ1至EyeQ4,占據(jù)了全球范圍內(nèi)ADAS市場(chǎng)的60%左右份額。目前性能最高的EyeQ4的算力為2.5 TOPS,功耗為3W,能效0.83 TOPS/W。EyeQ5正在開(kāi)發(fā)進(jìn)行中,按照Mobileye的計(jì)劃在2020年面世,目的是對(duì)標(biāo)NVIDIA Xavier。EyeQ5采用7nm FinFET工藝制造。設(shè)計(jì)計(jì)算性能達(dá)到了24TOPS,功耗為10W,芯片能效是Xavier的2.4倍。EyeQ5芯片將裝備8枚多線程CPU內(nèi)核,同時(shí)還會(huì)搭載18枚Mobileye的下一代視覺(jué)處理器。據(jù)Mobileye消息,EyeQ5 SOC裝備有四種異構(gòu)的全編程加速器,分別對(duì)專(zhuān)有的算法進(jìn)行了優(yōu)化,包括有:計(jì)算機(jī)視覺(jué)、信號(hào)處理和機(jī)器學(xué)習(xí)等。Eyeq5 SOC同時(shí)實(shí)現(xiàn)了兩個(gè)PCI-E端口以支持多處理器間通信。這種架構(gòu)嘗試為每一個(gè)計(jì)算任務(wù)適配最合適的計(jì)算單元,硬件資源的多樣性使應(yīng)用程序能夠節(jié)省計(jì)算時(shí)間并提高計(jì)算效能。
按照Mobileye的計(jì)劃,到2020年中會(huì)向合作伙伴提供一套完整的自動(dòng)駕駛汽車(chē)子系統(tǒng),包括計(jì)算機(jī)視覺(jué)套件:360度/12個(gè)攝像頭/測(cè)距300碼的視覺(jué)系統(tǒng)和多芯片交鑰匙解決方案等。
 
另外提一句,英特爾計(jì)劃將EyeQ5與Atom處理器結(jié)合起來(lái),開(kāi)發(fā)用于自動(dòng)駕駛的人工智能計(jì)算平臺(tái)。兩個(gè)EyeQ5 soc和一個(gè)英特爾Atom(凌動(dòng))處理器就足以實(shí)現(xiàn)5級(jí)自動(dòng)駕駛。
14.安霸Ambarella CV2 SOC
 
安霸是一家高清影像芯片研發(fā)商,主要提供低功耗、高清視頻壓縮與圖像處理的解決方案。致力于提供超低碼率與極小功耗下的高畫(huà)質(zhì)影像技術(shù)。
Ambarella在2018年推出了名為CV2的車(chē)規(guī)級(jí)SoC,專(zhuān)用于提供深度神經(jīng)網(wǎng)絡(luò)(DNN)和立體視覺(jué)處理,瞄準(zhǔn)ADAS和自動(dòng)駕駛車(chē)市場(chǎng)。目標(biāo)是對(duì)標(biāo)Mobileye。結(jié)合VisLab的經(jīng)驗(yàn)和技術(shù),Ambarella在CV2芯片中整合了先進(jìn)的計(jì)算機(jī)視覺(jué)、圖像處理、4Kp60視頻編碼與立體視覺(jué)技術(shù)。CV2可提供較CV1更高20倍的深度神經(jīng)網(wǎng)絡(luò)性能。
Ambarella自稱(chēng)擁有兩項(xiàng)競(jìng)爭(zhēng)優(yōu)勢(shì),一是Ambarella于2015年收購(gòu)的歐洲計(jì)算機(jī)視覺(jué)與智能汽車(chē)控制系統(tǒng)開(kāi)發(fā)商VisLab開(kāi)發(fā)的新型計(jì)算機(jī)視覺(jué)架構(gòu)。二是Ambarella自研的低功耗、高解析(HD)與超高解析(Ultra HD)視覺(jué)處理芯片。
 
CV2的模塊示意圖
CV2設(shè)計(jì)在芯片中支持4個(gè)立體相機(jī)和4個(gè)單眼相機(jī),將由三星(Samsung)以10nm工藝制造。而CV1采用14nmCMOS工藝制造。
 安霸的芯片是基于CVflow架構(gòu)的,這是一個(gè)為像立體處理、深度神經(jīng)網(wǎng)絡(luò)這樣的計(jì)算機(jī)視覺(jué)算法而優(yōu)化的。和DSP(數(shù)字信號(hào)處理器)或GPU相比,CVflow的設(shè)計(jì)能夠讓每核,或者說(shuō)每個(gè)處理單元的性能提高不止一個(gè)層次。
2019年1月,安霸推出了CVFLOW系列最新的芯片上CV25攝像系統(tǒng)(SoC)。
在CES 2020上,Ambarella 演示了使用 CV2、VC22 的各種解決方案,CV2FS和 CV22FS,本質(zhì)上是基于 CV2 和 CV22 功能的全新設(shè)計(jì)。
CV22FS和CV2FS的CVflow架構(gòu)以每秒80幀的速度,提供8兆像素或更高分辨率的計(jì)算機(jī)視覺(jué)處理功能,用于遠(yuǎn)距離、高精度目標(biāo)識(shí)別。每個(gè)系統(tǒng)芯片都包括一臺(tái)用于同時(shí)定位與地圖構(gòu)建(SLAM)以及估計(jì)距離和深度的稠密光流法加速器。多通道高速傳感器輸入與安霸的圖像信號(hào)處理(ISP)通道為攝像頭輸入提供了必要的支持。安霸計(jì)劃于2020年上半年向客戶提供CV22FS和CV2FS樣品。
15.Intel/Altera基于FPGA的 SoC
英特爾2015年收購(gòu)Altera。目前Altera的自動(dòng)駕駛 FPGA 芯片已經(jīng)量產(chǎn)。Altera 的 FPGA產(chǎn)品共有四大系列,分別是頂配的 Stratix 系列(近萬(wàn)美元)、成本與性能平衡的 Arria 系列(2000~5000 美元)、廉價(jià)的 Cyclone 系列(10~20 美元)、 以及 MAX 系列CPLD。
Waymo就是采用英特爾CPU+Altera FPGA的方案來(lái)解決自動(dòng)駕駛所需要的數(shù)據(jù)融合和算法處理。奧迪全新A8車(chē)型上搭載的zFAS域控制器就使用了Altera提供的FPGA芯片-Cyclonev Soc。
16.Google TPU
 
TPU,Tensor Processing Unit,全名為張量處理單元。是 Google 專(zhuān)為機(jī)器學(xué)習(xí)而定制的一款A(yù)SIC芯片。專(zhuān)門(mén)針對(duì)加速和擴(kuò)大使用 TensorFlow 編程的機(jī)器學(xué)習(xí)工作負(fù)載進(jìn)行了優(yōu)化。Google 在 2016 年 5 月的開(kāi)發(fā)者 I/O 大會(huì)上正式發(fā)布TPU1,并在2017年推出了 TPU2,又稱(chēng)Cloud TPU。TPU2 既可以用于 training,又可以用于 inference。每個(gè) Cloud TPU 由四個(gè)定制的 ASIC 構(gòu)成,單個(gè) Cloud TPU 的浮點(diǎn)計(jì)算能力可以達(dá)到 180 teraflops(萬(wàn)億次每秒),內(nèi)存寬帶 64GB。
2018年TPU 3.0面世,性能相比TPU 2.0有8倍提升。并且2018年7月谷歌又發(fā)布了Edge TPU芯片搶攻邊緣計(jì)算市場(chǎng)。
在2019年5月的谷歌I/O開(kāi)發(fā)者大會(huì)上,Google以1000個(gè)TPUv3組成的TPUv3 Pod取代了本應(yīng)出現(xiàn)在發(fā)布會(huì)上的第四代TPU,目前關(guān)于TPU的新的規(guī)劃尚不得而知。
 
TPU經(jīng)過(guò)了專(zhuān)門(mén)深度機(jī)器學(xué)習(xí)方面的訓(xùn)練,能加速其第二代人工智能系統(tǒng)TensorFlow的運(yùn)行,而且效率也大大超過(guò)GPU,Google的深層神經(jīng)網(wǎng)絡(luò)就是由TensorFlow引擎驅(qū)動(dòng)的。TPU執(zhí)行每個(gè)操作所需的晶體管數(shù)量更少,自然效率更高。
TPU與同期的CPU和GPU相比,可以提供15-30倍的性能提升,以及30-80倍的效率(性能/瓦特)提升。
17.NXP恩智浦的S32V系列SoC
恩智浦基于自研第二代視覺(jué)專(zhuān)用處理芯片S32V234設(shè)計(jì)開(kāi)發(fā)了一款自動(dòng)駕駛開(kāi)發(fā)平臺(tái)BlueBox,集成了S32V234汽車(chē)視覺(jué)和傳感器融合處理器、LS2084A 嵌入式計(jì)算處理器、 S32R27 雷達(dá)微控制器。
S32V234 視覺(jué)處理器, 擁有 CPU(4 顆 ARM CortexA53 和 1 顆M4)、3D GPU(Vivante GC3000)和視覺(jué)加速單元(2 顆 APEX-2vision accelerator), 支持4 路攝像頭??捎糜谇耙晹z像頭、后視攝像頭、環(huán)視系統(tǒng)、傳感器融合系統(tǒng)等, 能實(shí)時(shí) 3D建模,計(jì)算能力為 50GFLOPs。同時(shí), S32V234 芯片預(yù)留了支持毫米波雷達(dá)、激光雷達(dá)、超聲波的接口,可實(shí)現(xiàn)多傳感器數(shù)據(jù)融合,最高可支持 ISO26262 ASIL-C 標(biāo)準(zhǔn)。
 
LS2088A內(nèi)嵌式處理器負(fù)責(zé)行高性能運(yùn)算,由8個(gè)64位ARM Cortex-A72內(nèi)核組成,配合頻率2GHz的特制加速器、高性能通信接口和DDR4內(nèi)存控制器,延時(shí)極低。
由于NXP S32234芯片本身設(shè)計(jì)架構(gòu)問(wèn)題造成算力不足,以及生態(tài)工具鏈欠缺較多,目前該芯片已經(jīng)被邊緣化。
最近有消息稱(chēng),NXP開(kāi)始與臺(tái)積電合作,借助臺(tái)積電5nm技術(shù)的增強(qiáng)版N5P的打造新一代汽車(chē)級(jí)芯片,預(yù)計(jì)2021年推出,NXP的這一舉措使汽車(chē)處理平臺(tái)一舉跨越到5nm,對(duì)整個(gè)行業(yè)來(lái)說(shuō)都是一個(gè)質(zhì)的飛躍。對(duì)NXP來(lái)說(shuō),這將是一次重新站到汽車(chē)芯片行業(yè)“制高點(diǎn)”的絕佳機(jī)會(huì)。
18.TI德州儀器TDAx系列SoC
TI的自動(dòng)駕駛芯片方案基于DSP,主要面向ADAS市場(chǎng)。主要產(chǎn)品是TDAx 系列,包括TDA2x、TDA3x、TDA2Eco,以及今年發(fā)布的TDA4VM等,基于異構(gòu)硬件和通用軟件架構(gòu)。TDA2x于2013年10月發(fā)布,主要面向中到中高級(jí)市場(chǎng),配置了2顆ARM Cortex-A15內(nèi)核與4顆 Cortex-M4內(nèi)核、2顆TI定浮點(diǎn)C66xDSP 內(nèi)核、4顆EVE視覺(jué)加速器核心,以及Imagination SGX544 GPU,主要應(yīng)用于前置攝像頭信息處理,包括車(chē)道報(bào)警、防撞檢測(cè)、自適應(yīng)巡航以及自動(dòng)泊車(chē)系統(tǒng)等。
TDA3x于2014年10月發(fā)布,主要面向中到中低級(jí)市場(chǎng),其縮減了包括雙核A15及SGX544 GPU,主要應(yīng)用在后置攝像頭、2D或2.5D環(huán)視等。
在CES 2020上,TI發(fā)布了基于Jacinto™7架構(gòu)的TDA4VM處理器系列,將TI行業(yè)領(lǐng)先的DSP和EVE內(nèi)核整合到單個(gè)高性能內(nèi)核中,并增加了浮點(diǎn)矢量計(jì)算功能,該款SoC包含通用處理CPU、C7 DSP MMA深度學(xué)習(xí)加速器、VPAC DMPAC視覺(jué)加速器、ISP和以太網(wǎng)交換機(jī)以及PCIe交換機(jī)等。在功耗方面,TDA4VM處理器僅用5到20W的功率和性能效率即可執(zhí)行高性能ADAS計(jì)算,無(wú)需主動(dòng)冷卻。
 
19.瑞薩 R-Car V3H
“R-Car”是瑞薩電子株式會(huì)社專(zhuān)為自動(dòng)駕駛汽車(chē)計(jì)算而設(shè)計(jì)的系統(tǒng)級(jí)芯片(SoC)系列,主要用于汽車(chē)信息系統(tǒng)。Renesas瑞薩電子在2018年推出新款R-Car V3H SoC。R-Car V3H以較低的功耗為汽車(chē)前視視覺(jué)系統(tǒng)提供強(qiáng)大的計(jì)算性能和人工智能處理能力,適用于L3、L4級(jí)自動(dòng)駕駛。R-Car V3H主要針對(duì)立體前視攝像頭應(yīng)用進(jìn)行了優(yōu)化,其計(jì)算機(jī)視覺(jué)性能是2017年4月推出的面向NCAP前視攝像頭的R-CarV3M SoC的5倍。
 
R-Car V3H SoC專(zhuān)注于對(duì)計(jì)算機(jī)視覺(jué)處理進(jìn)行架構(gòu)優(yōu)化,支持從有條件自動(dòng)駕駛到高度自動(dòng)駕駛的所有ADAS相關(guān)功能。R-Car V3H運(yùn)用瑞薩基于IMP-X5+圖像識(shí)別引擎和專(zhuān)用硬件加速器的異構(gòu)計(jì)算機(jī)視覺(jué)內(nèi)核概念,用包括稠密光流注3、稠密立體視差注4和對(duì)象分類(lèi)注5在內(nèi)的算法實(shí)現(xiàn)了先進(jìn)的感知功能。集成的CNN注6IP以?xún)H0.3W的業(yè)界領(lǐng)先低功耗加快了深度學(xué)習(xí),實(shí)現(xiàn)了2倍于R-Car V3M的深度神經(jīng)網(wǎng)絡(luò)性能。
20.Arm 自動(dòng)駕駛芯片Cortex-A76AE
作為一個(gè)移動(dòng)芯片基礎(chǔ)技術(shù)公司,本身并不制造芯片,而是通過(guò)研究微控制器芯片的核心技術(shù),然后授權(quán)給各大芯片廠商。
自1996年,Arm生產(chǎn)的通用型、實(shí)時(shí)型處理器就開(kāi)始被各大車(chē)輛制造商使用。現(xiàn)在Arm的半導(dǎo)體知識(shí)產(chǎn)權(quán)(IP)已廣泛應(yīng)用于ADAS系統(tǒng)(如防撞、巡航控制等)、連接、信息娛樂(lè)、動(dòng)力總成控制和汽車(chē)其他組件。
2018年9月,Arm推出了“安全就緒”(Safety Ready)計(jì)劃,旨在為自動(dòng)駕駛汽車(chē)提供解決方案。并推出了代號(hào)為Cortex-A76AE的產(chǎn)品,作為第一款專(zhuān)為自動(dòng)駕駛汽車(chē)打造的處理器。
 
Cortex-A76AE處理器允許芯片制造商設(shè)計(jì)具有安全功能的芯片,使自動(dòng)駕駛汽車(chē)能夠滿足最嚴(yán)格的安全要求,能將自動(dòng)躲避等特性應(yīng)用到汽車(chē)上。AE,即“Automotive Enhanced(自動(dòng)駕駛增強(qiáng))”。該處理器采用臺(tái)積電7nm工藝技術(shù)制造的16核Cortex-A76AE SoC具有超過(guò)250 KDMIPS的計(jì)算性能,功耗30W,足以滿足當(dāng)今應(yīng)用需求。如果用戶想要更高的性能,可以構(gòu)建更多內(nèi)核,甚至多個(gè)SoC。該內(nèi)核具備Arm v8.2微體系結(jié)構(gòu)的所有功能特性,包括可靠性、可用性和可維護(hù)性,并采用了分核-鎖步(Split-Lock)模式來(lái)確保可靠性。
并且,基于Cortex-A76AE的SoC可擴(kuò)展至最多64核。除了含有通用計(jì)算核外,Arm的自主計(jì)算復(fù)合體還集成了Mali-G76 GPU、ARM的ML處理器和其他必要的IP。此外,所有復(fù)合體支持Arm的內(nèi)存虛擬化和保護(hù)技術(shù),可以完美實(shí)現(xiàn)ML和NN加速器的運(yùn)行。
 
Arm 在Cortex-A76AE之后又推出新款適應(yīng)自動(dòng)駕駛的處理器產(chǎn)品Cortex-A65AE。按照Arm公司計(jì)劃,第一批使用Cortex-A76AE處理器的汽車(chē)將于2020年上路,Cortex-A65AE也將于2020年上市。
21.高通Snapdragon Ride
Qualcomm高通公司此前在 2017 年披露了其研發(fā)自動(dòng)駕駛汽車(chē)芯片的計(jì)劃,2018 年,因?yàn)楸O(jiān)管原因,高通公司收購(gòu)荷蘭恩智浦公司遭到失敗。2020年1月5日,在美國(guó)拉斯維加斯舉行的消費(fèi)電子展(CES)上高通發(fā)布了全新的自動(dòng)駕駛平臺(tái)Snapdragon Ride,旨在處理從車(chē)道控制、自動(dòng)泊車(chē)等自動(dòng)駕駛所需的各項(xiàng)任務(wù),高通預(yù)計(jì)其可在2023年上路。
             
 
Snapdragon Ride平臺(tái)包含多個(gè)SOC(系統(tǒng)級(jí)芯片)選項(xiàng),包括深度學(xué)習(xí)加速器和自動(dòng)駕駛軟件Stack,能夠支持高級(jí)駕駛輔助系統(tǒng)ADAS功能,比如車(chē)道保持以及在自動(dòng)駕駛出租車(chē)(Robotaxi)上的全自動(dòng)駕駛的應(yīng)用等功能。
 
根據(jù)高通介紹,Snapdragon Ride平臺(tái)基于一系列不同的驍龍SoC和加速器建立,采用了可擴(kuò)展且模塊化的高性能異構(gòu)多核CPU、高能效的AI與計(jì)算機(jī)視覺(jué)引擎,以及業(yè)界領(lǐng)先的GPU?;诓煌腟oC和加速器的組合,平臺(tái)能夠根據(jù)自動(dòng)駕駛的每個(gè)細(xì)分市場(chǎng)的需求進(jìn)行匹配,并提供業(yè)界領(lǐng)先的散熱效率,包括從面向L1/L2級(jí)別應(yīng)用的30 TOPS等級(jí)的設(shè)備,到面向L4/L5級(jí)別駕駛、超過(guò)700 TOPS的功耗130瓦的設(shè)備。因此該平臺(tái)可支持被動(dòng)或風(fēng)冷的散熱設(shè)計(jì),從而實(shí)現(xiàn)成本降低、可靠性提升,省去昂貴的液冷系統(tǒng),并簡(jiǎn)化汽車(chē)設(shè)計(jì)以及延長(zhǎng)電動(dòng)汽車(chē)的行駛里程。Snapdragon Ride的一系列SoC和加速器專(zhuān)為功能安全ASIL-D級(jí)(汽車(chē)安全完整性等級(jí)D級(jí))系統(tǒng)而設(shè)計(jì)。
Snapdragon Ride將于2020年上半年交付汽車(chē)制造商和一級(jí)供應(yīng)商進(jìn)行前期開(kāi)發(fā)。Qualcomm Technologies預(yù)計(jì)搭載Snapdragon Ride的汽車(chē)將于2023年投入生產(chǎn)。
 
中國(guó)公司在AI芯片領(lǐng)域的探索在近幾年呈現(xiàn)爆發(fā)趨勢(shì),頭部企業(yè)有華為、地平線、寒武紀(jì)、西井科技、百度等,另有其他國(guó)產(chǎn)公司在人工智能、語(yǔ)音識(shí)別、視覺(jué)處理方面發(fā)力,如芯馳科技、黑芝麻、中星微電子、比特大陸、杭州中天微等等。總體來(lái)看,中國(guó)公司在AI芯片領(lǐng)域已經(jīng)占據(jù)不少席位,中國(guó)自動(dòng)駕駛芯片在性能和功耗上和外國(guó)芯片相比并不差,但是如果想要達(dá)到世界領(lǐng)先水平,甚至趕超NVIDIA、Tesla、TI、Xilinx等還有很長(zhǎng)的路要走。而從研發(fā)設(shè)計(jì)到真正上車(chē)量產(chǎn),更需要深度的測(cè)試驗(yàn)證和積累。
 
首先,國(guó)產(chǎn)芯片企業(yè)想要有所建樹(shù),必須要有長(zhǎng)期研發(fā)投入的思想準(zhǔn)備,也就是燒錢(qián)和時(shí)間,在沒(méi)有積累的基礎(chǔ)上做AI芯片研發(fā),所要攻克的難關(guān)數(shù)不勝數(shù)。這種長(zhǎng)期投入一方面是大筆資金投入和高產(chǎn)出的正向循環(huán);另一方面則體現(xiàn)在芯片架構(gòu)設(shè)計(jì)、底層軟件和操作系統(tǒng)的設(shè)計(jì)能力上,需要不斷的積累和高忍耐度。
 
其次,中國(guó)有句老說(shuō)貪多嚼不爛,國(guó)內(nèi)芯片企業(yè)如果想在AI芯片領(lǐng)域分食蛋糕甚至趕超國(guó)際對(duì)手,必須在一個(gè)垂直領(lǐng)域做精做深,真正的深耕進(jìn)去,并且要真正做到全棧的方案和產(chǎn)品給到用戶,提供的是一個(gè)可供量產(chǎn)化的產(chǎn)品而不是一個(gè)DEMO,必須要讓它能真正應(yīng)用。
 
第三,生態(tài)的建立,國(guó)外芯片企業(yè)基本上都有自己的一套體系和生態(tài)系統(tǒng),華為基于自身多年ICT的積累可以快速推出麒麟、昇騰、鯤鵬等系列芯片,但是在生態(tài)方面依然欠缺,體現(xiàn)在軟件、操作系統(tǒng)、體系架構(gòu)、輔助件、工具鏈等等。因此國(guó)內(nèi)芯片廠商必須進(jìn)行AI芯片相關(guān)軟硬件生態(tài)的建立,以及用戶體系的培養(yǎng)。比如NXP、Intel在國(guó)內(nèi)高校多年發(fā)展課程體系、認(rèn)證體系等,華為在近幾年也有意識(shí)的開(kāi)展和高校和科研院所的戰(zhàn)略性合作,這一舉措絕對(duì)是影響深遠(yuǎn)的。
第四,制程工藝,我們已知去年發(fā)生的中興遭遇芯片斷供,華為在美國(guó)的黑手下也面臨芯片供應(yīng)商不能供貨問(wèn)題,這里主要涉及到芯片的制程工藝,目前芯片制造工藝主流水平是7-14m,而大名鼎鼎的臺(tái)積電早就量產(chǎn)7nm芯片,5nm工藝也進(jìn)入了量產(chǎn)階段,目前正在研究2nm工藝。中國(guó)芯片企業(yè)只能做到14nm,也只有中芯國(guó)際能做,因此中國(guó)缺乏生產(chǎn)最先進(jìn)的7納米和更小芯片的能力。就目前來(lái)看華為面臨的問(wèn)題也是整個(gè)中國(guó)芯片行業(yè)面臨的問(wèn)題,雖然目前華為繞開(kāi)美國(guó)制裁禁令的可能性不大,但是這里面的關(guān)鍵問(wèn)題是中國(guó)芯片企業(yè)能以多快的速度建立國(guó)內(nèi)芯片世界一流工藝制造能力。
雖然我們很樂(lè)觀的對(duì)中國(guó)芯片行業(yè)的發(fā)展非??春?,但是,中國(guó)AI芯片想要達(dá)到世界一流水平甚至實(shí)現(xiàn)趕超,還有很長(zhǎng)的路要走。人工智能行業(yè)催生了這個(gè)過(guò)程,但是天賦不能與經(jīng)驗(yàn),積累同樣重要,更何況國(guó)內(nèi)企業(yè)一直缺課,能不能盡快補(bǔ)上來(lái)并且追過(guò)去,就看國(guó)內(nèi)企業(yè)如何發(fā)力了。
 
《風(fēng)語(yǔ)辰學(xué)習(xí)筆記》專(zhuān)輯
智能汽車(chē)不僅僅是當(dāng)下的熱門(mén),也是未來(lái)趨勢(shì)所在,作為一個(gè)汽車(chē)電控工程師,研究、設(shè)計(jì)、產(chǎn)品,這是工作;但是拆解、分析,形成自己的設(shè)計(jì)語(yǔ)言,這是興趣。每個(gè)階段有不同的收貨,整理一下,記個(gè)筆記,給自己烙個(gè)印,也分享一下,共勉!
作者:風(fēng)語(yǔ)辰(知乎號(hào))
公眾號(hào):智能汽車(chē)電子技術(shù)
分享到:
 
反對(duì) 0 舉報(bào) 0 收藏 0 評(píng)論 0
滬ICP備11026917號(hào)-25