日本无码免费高清在线|成人日本在线观看高清|A级片免费视频操逼欧美|全裸美女搞黄色大片网站|免费成人a片视频|久久无码福利成人激情久久|国产视频一二国产在线v|av女主播在线观看|五月激情影音先锋|亚洲一区天堂av

  • 手機(jī)站
  • 小程序

    汽車測(cè)試網(wǎng)

  • 公眾號(hào)
    • 汽車測(cè)試網(wǎng)

    • 在線課堂

    • 電車測(cè)試

詳解智能座艙芯片算力評(píng)估

2024-12-31 17:25:48·  來源:汽車電子與軟件  作者:張慧敏  
 

從表9 可以看到,新一代的智能座艙在使用場(chǎng)景上既增加了功能,又提升了性能。原有的座艙 SoC 算力是否能滿足新的場(chǎng)景需求呢?讓我們對(duì)使用場(chǎng)景進(jìn)行分析。

根據(jù)表2的座艙算力分解數(shù)據(jù)來看,智能座艙在大部分使用場(chǎng)景中,CPU和GPU均是不可或缺的算力單元。在視覺呈現(xiàn)相關(guān)的任務(wù)上,借助DPU計(jì)算是必需的,而在處理多媒體音視頻數(shù)據(jù)時(shí),除了CPU和GPU外,還需要額外借助VPU的算力。此外,在涉及攝像頭圖像處理的任務(wù)時(shí),ISP則成為必不可少的算力單元。因此,我們首先需要基于當(dāng)前的硬件平臺(tái)和應(yīng)用軟件層進(jìn)行算力消耗情況的全面統(tǒng)計(jì)與分析。

6.2 座艙算力統(tǒng)計(jì)對(duì)比

下面我們以 SA8155 為座艙 SoC 核心的域控制器測(cè)算并統(tǒng)計(jì)各個(gè)座艙應(yīng)用場(chǎng)景對(duì) CPU 和 GPU 的具體算力需求。

1. CPU 測(cè)算

我們可以通過 Linux 系統(tǒng)下的 CPU 使用率統(tǒng)計(jì)命令 top 來進(jìn)行 CPU 算力測(cè)試。圖8 展示了在 Linux 的命令行調(diào)試環(huán)境中輸入 top 命令之后顯示的結(jié)果。

圖片

圖8  Linux 命令行環(huán)境中的 top 命令運(yùn)行結(jié)果

從圖8中可以看到,Xorg應(yīng)用對(duì)應(yīng)的進(jìn)程ID(PID)為 1428,它的CPU占用率為85.9%。因此,我們?cè)谥悄茏摰膽?yīng)用場(chǎng)景運(yùn)行的同一時(shí)間輸入top命令,就可以得到該應(yīng)用所占CPU的百分比。為了最大限度地模擬真實(shí)的智能座艙應(yīng)用環(huán)境,我們還應(yīng)該將多個(gè)場(chǎng)景進(jìn)行并發(fā)執(zhí)行。在經(jīng)過實(shí)驗(yàn)之后,我們可以拿到當(dāng)前的智能座艙SoC的CPU占用率。根據(jù)公開信息顯示,高通SA8155的CPU算力為105kDMIPS。表10 列舉了部分應(yīng)用場(chǎng)景下,SA8155的CPU占用率測(cè)算結(jié)果和CPU算力消耗結(jié)果。

表10   SA8155 的 CPU 占用率和算力消耗


功能項(xiàng)是否存在并發(fā)場(chǎng)景CPU占用率CPU算力消耗 /k DMIPS中控娛樂屏顯示是10%10.5多媒體音視頻播放是17%17.85玩大型游戲否0%0HUD是10%10.5360°環(huán)視攝像頭顯示否15%15.75后排娛樂屏顯示是0%0總算力需求僅并發(fā)37%38.85


而針對(duì)新一代智能座艙的應(yīng)用場(chǎng)景需求,我們可以根據(jù) SA8155 的使用情況進(jìn)行推算。 表11 總結(jié)了下一代智能座艙在功能和性能的需求升級(jí)以后對(duì) CPU 算力消耗的估算情況。

表11  下一代智能座艙的 CPU 算力消耗估算


功能項(xiàng)是否并發(fā)CPU占用率CPU 算力消耗 /k DMIPS中控娛樂屏顯示是—30(估算)多媒體音視頻播放是—17.85(新增解碼算力需求以VPU 為主)玩大型游戲否—65(估算)HUD 應(yīng)用是—20.5(估算)360° 環(huán)視攝像頭顯示否—30(估算)后排娛樂屏顯示是—10.5(估算)總算力需求僅并發(fā)—78.85(估算)


從表11 的數(shù)據(jù)可以看到,針對(duì)下一代智能座艙的使用場(chǎng)景,隨著大型游戲和后排娛樂屏等功能的加入,對(duì)性能的需求也有了顯著的提升?;?SA8155 的實(shí)測(cè)數(shù)據(jù),我們經(jīng)過深入的分析和驗(yàn)證,得出下一代智能座艙部分應(yīng)用場(chǎng)景的算力需求。這一需求是基于并發(fā)的應(yīng)用場(chǎng)景進(jìn)行的考量,尚未涵蓋非并發(fā)的場(chǎng)景,但即便如此,這些場(chǎng)景下的總算力需求也已經(jīng)高達(dá) 78.85k DMIPS。

那么,為什么在計(jì)算算力資源時(shí),我們選擇了 DMIPS作為參考依據(jù),而不是使用SPEC CPU2017的結(jié)果呢?這主要是因?yàn)?,我們是通過測(cè)量各應(yīng)用場(chǎng)景下CPU的占用率來估算CPU 消耗的算力資源。當(dāng)我們獲得了CPU占用率之后,可以直接采用SoC廠家給出的DMIPS參考值來進(jìn)行歸一化的計(jì)算和對(duì)比。而SPECCPU2017 測(cè)試套件則更多地用于全面和客觀地評(píng)估CPU的實(shí)際性能,通常用于SoC之間的對(duì)比評(píng)估。

在得到表12 中的估算值后,再考慮到還有諸多應(yīng)用場(chǎng)景對(duì) CPU 資源的額外消耗需求,顯然 SA8155 已經(jīng)無法滿足下一代智能座艙的算力要求。因此,我們必須尋求具備更高性能的新的 SoC 解決方案。

2. GPU 測(cè)算

類似于測(cè)算各場(chǎng)景下 CPU 的占用率,我們同樣需要測(cè)算各場(chǎng)景下 GPU 的占用率。經(jīng)過查詢資料,我們發(fā)現(xiàn)高通公司在其底層軟件驅(qū)動(dòng)中增加了統(tǒng)計(jì) GPU 占用率的功能。通過配置相應(yīng)命令,我們可以統(tǒng)計(jì)各進(jìn)程的 GPU 占用率(每個(gè)應(yīng)用場(chǎng)景通常由一個(gè)或多個(gè)進(jìn)程來實(shí)現(xiàn))。

在 SA8155 的開發(fā)板上,我們首先通過 busybox(Android 系統(tǒng)下的一個(gè)調(diào)試工具包)進(jìn)入 SA8155 的 QNX 命令行交互界面。然后,我們輸入以下命令,以啟動(dòng) GPU 占用率統(tǒng)計(jì)功能。

// 設(shè)置 Log 層級(jí),打開詳細(xì)信息記錄

echo  gpu_set_log_level  4  >  /dev/kgsl-control 

// 統(tǒng)計(jì)每個(gè)應(yīng)用的 GPU 占用率

echo gpu_per_process_busy  1000  >  /dev/kgsl-control

在輸入這些命令后,每個(gè)應(yīng)用的 GPU占用率將通過系統(tǒng)日志(slog)進(jìn)行輸出。我們獲取到這些GPU占用率數(shù)據(jù)后,會(huì)基于SA8155的GPU總算力資源(約為1142GFLOPS)來計(jì)算每個(gè)應(yīng)用的具體消耗值。此外,我們還會(huì)根據(jù)應(yīng)用場(chǎng)景的升級(jí)需求,以 SA8155的算力消耗為基準(zhǔn),進(jìn)一步預(yù)測(cè)和計(jì)算下一代座艙所需的GPU算力值,并將這些數(shù)據(jù)總結(jié)在表12中。

表 12   SA8155 和下一代座艙的 GPU 占用率和算力消耗


功能項(xiàng)是否存在并發(fā)場(chǎng)景GPU占用率GPU 算力消耗 / GFLOPS下一代座艙的 GPU 算力消耗 / GFLOPS中控娛樂屏顯示是25%285.5650多媒體音視頻播放是10%114.2150玩大型游戲否——1000HUD 顯示是1%11.42185360° 環(huán)視攝像頭顯示否30%342.6600后排娛樂屏顯示是——350總算力需求僅并發(fā)36%411.121335


在表12 所統(tǒng)計(jì)的算力需求中,我們特地將并發(fā)的應(yīng)用與非并發(fā)的應(yīng)用分開進(jìn)行計(jì)算。 例如,在大型游戲的運(yùn)行場(chǎng)景下,GPU的消耗相當(dāng)高,可能達(dá)到 1000GFLOPS 的算力。然而, 考慮在行車途中玩游戲可能對(duì)用戶的視力造成不良影響,甚至引發(fā)眩暈,我們將這類場(chǎng)景定義為僅在駐車模式下才允許啟動(dòng)。因此,在統(tǒng)計(jì) GPU 的算力消耗時(shí),這類場(chǎng)景的算力消耗不應(yīng)計(jì)入最大并發(fā)場(chǎng)景的總體算力消耗中。

根據(jù)上述分析,我們認(rèn)識(shí)到 SA8155 在 GPU 算力值上已無法滿足下一代智能座艙的需求。在規(guī)劃 GPU 的算力資源池時(shí),我們不能僅局限于當(dāng)前的應(yīng)用場(chǎng)景需求,還必須充分考慮未來軟件升級(jí)可能帶來的 GPU 算力增長(zhǎng)需求。這就要求我們?cè)谠O(shè)計(jì)下一代座艙的算力系統(tǒng)時(shí),必須預(yù)留出合理的算力升級(jí)空間,以應(yīng)對(duì)未來可能的挑戰(zhàn)。

6.3 其他組件性能評(píng)估

除了核心的 CPU 和 GPU 之外,座艙 SoC 還集成了多種算力子單元,每個(gè)子單元都擁有獨(dú)特的功能和應(yīng)用場(chǎng)景。在全面評(píng)估整個(gè)系統(tǒng)的算力時(shí),我們必須充分考慮這些子單元的性能,確保它們能夠滿足各自的需求。接下來,我們將簡(jiǎn)要闡述 DPU、VPU 以及 ISP 的算力評(píng)估標(biāo)準(zhǔn)。

1. DPU 性能評(píng)估

DPU 主要負(fù)責(zé)將 GPU 渲染的圖像數(shù)據(jù)傳輸?shù)斤@示設(shè)備,因此它的性能評(píng)估標(biāo)準(zhǔn)應(yīng)該是針對(duì)顯示部分的各種處理能力。表13 列舉了DPU的數(shù)據(jù)處理能力。

表 13  DPU 數(shù)據(jù)處理能力


性能點(diǎn)說明典型值分辨率可支持的顯示屏的像素點(diǎn)數(shù)目,一般為長(zhǎng)×寬,除了有效像素點(diǎn)外,還需要包括屏幕外Blanking(消隱比例)的像素?cái)?shù)目4K分辨率屏,有效像素為3840 ×2160刷新率每秒可以顯示的幀數(shù)例如60 幀/ 秒、90 幀/ 秒、120 幀/ 秒像素深度每個(gè)像素點(diǎn)采用多少位來存儲(chǔ)彩色數(shù)據(jù),記為bpp,不同的顏色存儲(chǔ)方式,所使用的bpp 數(shù)目不同,其色彩還原真實(shí)的程度也不同。DPU 一般可以用RGB 格式或者ARGB 格式如RGB888 格式,其像素深度為24,而ARGB格式,其像素深度為32數(shù)據(jù)處理能力分辨率×刷新率×像素深度×1.1例如,分辨率為4K像素,刷新率為60幀/ 秒,像素深度為24,則數(shù)據(jù)處理能力為12.25Gbit/s


DPU 的一項(xiàng)關(guān)鍵功能是協(xié)助 GPU 完成多圖層合成(Overlay)的操作,這使得 Android 系統(tǒng)能夠分別渲染多個(gè)圖層,并將它們合成后統(tǒng)一輸出到顯示屏上。此外,由于座艙芯片需要支持單芯多屏的技術(shù),因此 DPU 必須能夠支持多個(gè)顯示通道的輸出。每個(gè)顯示通道都對(duì)應(yīng)著一塊或多塊屏幕,這就要求 DPU 能夠支持多圖層合成和多屏幕顯示的功能,以實(shí)現(xiàn)多屏幕的高效處理。

2. VPU 性能評(píng)估

VPU 是專門用于處理視頻數(shù)據(jù)的硬件編解碼器。從本質(zhì)上看,它是一個(gè)以空間換時(shí)間的硬件解決方案。在 SoC 設(shè)計(jì)之初,就需要明確所需支持的視頻編解碼類型及相應(yīng)的處理能力,因?yàn)橐坏┰O(shè)計(jì)確定,后期通常無法再對(duì)這些特性進(jìn)行更改,除非重新設(shè)計(jì)整顆 SoC。

對(duì)于 VPU 的性能評(píng)估,關(guān)鍵指標(biāo)包括它所支持的視頻數(shù)據(jù)類型以及像素處理能力。值得注意的是,VPU 的編碼和解碼能力是需要分別進(jìn)行設(shè)計(jì)的,以滿足不同的應(yīng)用需求。表14 簡(jiǎn)要列出了 SA8155 的 VPU 所支持的性能特性。

表14   SA8155 的 VPU 性能統(tǒng)計(jì)


功能數(shù)據(jù)類型處理能力編碼H265 main 10 、H265 main 、H264 High 、VP8最大支持4K分辨率,60 幀/ 秒的視頻編碼能力,編碼格式包括H265 、H264 、VP8解碼H265 main 10 、H265 main、H264 High 、VP9 profile 2 、VP8 和MPEG-2最大支持4K分辨率,120 幀/ 秒的視頻解碼能力,可支持4K 60 幀/ 秒解碼和4K 30 幀/ 秒編碼同時(shí)工作


3. ISP 性能評(píng)估

ISP 負(fù)責(zé)管理圖像傳感器的工作流程。它由一系列圖像處理單元構(gòu)成,這些單元在流水線中協(xié)同工作,本質(zhì)上是一種通過增加硬件資源來優(yōu)化處理速度的設(shè)計(jì)。在評(píng)估 ISP 的性能時(shí),我們不僅要關(guān)注它能夠連接多少個(gè)攝像頭,還要著重考察其圖像質(zhì)量的解析能力。然而,由于 ISP 的圖像質(zhì)量解析能力涉及的內(nèi)容廣泛且復(fù)雜,在此不再詳細(xì)展開,僅簡(jiǎn)要介紹 SA8155  在圖像設(shè)備接入能力方面的表現(xiàn)。

表15  SA8155 的圖像設(shè)備接入能力


接口SoC 規(guī)格支持能力說明Camera 接口MIPI CSI D-PHY4端口×4Lane、2.5Gbit/Lane可以支持多個(gè)攝像頭同時(shí)接入。例如4 個(gè)環(huán)視攝像頭,可以采用虛擬通道的方式,經(jīng)由1 個(gè)MIPI CSI 接口輸入。從理論上來說,該芯片總共可以支持16 個(gè)攝像頭

#07本章小結(jié)


針對(duì)座艙系統(tǒng)的算力評(píng)估需求,本章進(jìn)行了全面的探討和分析。首先,我們列舉了影響座艙 SoC 的主要算力單元,并針對(duì)座艙內(nèi)的主要使用場(chǎng)景進(jìn)行了算力需求的詳細(xì)分解。

在進(jìn)一步的分析中,我們重點(diǎn)關(guān)注了 CPU 、GPU 和 NPU 這三大核心算力單元。不僅深入介紹了它們的主要架構(gòu)和工作原理,還提供了具體的性能評(píng)估公式。這些公式能夠幫助讀者更準(zhǔn)確地量化CPU 、GPU 和 NPU的性能表現(xiàn),從而為座艙系統(tǒng)的設(shè)計(jì)和優(yōu)化提供有力的數(shù)據(jù)支持。

此外,我們還著重討論了影響 SoC 性能的另一個(gè)關(guān)鍵因素——存儲(chǔ)器性能。存儲(chǔ)器的讀寫速度和帶寬對(duì) SoC 的整體性能有著顯著影響。因此,在評(píng)估 SoC 算力時(shí),必須充分考慮存儲(chǔ)器的性能表現(xiàn)。

希望讀者能夠通過本章內(nèi)容對(duì) SoC 的算力評(píng)估有一個(gè)全面、深入的了解。這不僅有助于讀者更好地理解和選擇適合的 SoC,還能為座艙系統(tǒng)的設(shè)計(jì)、優(yōu)化和升級(jí)提供有力的技術(shù)支持。

作者介紹:

張慧敏,蔚來汽車數(shù)字架構(gòu)部智能座艙架構(gòu)設(shè)計(jì)師、西安交通大學(xué)碩士。深耕嵌入式軟件與智能手機(jī)芯片架構(gòu)設(shè)計(jì)多年,已獲專利授權(quán)15項(xiàng)。曾任紫光展銳芯片架構(gòu)設(shè)計(jì)師,主導(dǎo)5G手機(jī)芯片及新能源汽車智能座艙系統(tǒng)架構(gòu)設(shè)計(jì),擁有豐富的實(shí)戰(zhàn)經(jīng)驗(yàn)。同時(shí),他積極分享專業(yè)知識(shí),于知乎平臺(tái)開設(shè)“智能座艙架構(gòu)與芯片”專欄,撰寫多篇科技文章,廣受業(yè)界好評(píng)。

分享到:
 
反對(duì) 0 舉報(bào) 0 收藏 0 評(píng)論 0
滬ICP備11026917號(hào)-25