• 正文
  • 推薦器件
  • 相關推薦
申請入駐 產(chǎn)業(yè)圖譜

碾壓SA8295P的高通SoC來了,高合首發(fā)

2023/12/08
6466
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

座艙SoC天花板是SA8295P?當然不是,AMD的一系列嵌入式處理器都可以碾壓SA8295P,高通自己的座艙SoC如SA8255P也可以在AI領域超越SA8295P,主要原因是SA8295P是2021年初的產(chǎn)品,其設計范圍在2020年就已確定了,卻沒想到座艙領域被中國車企卷得不成樣子,遂在定位低于SA8295P的產(chǎn)品上也持續(xù)加大算力

2023年9月19日,極越01首發(fā)高通驍龍8295智艙芯片。驍龍8295是最強的車機芯片,采用5nm制程工藝、8倍于8155的算力。在安兔兔車機性能榜單中,其跑分近70萬,幾乎是驍龍8155的2倍。就在同一天下午,高合在展翼日正式發(fā)布自研高算力智能座艙平臺。該平臺將首搭高通QCS8550芯片,實現(xiàn)行業(yè)首發(fā),根據(jù)官方數(shù)據(jù)對比顯示,全面優(yōu)于SA8295。不出意外的話,比亞迪下一代也會用QCS8550。

兩者最大性能差別就是AI算力

圖片來源:高通

這張圖有混淆視聽之嫌,需要解釋清楚,這個96TOPS是INT4精度下的算力,而SA8295P是不支持INT4精度的。不過即便比INT8精度,QCS8550也有48TOPS,也是遙遙領先。

CPU也碾壓SA8295P,高達300kDMIPS,GPU是Adreno 740,算力達3.6TFLOPS,同樣比SA8295P要高。就制造工藝而言,QCS8550是4納米,SA8295P還是5納米。

QCS8550是何方神圣?

圖片來源:高通

上圖是高通對QCS8550/QCM8550的定位,顯然它不是車規(guī)級芯片,不過這無所謂,特斯拉Model S那顆AMD顯卡芯片連工業(yè)級都沒做到,也沒人指責過,這個至少是工業(yè)級,不是消費級的。而現(xiàn)在的Model 3/Y上用的AMD Ryzen V1000系列產(chǎn)品,是工業(yè)級產(chǎn)品,也不是車規(guī)級的,也沒人敢指責特斯拉。再有就是國內(nèi)頂級新能源大廠一直都是用高通非車規(guī)級模組做座艙,用非車規(guī)級做座艙的至少有30%以上。

高通QCS8550/QCM8550的參數(shù)

圖片來源:高通

QCM就是帶modem??匆谎圻@個CPU配置,略有經(jīng)驗的人便能看出,這就是手機領域驍龍8gen2的修改版,實際單看型號也能看出,8Gen2的型號就是SM8550。

驍龍8Gen3和8Gen2對比

https://www.androidauthority.com/snapdragon-8-gen-3-vs-snapdragon-8-gen-2-3381660/

上表對比后不難發(fā)現(xiàn),QCS8550就是8Gen2,兩者完全一致。

強大的AI算力不難做到,難以做到的是低成本下的高AI算力,而高通最擅長的就是低成本下的AI算力。對芯片來說硬件成本基本等同于die size面積大小,高通SoC 的die size一般都很小,一般都低于120平方毫米,而英偉達Orin和華為MDC 610要400平方毫米以上。座艙SoC中,高通的AI算力異乎尋常地強,這個48TOPS真能運行大模型么?當然不能運行ChatGPT3這種大模型,就算單張H100也不能,流暢運行ChatGPT3至少需要8張H100和兩片6千美元的CPU芯片。

高通的AI算力這么強主要源自其獨特的DSP架構和VLIW指令集,其淵源是ATI,早在2004年高通與ATI達成合作計劃,決定把ATI公司的3D圖形技術集成到高通下一代移動處理器之中,看中的就是ATI Imageon。后來ATI被AMD收購,ATI Imageon也更名為AMD Imageon。2009年,高通以6500萬美元收購了AMD的移動設備資產(chǎn),取得了AMD的矢量繪圖與3D繪圖技術相關知識產(chǎn)權,不用再向AMD繳納技術授權費用。后來高通獨立發(fā)展出了一種全新的GPU品牌體系——Adreno。Adreno GPU此后不斷開花結果,歷經(jīng)多年演化,占據(jù)了移動GPU市場的主導地位。

實際ATI的技術不止供養(yǎng)了日后的Adreno,ATI也開發(fā)了VLIW技術。以ATI Radeon HD 5800為例,GPU由20個SIMD計算引擎組成,每個SIMD計算引擎由16個線程處理器單元(Thread Processor - TP)組成。而每個TP則是一個5-way的VLIW Processor。雖然后來VLIW退出GPU領域,但在DSP領域大放異彩,在AI時代更是大展神威,助力高通成為移動霸主。

VLIW就是超長指令集。

幾種指令集的對比

VLIW類似于多條RISC指令的集合,VLIW的思路是硬件盡量簡單化,硬件只負責取指令和執(zhí)行指令,其余一概不管,把困難推給編譯器,讓編譯器來做指令調(diào)度。首先我們還得知道編譯器是什么,比如C語言、C++、Java這樣的程序,當我們一行一行寫下代碼后,需要經(jīng)過編譯器的“翻譯”才能變成可執(zhí)行程序才可以執(zhí)行,才可以實現(xiàn)代碼到程序的轉(zhuǎn)變。電腦(其實主要就是CPU)只認識0或1這兩個數(shù)字。所有寫的一切代碼,都需要編譯器幫我們編譯也就是翻譯成大量的01代碼(實際中間還有一步就是生成匯編代碼),才是CPU的“母語”,CPU才會熟練的幫我們飛速般去執(zhí)行。

VLIW把多條獨立的指令打包為一個指令集并交給編譯器,編譯器根據(jù)指令的不同形式判斷指令的運行周期,將運行周期比較一致的指令安排在一起發(fā)射并執(zhí)行。VLIW最大好處是實現(xiàn)了并行計算,比如VLIW的數(shù)據(jù)總線長如果是1024比特,那么對4比特數(shù)據(jù),一次可以取256個,取到數(shù)據(jù)進行并行計算(前提是你得有256套ALU加寄存器之類的硬件系統(tǒng)),一個指令就可以完成256個周期運算,如同256個內(nèi)核。缺點很明顯,如果這256個計算中有一個卡殼了,那么其余255個必須停下來等待這個計算完成,這就是鎖步,大家的步伐必須完全一致,而傳統(tǒng)的超標量CPU不會,它可以亂序執(zhí)行。還有一個缺點就是即使只有10個指令,其余那246個也必須空轉(zhuǎn),這意味著功耗很高。這與近期的SIMD可變矢量長度非常近似,但SIMD只是一次性取了256個4比特數(shù)據(jù),VLIW完全依靠軟件就實現(xiàn)了并行計算。1994年英特爾和惠普簽訂協(xié)議,宣布共同開發(fā)面向高性能計算(HPC)的處理器,也就是后來的Itanium,安騰。他們以VLIW指令作為基礎,提出了顯式并行指令集運算EPIC( Explicitly parallel instruction computing)。不過這對開放式軟件系統(tǒng)挑戰(zhàn)太大,2000年以后就消失了,但VLIW+DSP慢慢崛起了。

VLIW處理器示意圖

DSP與傳統(tǒng)CPU或GPU最大不同是其采用哈佛架構,將存儲器空間劃分成兩個,分別存儲程序和數(shù)據(jù)。它們有兩組總線連接到處理器核,允許同時對它們進行訪問,每個存儲器獨立編址,獨立訪問。這種安排將處理器的數(shù)據(jù)吞吐率加倍,更重要的是同時為處理器核提供數(shù)據(jù)與指令。DSP芯片廣泛采用2-6級流水線以減少指令執(zhí)行時間,從而增強了處理器的處理能力。這可使指令執(zhí)行能完全重疊,每個指令周期內(nèi),不同的指令都處于激活狀態(tài)。更像是脈動處理器,數(shù)據(jù)一次導入,流轉(zhuǎn)周期很長,效率極高。DSP最強之處還有它可實現(xiàn)零開銷循環(huán),而AI引擎通常就是零開銷循環(huán)結構,不會發(fā)生任何用于比較和分支的分支控制開銷。

但DSP本質(zhì)還是近似CPU的設計,不適合做并行計算,它最適合的是圖像壓縮算法或快速傅里葉變換(FFT)這種算法,即串行數(shù)據(jù)流形式的計算,而VLIW是天生并行指令集,二者結合后就非常適合AI運算,AI運算即是并行矩陣運算,也是數(shù)據(jù)流形式。

高通的AI表現(xiàn)與編譯器關系非常密切,但大家都知道編譯器是靜態(tài)的,無法實現(xiàn)動態(tài)調(diào)整,因此某些模型可能在高通芯片表現(xiàn)很差,很多搞座艙的都沒使用過高通的DSP運算能力,智能駕駛領域用DSP的人也很少,因為太難用了。而高通唯一一款通用AI計算器AI100上,高通沒有使用其最擅長的DSP架構,而是傳統(tǒng)的MAC陣列架構,主要也是為了盡可能擴大應用面。

大模型是可以跑,但誰都不會公布延遲是多少毫秒,AI算力這游戲還是蠻有趣的。

推薦器件

更多器件
器件型號 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊 ECAD模型 風險等級 參考價格 更多信息
ADUM4160BRWZ 1 Rochester Electronics LLC SPECIALTY ANALOG CIRCUIT, PDSO16, ROHS COMPLIANT, MS-013AA, SOIC-16
$12.93 查看
DG455EQ-T1-E3 1 Vishay Intertechnologies Analog Switch Quad SPST 16-Pin TSSOP T/R
$3.94 查看
高通

高通

高通(英文名稱:Qualcomm,中文簡稱:高通公司、美國高通或美國高通公司)創(chuàng)立于1985年,總部設于美國加利福尼亞州圣迭戈市,高通的基礎科技賦能了整個移動生態(tài)系統(tǒng),每一臺3G、4G和5G智能手機中都有其發(fā)明。高通公司是全球3G、4G技術研發(fā)的領先企業(yè),已經(jīng)向全球多家制造商提供技術使用授權,涉及了世界上所有電信設備和消費電子設備的品牌。在中國,高通開展業(yè)務已逾20年,與中國生態(tài)伙伴的合作已拓展至智能手機、集成電路、物聯(lián)網(wǎng)、大數(shù)據(jù)、軟件、汽車等眾多行業(yè)。

高通(英文名稱:Qualcomm,中文簡稱:高通公司、美國高通或美國高通公司)創(chuàng)立于1985年,總部設于美國加利福尼亞州圣迭戈市,高通的基礎科技賦能了整個移動生態(tài)系統(tǒng),每一臺3G、4G和5G智能手機中都有其發(fā)明。高通公司是全球3G、4G技術研發(fā)的領先企業(yè),已經(jīng)向全球多家制造商提供技術使用授權,涉及了世界上所有電信設備和消費電子設備的品牌。在中國,高通開展業(yè)務已逾20年,與中國生態(tài)伙伴的合作已拓展至智能手機、集成電路、物聯(lián)網(wǎng)、大數(shù)據(jù)、軟件、汽車等眾多行業(yè)。收起

查看更多

相關推薦

登錄即可解鎖
  • 海量技術文章
  • 設計資源下載
  • 產(chǎn)業(yè)鏈客戶資源
  • 寫文章/發(fā)需求
立即登錄

佐思汽車研究:致力于汽車、TMT、新能源(特別是新能源汽車、智能汽車、車聯(lián)網(wǎng))領域的產(chǎn)業(yè)研究、專項調(diào)研、戰(zhàn)略規(guī)劃和投資咨詢服務。