英偉達(dá)新推出的 GeForce GTX 1080 游戲顯卡采用了該公司最新的帕斯卡架構(gòu),并且使用了采用 16nm FinFET 工藝制造的芯片。GTX 1080 上的 GP104 圖形處理單元包含 72 億顆晶體管,運(yùn)行速度可達(dá) 1.6GHz,可以超頻至 1.733 GHz。這顆芯片的硅片尺寸為 314 平方毫米,比前一代 GeForce GTX 980 上采用 28nm 工藝生產(chǎn)制造的圖形處理器小了 21%。據(jù)稱,開發(fā)這項(xiàng)技術(shù)花了英偉達(dá) 20 多億美金。
GeForce GTX 1080 使用了圖形處理單元(GPU)架構(gòu),說(shuō)是可以突破功耗 / 性能的平衡。但是,當(dāng)把 GPU 和標(biāo)準(zhǔn)的中央處理單元(CPU)放在一起比較時(shí),哪個(gè)表現(xiàn)更勝一籌呢?再或者與更類似 GPU 且成功進(jìn)入高性能計(jì)算系統(tǒng)的現(xiàn)場(chǎng)可編程門陣列(FPGA)相比呢?
AMD 公司的技術(shù)和工程高級(jí)副總裁 Mark Papermaster 在 DAC 的一次主題演講中吹捧“摩爾定律+”時(shí)代的到來(lái)。他說(shuō),CPU、GPU 和加速器可以帶來(lái)沉浸式的計(jì)算體驗(yàn)。業(yè)界已經(jīng)認(rèn)識(shí)到,這種計(jì)算能力“需要采取系統(tǒng)設(shè)計(jì)方法才能達(dá)到”。
每種類型的計(jì)算引擎都有各自的優(yōu)點(diǎn)。CPU 能夠在低延遲下實(shí)現(xiàn)高負(fù)載的運(yùn)算,GPU 能實(shí)現(xiàn)最高的單管腳帶寬,而 FPGA 則可以用于多種通用設(shè)計(jì)。
但是同樣,每種引擎也都有各自的局限性。CPU 需要在先進(jìn)的工藝節(jié)點(diǎn)下實(shí)現(xiàn)更高的整合,GPU 則受限于能放在其上的內(nèi)存大小的限制。
“FPGA 能夠連接到和 CPU 一樣類型的存儲(chǔ)器,”Rambus 公司企業(yè)級(jí)解決方案技術(shù)副總裁兼杰出發(fā)明家 Steven Woo 稱?!癋PGA 這種芯片的靈活性特別高,對(duì)于特定的應(yīng)用或加速應(yīng)用,他們能夠改進(jìn)性能,并實(shí)現(xiàn)更佳的能源效率。”
英特爾公司去年年底完成了以 167 億美金收購(gòu) Altera 公司的交易,看中的就是 FPGA 能夠提供的靈活計(jì)算加速能力。微軟在其 Bing 搜索引擎中采用 FPGA 來(lái)提升性能,因?yàn)?FPGA 能夠幫助其實(shí)現(xiàn)成本和功耗的平衡。不過,采用 FPGA 來(lái)設(shè)計(jì)低功率、高性能的設(shè)備卻不是一件容易的事情。
“現(xiàn)在提供一個(gè)通用的解決方案越來(lái)越難了,”Woo 表示?!耙恍┰O(shè)計(jì)團(tuán)隊(duì)開始設(shè)計(jì)時(shí)采用 FPGA,然后把在 FPGA 中開發(fā)的邏輯固化成一顆 ASIC,他們起步時(shí)采用 FPGA,然后觀察一下市場(chǎng)的增長(zhǎng)情況,這可以幫助他們合理地評(píng)估開發(fā) ASIC 的成本。”
除了在許多微處理器中使用的行業(yè)標(biāo)準(zhǔn) x86 架構(gòu),ARM 的架構(gòu)主宰著移動(dòng)器件市場(chǎng),并正在針對(duì)數(shù)據(jù)中心和服務(wù)器進(jìn)行細(xì)化調(diào)整。市場(chǎng)上有來(lái)自開源 RISC-V 的 ARM 架構(gòu)開源內(nèi)核、出自 OpenPower 的 POWER CPU 架構(gòu),在 x86 領(lǐng)域也有來(lái)自 AMD 的競(jìng)爭(zhēng)。不過,最終選擇哪種芯片取決于使用情況和具體應(yīng)用。
“這種決策需要平衡考慮成本,性能和功耗,”Woo 表示?!癈PU 仍然是非常好的中流砥柱,也很靈活?!碑?dāng)談到 CPU 上運(yùn)行的軟件程序時(shí),Woo 表示,“不一定非要寫成向量化代碼?!?/p>
GPU 能夠?qū)崿F(xiàn)更好的圖形接口,他們比通用 CPU 更具有針對(duì)性。FPGA 則能覆蓋多個(gè)市場(chǎng),最近它們甚至開始進(jìn)入數(shù)據(jù)中心和超級(jí)計(jì)算機(jī)領(lǐng)域。
“人們編寫的代碼所涉及的領(lǐng)域每個(gè)月都會(huì)發(fā)生變化,而且這種變化以各自的方式在加速,”Woo 表示??芍貜?fù)編程和可重新配置的 FPGA 可以適配用于各種算法,“不用經(jīng)歷設(shè)計(jì) ASIC 帶來(lái)的痛苦?!?/p>
ARM 公司 CPU 事業(yè)部技術(shù)總監(jiān) Peter Greenhalgh 表示,CPU 代表著“芯片世界強(qiáng)大有力的一面?!痹诹硪环矫?,他指出,對(duì)于高帶寬的計(jì)算,“GPU 的表現(xiàn)非常好。”
可編程能力雖好,但并非處處通吃
FPGA 介于入 CPU 和 GPU 之間,這使得它們很適合用于工業(yè)、醫(yī)療和軍事設(shè)備,在這些領(lǐng)域中 FPGA 發(fā)展勢(shì)頭良好,但即使在那里,F(xiàn)PGA 也并非通吃。
萊迪思半導(dǎo)體公司的工業(yè)和汽車事業(yè)部產(chǎn)品營(yíng)銷總監(jiān) Deepak Boppana 指出,萊迪思?xì)v史上是一個(gè) FPGA 公司?!敖裉欤覀儞碛懈鼜V泛的產(chǎn)品組合,”他說(shuō),并特別指出增加了專用標(biāo)準(zhǔn)器件(ASSP)這一產(chǎn)品品類。
“我們和其它 FPGA 公司不同,”Boppana 繼續(xù)說(shuō)道。萊迪思的 FPGA 可以提供“更低的功耗、更低的成本,以及不同形式的外形?!?/p>
根據(jù) Boppana 的說(shuō)辭,萊迪思特別重視將可連接性加入到其產(chǎn)品線中。通過收購(gòu) Silicon Image 公司,萊迪思現(xiàn)在擁有針對(duì) HDMI 應(yīng)用和其他用途的 ASSP。該公司目前提供用于攝像頭和顯示器的 CrossLink 橋接芯片,該芯片是一顆可編程 ASSP,可在低于 10 毫瓦的功耗下運(yùn)行,同時(shí)以每秒 12Gbits 的速度支持 4K 超高清視頻。
Boppana 表示,該芯片集成了很多硬 IP,并擁有 FPGA 的靈活性。CPU 和 GPU 通常不具備正確類型的接口。“CPU 能很好地實(shí)現(xiàn)多路控制,但一般都不具備多路數(shù)據(jù)接口?!?/p>
英特爾收購(gòu) Altera 的行為表明了“采用 FPGA 對(duì) CPU 進(jìn)行加速的趨勢(shì)”,他說(shuō)。目前的趨勢(shì)是將 CPU 和 FPGA 搭配或集成在一起用于高性能計(jì)算應(yīng)用。
Lattice 則另辟蹊徑,“不針對(duì)高負(fù)荷計(jì)算加速,”Boppana 說(shuō)?!拔覀冏龅氖怯糜诘投耸袌?chǎng)的更小的東西?!痹摴镜?FPGA 主要針對(duì)消費(fèi)電子和物聯(lián)網(wǎng),正好是云計(jì)算等大型重度計(jì)算的反方向。對(duì)客戶來(lái)說(shuō),選擇芯片類型時(shí)會(huì)“歸結(jié)到他們的具體要求”,Boppana 總結(jié)道。因此,他們可以選擇 CPU 以獲得最佳性能?!爱?dāng)需要滿足多種性能水平,并具備廣泛的接口時(shí),F(xiàn)PGA 開始變得更具吸引力。很多客戶都會(huì)同時(shí)使用 FPGA 和 CPU?!?/p>
Cadence 公司 IP 事業(yè)部首席技術(shù)官 Chris Rowen 說(shuō)道,許多現(xiàn)成的硅解決方案,如 ASSP 和 SoC,被應(yīng)用到了很多硬件平臺(tái)上?!耙话闶怯迷诘褪袌?chǎng)容量和高附加值這些情形中,”他指出?!艾F(xiàn)成的硅方案比你能想到或負(fù)擔(dān)得起的更通用?!?/p>
Rowen 補(bǔ)充說(shuō)。“對(duì)很多這些應(yīng)用,有多種針對(duì)特定應(yīng)用的產(chǎn)品,這樣的手機(jī)應(yīng)用處理器或那樣的手機(jī)應(yīng)用處理器。”
所以,設(shè)計(jì)者應(yīng)該選擇 CPU、GPU 還是 FPGA 呢?“正確的答案是,在很多情況下,一樣也不選,要選 ASSP?!盧owen 說(shuō)道?!澳阈枰环N混合芯片或聚合器件?!?/p>
業(yè)界已經(jīng)習(xí)慣于在板級(jí)進(jìn)行集成,Rowen 說(shuō)。“板級(jí)集成在一些情形下是必須的,”他說(shuō)。這種選擇的缺點(diǎn)是“成本相對(duì)高價(jià)、功耗也較高。”
FPGA 可以填補(bǔ)對(duì)小批量 ASSP 的需求,CPU 架構(gòu)則可以與 FPGA 互補(bǔ)。對(duì)于 GPU,“則取決于你想要進(jìn)入哪個(gè)細(xì)分市場(chǎng)?!边@方面主要包括兩大類顯卡:用于游戲和其它應(yīng)用的高性能顯卡,以及更多更傾向于嵌入式類型的產(chǎn)品,比如汽車和消費(fèi)級(jí)產(chǎn)品,功率預(yù)算介于 5 瓦和 10 瓦時(shí)間。“10 到 20 年前存在 CPU 市場(chǎng),然后它也發(fā)生了變化,現(xiàn)在主要針對(duì)服務(wù)器或 Windows PC。已經(jīng)不是很久之前我可以使用通用芯片的時(shí)代了,現(xiàn)在已經(jīng)不存在通用 CPU 芯片了?!?/p>
簡(jiǎn)單來(lái)說(shuō),處理器市場(chǎng)都已經(jīng)被定向了,這反映在不同的應(yīng)用上。在高性能計(jì)算或超級(jí)計(jì)算應(yīng)用中,GPU 通常被用在基礎(chǔ)設(shè)施的配置上,IO 則用于系統(tǒng)的擴(kuò)展,他說(shuō)。
Rowen 提到了英特爾和 Altera 的合并?!凹铀倨鹘壎ǖ交A(chǔ)設(shè)施上,這是 FPGA 可以發(fā)揮作用的地方,”他說(shuō),“英特爾和 Altera 的團(tuán)隊(duì)正在通力協(xié)作,我肯定能夠看到英特爾服務(wù)器處理器芯片的優(yōu)化越來(lái)越好,并且和 FPGA 一起在服務(wù)器中服役?!?/p>
在英特爾的高性能計(jì)算戰(zhàn)略中,Knights Landing 處理器是非常關(guān)鍵的一個(gè)因素。
“在大批量的應(yīng)用中,使用 ASIC 是個(gè)非常常見的選擇,而在一些產(chǎn)量要求并不高但需要一些特定功能的應(yīng)用中,ASIC 也有用武之地?!彼f(shuō)。在這種應(yīng)用中選用 ASIC 的缺點(diǎn)是,為了滿足特定需求而不得不承受 ASIC 的高成本。公司始終都需要計(jì)算盈虧平衡點(diǎn)。Rowen 指出,有一些可以替代 FPGA 的方案,比如由 eASIC 公司提供的金屬可編程芯片。“也許,你可以轉(zhuǎn)用一次性工程費(fèi)用低且出貨量大的 ASIC?!?/p>
從 Rowen 的角度來(lái)看,設(shè)計(jì)路線為從 FPGA 到中低批量 ASIC,再到大批量 ASIC,最后到客戶自有工具(COT)。
那么,到底該選擇什么呢:CPU,GPU,F(xiàn)PGA,ASSP,ASIC?最好的答案依然是:這要看情況。
更多有關(guān) CPU 的資訊, 歡迎訪問 與非網(wǎng) CPU 專區(qū)
與非網(wǎng)編譯,未經(jīng)許可,不得轉(zhuǎn)載!
?
?