今年,首款商用現(xiàn)場可編程門陣列(FPGA)迎來問世40周年。 1985年6月,賽靈思(現(xiàn)為 AMD 的一部分)聯(lián)合創(chuàng)始人Ross Freeman發(fā)明了XC2064芯片,以“硬件可編程”理念開啟了整個(gè)半導(dǎo)體設(shè)計(jì)的新篇章。
FPGA 對(duì)市場的影響是驚人的,催生了一個(gè)價(jià)值超過 100 億美元的產(chǎn)業(yè),推動(dòng)了賽靈思、Altera、Lattice、Microchip等企業(yè)的發(fā)展。2022年,賽靈思被AMD收購后,更是成為其自適應(yīng)和嵌入式計(jì)算事業(yè)部(AECG)的重要支柱。
過去四十年來,AMD已向不同細(xì)分市場的超過 7000 家客戶交付了超過30億顆FPGA和自適應(yīng)SoC(結(jié)合FPGA架構(gòu)與片上系統(tǒng)和其他處理引擎的器件)。事實(shí)上,AMD已連續(xù)25年位居可編程邏輯市場份額的領(lǐng)先地位。
AMD產(chǎn)品、軟件和解決方案公司副總裁Kirk Saban是這一歷程的親歷者,他深耕FPGA領(lǐng)域已經(jīng)超過25年。日前,在FPGA創(chuàng)新40周年媒體溝通會(huì)上,他指出了現(xiàn)代FPGA的能力躍遷:“40年間,我們從基礎(chǔ)LUT查找表演進(jìn)至嵌入式處理、高速收發(fā)器、硬IP的融合,得以駕馭高性能復(fù)雜任務(wù),F(xiàn)PGA已成長為支撐實(shí)時(shí)計(jì)算的核心基礎(chǔ)設(shè)施?!?/p>
AMD產(chǎn)品、軟件和解決方案公司副總裁? ? Kirk Saban
AI浪潮下的FPGA定位:邊緣AI的不二之選
FPGA 給半導(dǎo)體產(chǎn)業(yè)帶來的影響是深遠(yuǎn)的,它為工程師提供了隨時(shí)更改芯片設(shè)計(jì)的自由和靈活性,以在一天內(nèi)開發(fā)和設(shè)計(jì)出定制芯片的能力。FPGA 還助力開創(chuàng)了“無晶圓廠”商業(yè)模式,徹底改變了整個(gè)半導(dǎo)體行業(yè)。通過消除對(duì)定制掩膜加工和相關(guān)的非經(jīng)常性工程成本的需求,F(xiàn)PGA 助力加速硬件創(chuàng)新,證明企業(yè)不需要擁有晶圓代工廠來打造突破性的硬件。
進(jìn)入AI時(shí)代,F(xiàn)PGA將會(huì)扮演什么角色?Kirk Saban表示,F(xiàn)PGA是數(shù)據(jù)中心加速、邊緣AI的不二之選,尤其是在實(shí)時(shí)處理、實(shí)時(shí)決策的剛性需求下。在邊緣計(jì)算與AI領(lǐng)域,F(xiàn)PGA憑借實(shí)時(shí)處理能力和強(qiáng)自適應(yīng)性占據(jù)獨(dú)特優(yōu)勢,既能滿足工業(yè)控制、自動(dòng)駕駛等低時(shí)延、無法云上滯后處理的任務(wù)需求,又能根據(jù)不同應(yīng)用場景調(diào)整,動(dòng)態(tài)調(diào)整不同尺寸、功耗、價(jià)格及性能的平衡點(diǎn)。
隨著越來越多的邊緣側(cè)智能器件實(shí)現(xiàn)部署,Kirk Saban認(rèn)為,未來會(huì)有越來越多設(shè)備實(shí)現(xiàn)“萬物互聯(lián)”,而FPGA有著非常巨大的潛力和機(jī)會(huì)在這個(gè)領(lǐng)域繼續(xù)發(fā)揮作用,這對(duì)FPGA來說將是一個(gè)非常重要的節(jié)點(diǎn)。
“FPGA擁有靈活的現(xiàn)場可編程、可升級(jí)能力,這是一個(gè)關(guān)鍵的價(jià)值主張”,他解釋說,也正是得益于此,F(xiàn)PGA在邊緣側(cè)實(shí)現(xiàn)“AI算力按需部署”時(shí)將更具優(yōu)勢。
例如在醫(yī)療遠(yuǎn)程手術(shù)中,F(xiàn)PGA可同時(shí)處理影像實(shí)時(shí)渲染與機(jī)械臂控制,確保低時(shí)延與高可靠性;在工業(yè)物聯(lián)網(wǎng)中,它能適配不同傳感器協(xié)議,并根據(jù)生產(chǎn)流程變化重新配置數(shù)據(jù)處理路徑;在汽車領(lǐng)域,現(xiàn)代新能源汽車如同“車輪上的電腦”,從ADAS到車載娛樂系統(tǒng),F(xiàn)PGA正在成為電子架構(gòu)中的關(guān)鍵節(jié)點(diǎn)。
為此,AMD在產(chǎn)品矩陣中既布局了最低功耗的Spartan UltraScale+,也有高性能的Virtex系列,可滿足包括數(shù)據(jù)中心、汽車、測試測量與仿真、工業(yè)與視覺、醫(yī)療和科學(xué)、航空航天、廣播與專業(yè)音視頻在內(nèi)的全場景需求。與此同時(shí),AMD還有非常廣泛的針對(duì)不同的功耗和性能需求的廣泛產(chǎn)品。當(dāng)客戶選擇了相應(yīng)器件之后,如果還需要嵌入式的處理能力,就可以選擇“Zynq 7000”和“Zynq MPSoC”產(chǎn)品線。
未來迭代:Chiplet與異構(gòu)集成的進(jìn)化,構(gòu)建一體化AI軟件框架
FPGA未來的技術(shù)將如何演進(jìn)?
Kirk Saban指出,首先是進(jìn)一步SoC化,整合更多硬核IP 如以太網(wǎng)核、安全核等;其次,Chiplet是一個(gè)重要方向,這方面AMD繼承了2011年起源于臺(tái)積電Virtex-7的創(chuàng)新基因,將其廣泛應(yīng)用于現(xiàn)代GPU、FPGA中。這種技術(shù)路線不僅能降低先進(jìn)制程的成本壓力,更能通過異構(gòu)集成釋放FPGA的靈活計(jì)算潛力。
在開發(fā)工具方面,Vivado、Vitis將持續(xù)更迭,不斷提升產(chǎn)品易用性,降低開發(fā)門檻、提高開發(fā)效率。
其中,Vivado軟件側(cè)重于硬件開發(fā)人員,通過高層次綜合、機(jī)器學(xué)習(xí)優(yōu)化和無縫IP核集成等高級(jí)功能,支持開發(fā)人員簡化工作流程、縮短開發(fā)周期并實(shí)現(xiàn)更高的性能。
面向軟件開發(fā)流程的Vitis開發(fā)環(huán)境帶來了預(yù)優(yōu)化的工具和抽象層,以助力加速AI推理。最新版本(2024.2)包含多項(xiàng)新功能,例如,面向嵌入式C/C++設(shè)計(jì)的獨(dú)立工具,以及簡化搭載AI引擎的AMD Versal自適應(yīng)SoC的使用的增強(qiáng)功能,算法工程師無需深入硬件細(xì)節(jié)即可開發(fā)相關(guān)應(yīng)用。
“這些工具形成了很多的合力,我們致力于持續(xù)投入,令用戶工作更加高效,同時(shí)能夠利用新的和日益演進(jìn)的數(shù)據(jù)類型與AI模型。”Kirk Saban認(rèn)為,Vivado與Vitis雙工具鏈體系實(shí)現(xiàn)了與AMD CPU、GPU的軟件棧協(xié)同,從而能夠在一體化的AI軟件框架之下進(jìn)行開發(fā),這可以更好地助力客戶在AMD硬件上訓(xùn)練模型和進(jìn)行推理部署。
構(gòu)建一體化軟件框架的主要意義是什么?在他看來,核心優(yōu)勢在于將適配的神經(jīng)網(wǎng)絡(luò)處理器與可編程邏輯塊深度整合,通過Versal系列產(chǎn)品的AI引擎硬件及靈活邏輯架構(gòu),實(shí)現(xiàn)NPU與各類模型的精準(zhǔn)匹配,為客戶提供兼具算力效率與架構(gòu)靈活性的解決方案。
全棧優(yōu)勢下,F(xiàn)PGA如何全方位重塑產(chǎn)業(yè)邏輯?
2022年2月14日,AMD順利完成了對(duì)賽靈思的并購,并由此構(gòu)建了包括CPU、GPU、FPGA在內(nèi)的多元化的計(jì)算產(chǎn)品矩陣。這種全棧計(jì)算能力使AMD能夠精準(zhǔn)匹配不同市場的差異化需求——從云端大規(guī)模訓(xùn)練到邊緣實(shí)時(shí)推理,從高性能計(jì)算到低功耗應(yīng)用,AMD均可憑借豐富的產(chǎn)品組合,為客戶提供適配其算力需求的最優(yōu)芯片解決方案,助力解決復(fù)雜計(jì)算場景下的技術(shù)挑戰(zhàn)。
在這一背景下,F(xiàn)PGA也在異構(gòu)組合方案中實(shí)現(xiàn)了產(chǎn)業(yè)價(jià)值重定位——憑借自適應(yīng)計(jì)算能力,在算法快速迭代的AI時(shí)代彌合硬件代溝。面臨AI工作負(fù)載的爆發(fā),AMD更為重視AI軟件的能力,不斷開發(fā)AI編譯器技術(shù)應(yīng)用于FPGA中。并且,AMD在軟件領(lǐng)域的投資在不斷加大,這包括一些重要的并購(例如Mipsology),不斷地打磨和增強(qiáng)AI軟件生態(tài)的建設(shè),充分釋放硬件潛能。
“我們已經(jīng)在探索AI助理在開發(fā)工具中的應(yīng)用,這將是提升生產(chǎn)力的下一個(gè)突破口?!盞irk Saban透露,AMD正在將生成式AI技術(shù)融入FPGA開發(fā)流程,讓復(fù)雜的硬件編程變得更加智能。
在生態(tài)建設(shè)上,AMD同樣呈現(xiàn)出開放姿態(tài)。通過與Yocto項(xiàng)目合作、向開源社區(qū)貢獻(xiàn)源代碼,以及推動(dòng)ROCm在GPU軟件領(lǐng)域的開源生態(tài),AMD正在構(gòu)建跨硬件平臺(tái)的開發(fā)者生態(tài)。
“開源不僅能加速開發(fā)效率,更能確保我們的工具鏈具備世界級(jí)的魯棒性?!盞irk Saban強(qiáng)調(diào),這種策略在邊緣智能時(shí)代尤為重要——當(dāng)開發(fā)者需要快速適配傳感器接口、通信協(xié)議等定制化需求時(shí),開源社區(qū)的資源能大幅縮短創(chuàng)新周期。
隨著FPGA、CPU、GPU、ASIC等多種計(jì)算引擎被用于邊緣智能場景,AMD將如何幫助開發(fā)者充分利用底層硬件的功能?Kirk Saban回應(yīng)稱,“這其實(shí)就需要考慮系統(tǒng)級(jí)的設(shè)計(jì),以及如何充分利用器件所具有的存儲(chǔ)架構(gòu)來實(shí)現(xiàn)最大的潛能。”而FPGA非常獨(dú)特的亮點(diǎn)之一,就是它擁有獨(dú)特的“定制化存儲(chǔ)架構(gòu)”,使得客戶能夠在該架構(gòu)基礎(chǔ)上進(jìn)行差異化設(shè)計(jì)。同時(shí),合適的軟件開發(fā)工具、庫、輔助設(shè)計(jì)環(huán)境也很關(guān)鍵,客戶能夠?qū)⒆约旱哪P驮贏MD硬件基礎(chǔ)之上進(jìn)行編譯。
寫在最后
四十年技術(shù)周期更迭,F(xiàn)PGA從實(shí)驗(yàn)室的革命性構(gòu)想,成長為智能世界的關(guān)鍵支柱。究其穿越周期的核心密碼,其實(shí)仍藏于“硬件可編程”的原始基因中。站在自適應(yīng)計(jì)算與邊緣AI爆發(fā)的拐點(diǎn),這顆曾改變ASIC游戲規(guī)則的芯片,正以動(dòng)態(tài)重構(gòu)之力開啟AI時(shí)代的新征程。
當(dāng)算力需求從數(shù)據(jù)中心涌向邊緣,當(dāng)AI模型迭代速度超越摩爾定律,唯有可動(dòng)態(tài)適應(yīng)和重構(gòu)的架構(gòu)能化解“算法進(jìn)化與硬件固化”的根本矛盾。未來,F(xiàn)PGA靈活的計(jì)算能力將繼續(xù)革新智能產(chǎn)業(yè),提供與時(shí)俱進(jìn)的硬件底座,成為各行各業(yè)都不可或缺的基礎(chǔ)設(shè)施。