6月11日-13日,以“開源賦能,普惠未來”為主題的2023開放原子全球開源峰會在北京舉辦。張先軼博士受邀在開源工業(yè)軟件分論壇作《高性能數學庫與異構計算軟件棧進展》主題報告。
時間:2023/6/12
報告簡介
在報告中,張先軼博士首先以CUDA和OpenCL為例,強調了開源未必能勝過閉源,能否構建一個良好的軟硬件生態(tài)系統才是成功的關鍵。目前在計算領域,構建得比較成熟的函數庫有Intel的MKL、ARM的APL和ACL、NVIDA的CUDA-X等。而國內的計算芯片雖然在科學計算領域已經有了一定的積累,但大多都是各成一家或者向某家靠攏,沒有設立統一的接口和標準,大環(huán)境不夠成熟。
為了解決這一問題,澎峰提出“參與開源,共建生態(tài),立足國內,走向國際”的口號,以萬萬開源工作者對開源社區(qū)的貢獻為基礎,共同建立良好的開源軟件生態(tài),并以開源生態(tài)滋養(yǎng)閉源產品。
為此,澎峰做了以下工作:
1.PerfXAPI異構計算軟件棧
PerfXAPI 圍繞應用側需求,旨在創(chuàng)建一個開放、基于開源標準的跨架構API編程模型,在面對大量跨各種架構的硬件和復雜工作負載場景時簡化開發(fā)工作。
優(yōu)勢:1)支持多種異構設備;2)統一API調用接口;3)高性能。
2.PerfMPL高性能數學庫
包含Openblas、Libm/PerfMath、BLAS、LAPACK、FTT等基本庫。目前已有PerfMPL for ARM、PerfMPL for RISC-V(RVCL)的標準版本。支持為EDA、CFD等應用領域提供定向優(yōu)化,支持為國產GPU/NPU廠商提供對標cuBLAS、cuFFT、cuMath等的定制服務。
其中,OpenFFT/PerfFFT是完全由澎峰自主研發(fā),不基于FFTW,版權協議可控的FFT庫,并支持X86、ARM、RISC-V等主流處理器,相對其他FFT庫性能方面均有提升。
優(yōu)勢:1)性能對標國際;2)一致精度;3)安全、可靠、穩(wěn)定。
3.PerfXPy 新一代科學計算軟件
PerfXPy 是一個面向科學家和算法工程師的高性能Python計算平臺,兼顧易用性與高性能,支持ARM、RISC-V 通用算力平臺和異構加速平臺。并有單機版(免費)、SaaS版本、集群版本等多個版本。