日前,在“Wave Summit 2022深度學習開發(fā)者峰會”上,英特爾與百度分享了人工智能在各領域應用的創(chuàng)新突破,并展現了如何通過oneAPI、OpenVINO等軟件優(yōu)化及人工智能全棧硬件產品組合,助力最新版飛槳框架v2.3版本實現模型性能的優(yōu)化升級和在多個垂直領域的實踐應用。同時,英特爾聯合百度發(fā)布了“飛槳硬件生態(tài)伙伴共創(chuàng)計劃”,共同打造軟硬一體人工智能生態(tài)。
會后,英特爾高級首席工程師、物聯網事業(yè)部中國區(qū)首席技術官張宇,百度飛槳總架構師于佃海,接受了<與非網>等媒體專訪。
解決AI三大環(huán)節(jié)痛點問題
據了解,今年3月,英特爾OpenVINO2022.1版本進行了近三年半以來的最大升級,將以更新和更簡潔的API、更廣泛的模型支持、出色的可移植性與性能,與飛槳共同為開發(fā)者帶來更好的體驗,雙方將通過全方位的合作,涵蓋完整的AI模型開發(fā)和優(yōu)化部署階段,解決開發(fā)者在不同階段所面臨的痛點問題。
最新的OpenVINO 2022.1版本進一步加大了對飛槳的支持力度。之前飛槳模型需要經過ONNX轉化才可以被OpenVINO識別和使用,現在則可以直接把飛槳模型轉變?yōu)镺penVINO內部的中間表示,再部署到硬件平臺上。從而幫助開發(fā)者減少中間環(huán)節(jié)、避免了精度下降的風險,能夠為開發(fā)者帶來更準確、更高效的結果。
大模型支持也是一個痛點,張宇指出,尤其是在邊緣部署人工智能的情況下。由于邊緣設備的算力和存儲相對有限,因此在邊緣進行大模型支持時,通常需要進行網絡壓縮,盡可能在保證精度的情況下,對網絡模型結構進行簡化。針對剪枝、量化、低精度等技術,OpenVINO提供越來越豐富、完備的支持,可以使一些大模型部署在邊緣進行推理操作。
于佃海談到,百度在大模型領域已經形成了從開發(fā)、訓練到部署的全流程技術體系和解決方案。在訓練階段,大模型計算量非常大,所以需要高效的分布式訓練支撐。百度飛槳采用端到端自適應的分布式架構,能夠自動感知硬件平臺的特性,并兼容處理廣泛的模型結構,實現高效訓練。在部署環(huán)節(jié),則首先運用模型壓縮技術,解耦訓練代碼,實現硬件自動感知能力,達到更好的量化和剪枝等壓縮效果;由于大模型的范疇比較廣,有的大模型壓縮之后單機就可以處理,有的超大模型對單機挑戰(zhàn)比較大,因此需要通過自適應分布式計算遷移到推理環(huán)節(jié),實現更好的推理部署。
談及百度和英特爾在大模型方面的合作,于佃海指出,首先是基于oneAPI在英特爾CPU上的基礎性能優(yōu)化工作,英特爾至強可擴展處理器,是唯一具有內置AI加速功能的數據中心級CPU,飛槳充分利用其搭載的“高級矢量擴展指令集AVX-512、深度學習加速技術DL-Boost等來實現計算加速。其次在推理方面,充分發(fā)揮英特爾產品在低精度計算、量化計算方面的特色能力來提升推理速度,以及通過飛槳+OpenVINO來共建部署生態(tài)。此外,安全加密相關的SGX、有助于構建多級參數存儲機制的持久內存AEP,都將有助于大模型的訓練和部署應用。
分子動力學領域合作,AI+科學的創(chuàng)新探索
在AI科學領域,英特爾和百度在分子動力學領域共同展開研發(fā)。雙方工程師基于飛槳框架從零到一打通了訓練推理完整流程,并基于英特爾oneAPI和第三代至強可擴展處理器,利用深度學習加速技術AVX512指令集優(yōu)化了分子動力學模型的性能,同時支持傳統(tǒng)仿真軟件LAMMPS,全面滿足研究實驗需求。
于佃海表示,分子動力學是AI+科學取得突破的一個領域,雙方希望共同打造世界領先的高性能解決方案,讓計算大幅度提速、性能更加優(yōu)化。
他進一步解釋,相對于傳統(tǒng)AI應用領域,AI+科學面臨的挑戰(zhàn)差異較大。主要體現在以下三方面:
一是AI技術與科學原理或物理模型有機結合的挑戰(zhàn)。即:如何在深度學習中實現與科學規(guī)律的更好融合?因為以深度學習為代表的AI方法主要是數據驅動,而AI+科學,并不只是包括數據驅動的方法。純數據驅動更適合定義比較清晰的、數據積累比較豐富的領域,比如AlphaFold蛋白質折疊預測等領域,當然即使這種領域也要深度融合對應科學知識。而科學更追求基本原理的突破,如果只考慮數據驅動是有一定局限的。于佃海表示,雙方希望將數據驅動方法和模型驅動方法進行更深度的融合。
二是對通用計算平臺和深度學習框架的挑戰(zhàn),只有平臺化才能真正發(fā)揮AI+科學的優(yōu)勢。于佃海指出,原有的深度學習框架多是面向傳統(tǒng)AI任務而設計的,但AI科學需要框架具備更高階的自動微分機制。自動微分是深度學習框架的核心功能,普通范疇的AI方法只需要一階導數,而科學計算中微分方程會遇到高階導數,因此框架需要具備高階自動微分的能力,同時還要保持計算的高性能。同時,也需要AI框架和傳統(tǒng)科學計算仿真軟件進行打通,比如飛槳和英特爾的合作工作就包括與傳統(tǒng)的分子動力學模擬軟件LAMMPS的打通。
第三是產學研用的打通。AI科學涉及理論研究、實驗研究以及實際產業(yè)的應用,涵蓋了AI對復雜計算的處理能力,科學原理研究以及和超算能力的結合,綜合挑戰(zhàn)較大。因此需要匯集各方力量,充分建立高校、科研院所和企業(yè)的合作關系,通過軟硬協(xié)同打造高性能計算平臺,打通理論實驗和產業(yè)應用的通路。
張宇表示,英特爾始終秉持科技向善的發(fā)展理念,在人工智能領域也是如此。分子動力學有著廣泛應用,除了像材料研發(fā),還有一個重要的應用場景是在制藥領域,在這一方向的持續(xù)研究,無疑會為人類長期的健康帶來福祉。他坦言,挑戰(zhàn)確實存在,比如模型分析、數據處理等工作,對平臺的要求是綜合的,不僅要求算力,存儲也受到很大挑戰(zhàn)。不過,這些正是英特爾的優(yōu)勢所在,產品組合涵蓋計算、存儲和通訊等多方面,可以搭建一個綜合平臺滿足項目需求。
他強調,整體項目的成功,最終離不開產業(yè)鏈各環(huán)節(jié)合作伙伴的共同努力。百度在人工智能框架、以及對垂直行業(yè)的理解和認知方面有優(yōu)勢,雙方甚至多方強強聯合,才有望解決業(yè)界當前所面臨的多重挑戰(zhàn)。
據了解,雙方在分子動力學領域合作的產品已開放測試,以期用于材料研發(fā)工作,助力深度學習技術在人工智能+科學計算領域的應用,并為人工智能框架與傳統(tǒng)科學計算相結合的持續(xù)創(chuàng)新探索奠定基礎。
加速推動人工智能普及
深度學習框架和芯片共同構成了人工智能的基礎設施。百度飛槳是國內首個自主研發(fā)、功能豐富的產業(yè)級開源開放深度學習平臺,英特爾致力于通過一系列跨計算的CPU、FPGA、GPU及專用的人工智能加速器(Habana Gaudi)提供技術基礎,并通過全棧式硬件產品組合來滿足用戶不同場景的使用需要。近年來,百度飛槳與包括英特爾在內的主流芯片廠商進行深度適配和融合創(chuàng)新,形成了軟硬協(xié)同的優(yōu)勢。
萬物智能化時代,人工智能正在深刻地變革各行各業(yè),并有望在未來改善每個人的生活?;陂L期深度合作的基礎,英特爾和百度將繼續(xù)深耕產品技術創(chuàng)新,豐富軟件優(yōu)化方案,助力開發(fā)者更便捷地開發(fā)和部署人工智能,大幅降低人工智能技術的應用門檻,加速人工智能在傳統(tǒng)行業(yè)和新興行業(yè)的創(chuàng)新與落地。