當(dāng)今越來越多的行業(yè)朝著智能化方向轉(zhuǎn)移,擁有百年歷史的汽車行業(yè)也不例外。汽車制造商、供應(yīng)商、初創(chuàng)公司等正接受著這股浪潮的洗禮,向自動駕駛時代前進(jìn)。
蔚來是一家全球化的智能電動汽車公司,于 2014 年 11 月 25 日正式成立。蔚來致力于通過提供高性能的智能電動汽車與極致用戶體驗,為用戶創(chuàng)造愉悅的生活方式。蔚來采用了?NVIDIA DRIVE Orin 系統(tǒng)級芯片構(gòu)建自主研發(fā)的新一代自動駕駛平臺,其在智能電動汽車領(lǐng)域始終保持領(lǐng)先的自動駕駛研發(fā)水平,滿足軟件定義車輛的 AI 基礎(chǔ)架構(gòu)和車內(nèi)計算需求。
?
圖片來源于蔚來
自動駕駛面臨算力挑戰(zhàn)
自動駕駛汽車的開發(fā)是一項需要大量加速計算基礎(chǔ)架構(gòu)的計算密集型工作。為了在更多場景中為用戶提供極致的駕乘體驗,完成更高等級的自動駕駛算法落地,軟件定義汽車需要實現(xiàn)冗余、配置多種高分辨率傳感器并應(yīng)用深度神經(jīng)網(wǎng)絡(luò)。這些因素都將帶來對強大計算能力的需求,以便能夠處理所有 AI 工作負(fù)載。
另外,研發(fā)所用的數(shù)據(jù)采集車每年會產(chǎn)生百 PB 級別的數(shù)據(jù)以及幾十億張圖像,量產(chǎn)車也需要回流海量的道路數(shù)據(jù),用于優(yōu)化算法模型,這意味著車企的數(shù)據(jù)中心需要具備回流、篩選和標(biāo)注海量用于 AI 模型訓(xùn)練的數(shù)據(jù)的能力。
成功的規(guī)?;夹g(shù)應(yīng)用離不開穩(wěn)健的技術(shù)基礎(chǔ)架構(gòu),包括覆蓋全場景鏈路的人工智能平臺和大規(guī)模機器學(xué)習(xí)系統(tǒng)在內(nèi),蔚來汽車采用NVIDIA GPU自主研發(fā)了一整套自動駕駛基礎(chǔ)架構(gòu)體系,支持復(fù)雜的深度學(xué)習(xí)模型迭代以及全流程快速迭代,為自動駕駛算法閉環(huán)提供堅實支撐。
NVIDIA 賦能超級計算機
蔚來的超級計算機由 NVIDIA HGX A100 8-GPU 和 NVIDIA Mellanox InfiniBand ConnectX-6 構(gòu)建。超級計算機集群包括超級計算機和搭配 NVIDIA Mellanox InfiniBand ConnectX-6 的高性能 NVME SSD 服務(wù)器,通過 NVIDIA Mellanox InfiniBand 高速網(wǎng)絡(luò)相連,且規(guī)模不斷擴大。
通過合理使用 NVIDIA Multi-Instance GPU,使得算法工程師在開發(fā)過程中的工作效率和集群資源利用率得到了巨大提升。同時,蔚來在 NVIDIA NVLink 和 NVIDIA Mellanox InfiniBand 的基礎(chǔ)上構(gòu)建了支持多卡和多機訓(xùn)練的深度學(xué)習(xí)訓(xùn)練框架,使用 NVIDIA Mellanox InfiniBand 和基于 NVIDIA Mellanox InfiniBand 的 RDMA 技術(shù),構(gòu)建了分布式的高性能文件讀取加速套件。在數(shù)據(jù)驅(qū)動應(yīng)用的場景下,使得大量的深度學(xué)習(xí)訓(xùn)練數(shù)據(jù)能夠以高達(dá) 200 Gbps 的超高速率零拷貝傳輸至超級計算機內(nèi)存或 NVIDIA A100 顯存中,進(jìn)一步穩(wěn)固了自動駕駛平臺的基礎(chǔ)服務(wù)架構(gòu)。
另外,每個端上配備 4 顆?NVIDIA DRIVE Orin 系統(tǒng)級芯片,具備 8096 個 CUDA 核心,為量產(chǎn)車提供了前所未有的超 1000 TOPS 算力。DRIVE Orin?系統(tǒng)級芯片集成了 NVIDIA Ampere 架構(gòu)和 Arm Hercules CPU 內(nèi)核以及全新深度學(xué)習(xí)和計算機視覺加速器,總計每秒可運行超過 254 萬億次計算,幾乎是 NVIDIA?上一代 Xavier 系統(tǒng)級芯片性能的 7 倍。Orin?可處理在自動駕駛汽車內(nèi)同時運行的大量應(yīng)用和深度神經(jīng)網(wǎng)絡(luò),并且達(dá)到了 ISO 26262 ASIL-D 等系統(tǒng)安全標(biāo)準(zhǔn)。
借助?DRIVE Orin?強大的性能優(yōu)勢,蔚來能夠為安全的自動駕駛功能提供所必需的冗余和靈活性,讓駕乘體驗安心舒適。
蔚來的首款轎車ET7 是具備自動駕駛能力的智能電動旗艦轎車。ET7 應(yīng)用了最新的蔚來自動駕駛技術(shù)NAD(NIO Autonomous Driving)。蔚來超算平臺Adam搭載四顆NVIDIA DRIVE Orin,算力高達(dá)1016 TOPS,是迄今為止最強大的量產(chǎn)移動計算平臺。蔚來建立了全棧自動駕駛技術(shù)能力,將逐步實現(xiàn)高速、城區(qū)、停車、加電等場景下輕松安全的點到點自動駕駛體驗。
加速自動駕駛產(chǎn)品落地
NVIDIA HGX A100 是適用于龐大數(shù)據(jù)集、復(fù)雜模型等 AI 場景的加速服務(wù)器平臺。HGX A100 整合 NVIDIA Ampere GPU、NVIDIA NVLink、NVIDIA Mellanox InfiniBand 網(wǎng)絡(luò)及在 NGC(NVIDIA GPU Cloud)中經(jīng)全面優(yōu)化的 NVIDIA AI 軟件堆棧。同時,它樹立了新的計算密度標(biāo)桿,將 5 PETAFLOPS 的 AI 性能濃縮,并用一個平臺取代了各種 AI 工作負(fù)載的傳統(tǒng)孤島式基礎(chǔ)架構(gòu)。借助 HGX A100,蔚來以縱向擴展和橫向擴展方式自由搭建并應(yīng)用 AI 平臺,也讓蔚來的模型開發(fā)效率提高了 20 倍,幫助蔚來更快的落地自動駕駛產(chǎn)品,向更新更快的架構(gòu)演進(jìn)。
另一方面,NVIDIA DGX POD 參考架構(gòu)結(jié)合 NVIDIA 加速計算架構(gòu)、Mellanox 網(wǎng)絡(luò)架構(gòu)和系統(tǒng)管理軟件?;诖?,蔚來實現(xiàn)了提供使超級計算能力大眾化的解決方案,使超級計算能力變得易于訪問、安裝和管理,從而滿足自動駕駛復(fù)雜架構(gòu)的需求。
高性能 AI 計算是蔚來汽車自動駕駛技術(shù)的重要組成部分,在?NVIDIA?DRIVE?端到端解決方案的強力支持下,蔚來可以通過龐大的道路實際數(shù)據(jù)來演進(jìn)設(shè)計新的自動駕駛功能,持續(xù)為車主提供安心的駕駛體驗。
NVIDIA?致力于提供領(lǐng)先的技術(shù)和解決方案,幫助汽車制造商加速開發(fā)和軟件定義汽車的生產(chǎn)落地。
蔚來 AI 平臺負(fù)責(zé)人白宇利表示:“量產(chǎn)車面臨的復(fù)雜場景是蔚來自動駕駛能力的試金石,同時,量產(chǎn)車產(chǎn)生的海量數(shù)據(jù)也是也是蔚來自動駕駛能力護(hù)城河。NVIDIA?的高性能計算解決方案,成為了蔚來在自動駕駛這條道路上的加速器?!?/p>