NVIDIA 宣布微軟、騰訊、百度采用 CV-CUDA 開(kāi)發(fā)計(jì)算機(jī)視覺(jué) AI

2023/03/22 作者：與非網(wǎng)編輯

1878

加入交流群

掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

即將推出的公測(cè)版優(yōu)化了前處理和后處理，以四分之一的成本和能耗獲得更高的吞吐量。

微軟、騰訊和百度正在采用 NVIDIA CV-CUDA 開(kāi)發(fā)計(jì)算機(jī)視覺(jué) AI。

NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛近日在宣布 NVIDIA CV-CUDA 公測(cè)版時(shí)強(qiáng)調(diào)了該開(kāi)源項(xiàng)目在內(nèi)容理解、視覺(jué)搜索和深度學(xué)習(xí)方面的成果。CV-CUDA 是一個(gè)云計(jì)算級(jí)別的計(jì)算機(jī)視覺(jué)開(kāi)源 GPU 加速庫(kù)。

黃仁勛在 NVIDIA GTC 大會(huì)主題演講中表示：“80% 的互聯(lián)網(wǎng)流量來(lái)自于視頻，用戶生成的視頻內(nèi)容正在推動(dòng)流量大幅增長(zhǎng)并消耗大量能源。我們應(yīng)該加速所有視頻處理并重新降低能耗?！?/p>

CV-CUDA 致力于幫助世界各地的公司在 GPU 上建立和擴(kuò)展端到端的、基于 AI 的計(jì)算機(jī)視覺(jué)和圖像處理流程。

使用 AI 優(yōu)化互聯(lián)網(wǎng)規(guī)模的視覺(jué)計(jì)算

大部分的互聯(lián)網(wǎng)流量來(lái)自于視頻和圖像數(shù)據(jù)，這推動(dòng)了內(nèi)容創(chuàng)作、視覺(jué)搜索、推薦以及地圖等應(yīng)用的驚人規(guī)模。

這些應(yīng)用使用一套專門(mén)的、反復(fù)被使用的計(jì)算機(jī)視覺(jué)和圖像處理算法，在神經(jīng)網(wǎng)絡(luò)處理圖像和視頻數(shù)據(jù)之前和之后對(duì)這些數(shù)據(jù)進(jìn)行處理。

微軟必應(yīng)的視覺(jué)搜索引擎使用 AI 計(jì)算機(jī)視覺(jué)在互聯(lián)網(wǎng)圖片中搜索圖片（例如狗糧）

雖然神經(jīng)網(wǎng)絡(luò)通常由 GPU 加速，但支持神經(jīng)網(wǎng)絡(luò)的計(jì)算機(jī)視覺(jué)和圖像處理算法往往是當(dāng)今 AI 應(yīng)用中的 CPU 瓶頸。

CV-CUDA 通過(guò)將前處理和后處理步驟從 CPU 轉(zhuǎn)移到 GPU，幫助在單個(gè) GPU 上處理4倍的串流。因此，CV-CUDA能夠以四分之一的云計(jì)算成本處理同樣的工作負(fù)載。

CV-CUDA 庫(kù)為開(kāi)發(fā)者提供30多種高性能的計(jì)算機(jī)視覺(jué)算法，包含原生 Python API 和與 PyTorch、TensorFlow2、ONNX 與TensorRT機(jī)器學(xué)習(xí)框架的零拷貝集成。

其結(jié)果是為云 AI 業(yè)務(wù)提供了更高的吞吐量，同時(shí)降低計(jì)算成本并減少了碳足跡。

全球?qū)τ?jì)算機(jī)視覺(jué)AI的應(yīng)用情況

全球行業(yè)領(lǐng)導(dǎo)者的采用體現(xiàn)了CV-CUDA 為越來(lái)越多大規(guī)模視覺(jué)應(yīng)用所帶來(lái)的益處以及多樣的支持。擁有大規(guī)模圖像處理工作負(fù)載的企業(yè)可以節(jié)省數(shù)千萬(wàn)乃至數(shù)億美元的費(fèi)用。

微軟正將 CV-CUDA 整合到必應(yīng)視覺(jué)搜索中，以支持用戶使用圖像而非文本來(lái)搜索，尋找類似的圖像、產(chǎn)品或網(wǎng)頁(yè)。

2019年，微軟在 GTC 上分享了他們?nèi)绾卫?NVIDIA 技術(shù)將語(yǔ)音識(shí)別、智能回答、文字-語(yǔ)音轉(zhuǎn)換技術(shù)和物體檢測(cè)無(wú)縫、實(shí)時(shí)地結(jié)合起來(lái)。

騰訊已部署 CV-CUDA 來(lái)加速其廣告創(chuàng)作和內(nèi)容理解流程，該流程每天處理30多萬(wàn)個(gè)視頻。

相比之前經(jīng)過(guò) GPU 優(yōu)化的工作流，在使用CV-CUDA后，這家總部位于深圳的多媒體集團(tuán)在圖像處理方面的能耗和成本均降低了20%。

而總部位于北京的搜索巨頭百度正在將 CV-CUDA 整合到 FastDeploy中。FastDeploy 是百度飛漿深度學(xué)習(xí)框架的開(kāi)源部署工具包之一，可以為開(kāi)源社區(qū)的開(kāi)發(fā)者提供無(wú)縫的計(jì)算機(jī)視覺(jué)加速。

從內(nèi)容創(chuàng)建到汽車(chē)用例

CV-CUDA 的應(yīng)用正在不斷增加。在Alpha版本發(fā)布后的幾個(gè)月內(nèi)，就有500多家公司提出了100多個(gè)用例。

內(nèi)容創(chuàng)作和電子商務(wù)中的圖像會(huì)使用前處理和后處理算子來(lái)幫助推薦引擎識(shí)別、定位和策劃內(nèi)容。

在測(cè)繪領(lǐng)域，來(lái)自測(cè)繪車(chē)輛的視頻需要預(yù)處理和后處理算子來(lái)訓(xùn)練云端神經(jīng)網(wǎng)絡(luò)，從而識(shí)別基礎(chǔ)設(shè)施和道路特征。

在自動(dòng)駕駛模擬和驗(yàn)證軟件的基礎(chǔ)設(shè)施應(yīng)用中，CV-CUDA 使 GPU能夠加速在車(chē)輛上發(fā)生的算法，例如顏色轉(zhuǎn)換、失真校正、卷積和雙邊過(guò)濾等。

未來(lái)，生成式 AI 將改變視頻內(nèi)容創(chuàng)作和管理，使創(chuàng)作者能夠接觸到全球受眾。

位于紐約的初創(chuàng)企業(yè) Runway 已通過(guò)集成 CV-CUDA，緩解了其視頻對(duì)象分割模型中的一個(gè)關(guān)鍵的高分辨率視頻預(yù)處理瓶頸。

在部署 CV-CUDA 后，其速度提高了3.6倍，支持Runway 優(yōu)化其創(chuàng)作工具套件中的實(shí)時(shí)內(nèi)容點(diǎn)擊響應(yīng)速度。

Runway 聯(lián)合創(chuàng)始人兼首席執(zhí)行官 Cristóbal Valenzuela表示：“對(duì)于創(chuàng)作者來(lái)說(shuō)，將一個(gè)想法變?yōu)楝F(xiàn)實(shí)過(guò)程中的每一秒都很寶貴。CV-CUDA 為數(shù)百萬(wàn)使用我們工具的創(chuàng)作者帶來(lái)了積極且重要的變化。”

如需使用 CV-CUDA，請(qǐng)?jiān)L問(wèn)CV-CUDA GitHub。

或者在 GTC CV-CUDA 專題分會(huì)上了解更多信息。點(diǎn)擊鏈接觀看GTC 2023 主題演講回看。

版權(quán)聲明：與非網(wǎng)經(jīng)原作者授權(quán)轉(zhuǎn)載，版權(quán)屬于原作者。文章觀點(diǎn)僅代表作者本人，不代表與非網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有侵權(quán)或者其他問(wèn)題，請(qǐng)聯(lián)系本站作侵刪。侵權(quán)投訴

人工客服
（售后/吐槽/合作/交友）

英偉達(dá)

NVIDIA（中國(guó)大陸譯名：英偉達(dá)，港臺(tái)譯名：輝達(dá)），成立于1993年，是一家美國(guó)跨國(guó)科技公司，總部位于加利福尼亞州圣克拉拉市，由黃仁勛、克里斯·馬拉科夫斯基（Chris Malachowsky）和柯蒂斯·普里姆（Curtis Priem）共同創(chuàng)立。公司早期專注于圖形芯片設(shè)計(jì)業(yè)務(wù)，隨著公司技術(shù)與業(yè)務(wù)發(fā)展，已成長(zhǎng)為一家提供全棧計(jì)算的人工智能公司，致力于開(kāi)發(fā)CPU、DPU、GPU和AI軟件，為建筑工程、金融服務(wù)、科學(xué)研究、制造業(yè)、汽車(chē)等領(lǐng)域的計(jì)算解決方案提供支持。