華為發(fā)布2D自動駕駛數(shù)據(jù)集，業(yè)內(nèi)最大遠超Waymo，主打半自監(jiān)督學(xué)習(xí)

2021/08/06 作者：智車科技

593

加入交流群

掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

自動駕駛，作為人工智能領(lǐng)域的掌上明珠，是需要經(jīng)過大量的數(shù)據(jù)學(xué)習(xí)和數(shù)據(jù)訓(xùn)練才能煥發(fā)光彩的。而數(shù)據(jù)的采集成本之高、難度之大，又讓人望而卻步。

近日，華為諾亞方舟實驗室聯(lián)合中山大學(xué)發(fā)布了新一代2D自動駕駛數(shù)據(jù)集SODA10M數(shù)據(jù)集。SODA10M擁有數(shù)據(jù)規(guī)模龐大、數(shù)據(jù)多樣性強、泛化能力強三個特點。華為諾亞方舟實驗室計劃將基于這個數(shù)據(jù)集開放2D自動駕駛挑戰(zhàn)賽，并且會設(shè)立獎項和獎金。

1、規(guī)模10倍于Waymo，業(yè)內(nèi)最大

在“規(guī)模”方面，SODA10M 比現(xiàn)有的BDD100K和Waymo等自動駕駛數(shù)據(jù)集大十倍，包含1000萬張無標(biāo)注的道路場景圖像，2萬個帶標(biāo)注的高質(zhì)量2D邊界框，擁有更多可供自動駕駛汽車學(xué)習(xí)的數(shù)據(jù)。

2、多樣性4個季節(jié)32個城市

在“多樣性”方面，SODA10M數(shù)據(jù)集中的圖片覆蓋了4個不同的季節(jié)和32個城市。

這些照片是在各種條件下拍攝的，晴天雨天、白天黑夜、城市高速…..

1000萬張無標(biāo)注圖片來自32個城市，囊括了國內(nèi)大部分地區(qū)，2萬張帶標(biāo)注的圖片，直接標(biāo)出了Pedestrian、Cyclist、Car、Truck、Tram、Tricycle這6種主要的人車場景，以供自動駕駛汽車如何應(yīng)對各種情況。

據(jù)悉，華為是通過眾包的方式，把采集任務(wù)分發(fā)給上萬名出租車司機，由司機拍照或行車記錄儀完成圖片采集。

3、泛化專注自/半監(jiān)督，用于ICCV2021 SSLAD挑戰(zhàn)賽

在“泛化”方面，SODA10M數(shù)據(jù)集提供了一組卓越的數(shù)據(jù)，可用于預(yù)訓(xùn)練自動駕駛算法。這是由于數(shù)據(jù)集的多樣性和大小，當(dāng)使用MoCov1時，這導(dǎo)致比Waymo或Cityscapes等其他現(xiàn)有數(shù)據(jù)集有更好的泛化能力。

對比Waymo自動駕駛數(shù)據(jù)集和ImageNet自監(jiān)督算法數(shù)據(jù)集，SODA10M表現(xiàn)優(yōu)異。華為分別從目標(biāo)檢測，BDD100K，Cityscapes語義分割入手，結(jié)果SODA10M的自監(jiān)督訓(xùn)練效果與ImageNet相仿，明顯優(yōu)于Waymo。

研究論文表明，SODA10M 可以作為訓(xùn)練和評估不同自/半監(jiān)督學(xué)習(xí)方法的有前途的數(shù)據(jù)集。除了標(biāo)準化評估之外，這還可以促進對先進技術(shù)的探索，以幫助推動自動駕駛系統(tǒng)向前發(fā)展。

后臺回復(fù)“華為數(shù)據(jù)集”獲取干貨~

論文：

https://arxiv.org/pdf/2106.11118.pdf

數(shù)據(jù)集：

https://soda-2d.github.io/index.html

項目：

https://sslad2021.github.io/index.html

挑戰(zhàn)：

https://sslad2021.github.io/pages/challenge.html

版權(quán)聲明：與非網(wǎng)經(jīng)原作者授權(quán)轉(zhuǎn)載，版權(quán)屬于原作者。文章觀點僅代表作者本人，不代表與非網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有侵權(quán)或者其他問題，請聯(lián)系本站作侵刪。侵權(quán)投訴

人工客服
（售后/吐槽/合作/交友）