2020 年 9 月 5 日,由雷鋒網(wǎng) & AI 掘金志主辦的第三屆中國人工智能安防峰會,在杭州正式召開。
本屆峰會以「洗牌結束,格局重構」為主題,會上代表未來新十年的 15 家企業(yè),為現(xiàn)場 1000 余位聽眾和線上幾十萬觀眾,分享迎接安防新十年的經(jīng)營理念與技術應用方法論。
在下午場的演講環(huán)節(jié)上,華為機器視覺總裁段愛國為峰會帶來了開場報告。
段愛國提出,一個真正的智能世界有三個非常典型的特征或者基礎框架技術:一是萬物感知,二是萬物互聯(lián),三是萬物智能。
在華為來看,萬物互聯(lián)、5G、光網(wǎng)絡是華為一直以來深耕的領域,華為機器視覺將成為萬物感知的入口。
段愛國還認為,智能世界向前邁進有三大核心技術:以全息感知為核心的機器視覺,以萬物互聯(lián)為基礎的移動無線通信,以及萬物智能的 AI 技術,2020 年這三個技術開始融合。
所以華為在 2020 年率先提出,所有的視頻技術應該從給人看向給機器看轉移,并正式把產(chǎn)品線更名為“機器視覺”,聚焦打造兩個核心能力:一是前端的全息感知能力,二是在后端用數(shù)據(jù)驅動,反作用于物理世界,驅動于智能世界。
4G 時代,以智能手機為核心,出現(xiàn)了各種行業(yè)移動互聯(lián)網(wǎng)的應用。在華為看來,機器視覺就是 5G 時代行業(yè)數(shù)字化的智能手機。段愛國還提到,過去 5 年,AI 的成本在下降,AI 已經(jīng)進入到普惠的時代,他預測未來兩年智能攝像機一定會超過網(wǎng)絡攝像機。
另外,華為將聚焦打造 4 個核心戰(zhàn)略產(chǎn)品和平臺:前端的軟件定義攝像機,后端的智能視頻存儲,類似于智能手機應用市場的智能算法應用商城,以及華為機器視覺云服務。
在此基礎上提出四大戰(zhàn)略策略:戰(zhàn)略一,積極投入全棧全場景的 AI 研究;戰(zhàn)略二,重構產(chǎn)業(yè)架構,加速智能化升級;戰(zhàn)略三,平臺+生態(tài),賦能千行百業(yè);戰(zhàn)略四:端邊云協(xié)同,深度數(shù)據(jù)挖掘。
最后他強調,會將開放進行到底,未來的智能世界很復雜,華為不可能包攬全部的工作,希望大家一同成長。
以下是段愛國演講全文,雷鋒網(wǎng) AI 掘金志作了不改變原意的整理與編輯:
上午很多的專家主要從技術的角度闡述對 AI 以及對整個智慧安防未來發(fā)展的一些看法,我本人不是以技術見長,我更多是從產(chǎn)業(yè)的角度來闡述華為對行業(yè)未來的理解,我今天的演講題目是《華為 HoloSens,點亮智能世界》。
談到智能世界,大家都不陌生,我們把千行百業(yè)的數(shù)字化轉型從兩個維度展開:
一是智能化的水平,二是整個行業(yè)智能化所處的階段。
在通信、媒資、銀行等領域,數(shù)字化轉型已經(jīng)進入量級階段,我們現(xiàn)在所熟知的公共安全、數(shù)字政府、教育、機場等等,現(xiàn)在也正處在數(shù)字化的爆發(fā)期。
還有很多領域,比如醫(yī)療、建筑、礦業(yè)和農牧業(yè),現(xiàn)在還在起步期,總的來講,各行各業(yè)都在朝著智能化發(fā)展。
去年華為的戰(zhàn)略研究部門發(fā)布了 2025 年智能世界十大趨勢預測,里面很多詞大家已經(jīng)比較熟悉了,有的詞可能對安防行業(yè)還有點陌生。
在華為看來,未來五年是智能世界快速發(fā)展的五年,我們的展望中,14%的家庭將擁有家庭機器人,90%的人將擁有個人智能終端助理,自動駕駛將要上路,機器人將代替普通人,人機協(xié)創(chuàng)等都會加速到來。5G 就更不用說了,全球的數(shù)字治理成為全人類面臨的新的大挑戰(zhàn)。
華為看到的不僅僅是未來 5 年智能世界的趨勢,我們還匯集了未來智能世界的基本愿景和框架。
在華為來看,一個真正的智能世界有三個非常典型的特征或者基礎框架技術:
一是萬物感知。
我們認為所有的行業(yè)都會充分地數(shù)字化、智能化以及邊緣計算化,當然,包括今天上午強調的安全,華為也同樣重視。
二是萬物互聯(lián)。
這是華為的傳統(tǒng)強項,無論是 5G、全光網(wǎng)還是全 IP 網(wǎng)絡,都是華為的優(yōu)勢。在華為來看,未來聯(lián)接將有四個典型特點:寬、廣、多、深。
三是萬物智能。
同行業(yè)各位伙伴講的更多的是數(shù)字孿生,它是物理世界的鏡像,通過數(shù)字來感知物理世界。
華為認為未來數(shù)字世界不僅僅是物理世界的鏡像,它也將會是一個獨立的世界,讓精神世界更加富足。
所以,在華為未來的智能世界中,我們有一個全方位、多角度的愿景和框架。
華為大概在 2017 年戰(zhàn)略投入做智能安防,今年年初改名叫“機器視覺”,我在一些活動中經(jīng)常被媒體問說華為為什么要做安防、為什么做機器視覺,我也想借此機會和大家分享一下。
在華為看來,萬物互聯(lián)、5G、光網(wǎng)絡是華為深耕的領域,華為機器視覺將成為華為在萬物感知領域的核心,所以華為做機器視覺其實是沿著華為智能世界愿景而做出的戰(zhàn)略部署。
正因如此,2018 年,華為邁過 30 歲門檻的時候,華為刷新了整個公司的愿景。
過去 30 年,華為的愿景是“豐富人們的溝通和生活”,立足點是從溝通、聯(lián)接、通信的角度來驅動整個華為公司向前邁進。
未來 30 年,華為公司的愿景是“把數(shù)字世界帶入每個人、每個家庭、每個組織,構建萬物互聯(lián)的智能世界”。
回想我們國家的戰(zhàn)略部署,新基建成為全行業(yè)的熱門詞,新基建也是運用網(wǎng)絡化、數(shù)字化、智能化等技術,支撐千行百業(yè)的數(shù)字化轉型、智能化升級和融合化創(chuàng)新。
在我國面向 2025 年的新型基礎設施的戰(zhàn)略規(guī)劃里,5G、物聯(lián)網(wǎng)、云計算、人工智能等等都成為關鍵的投資要點,這就說明新基建的目的就是為未來的智能世界打下一個扎實的數(shù)字化的基座,這和華為的愿景也是高度趨同的。
站在華為的機器視覺角度,2020 年是非常不平凡的一年,為什么這么說?
我們認為智能世界向前邁進有三大核心技術:
以全息感知為核心的機器視覺,以萬物互聯(lián)為基礎的移動無線通信,以及萬物智能的 AI 技術。
這三類核心技術在過去幾十年里都經(jīng)歷了不同程度的發(fā)展,同時我們很高興地看到,在 2020 年這三個核心技術都迎來一個高速發(fā)展的契機,而且三個技術開始融合。
比如,移動通信技術基本上是每 10 年一代,2G、3G、4G,2020 年是 5G 規(guī)模商用的元年,也就是說未來的十年是 5G 蓬勃發(fā)展的十年。
我們再看人工智能,AI 技術從上世紀 50 年代提出到目前為止,至少經(jīng)歷了兩個波峰和波谷,隨著人臉識別、行為識別等技術的發(fā)展,尤其在我國,相應的人工智能技術從今年開始真正走向規(guī)模的商用。
我聽了上午很多嘉賓的分享,從我們以前談到的技術創(chuàng)新、工程創(chuàng)新到今年真正談的已經(jīng)是千行百業(yè)的智能化升級和產(chǎn)業(yè)升級,所以 2020 年對人工智能、對華為機器視覺同樣如此。
以前我們的視頻技術更多是給人看,在清晰度、部署靈活性等方面,都存在很多的約束。華為也是在 2020 年率先提出,所有的視頻技術應該從給人看向給機器看轉移,所以我們也正式把產(chǎn)品線更名為“機器視覺”。
我們認為從 2020 年往后的十年,5G、AI、機器視覺融合下,人類將進入一個全新的超級視野的時代。
華為眼中的技術科學發(fā)展,尤其是近幾十年的發(fā)展,首先是以無線通信技術為核心帶來的整個產(chǎn)業(yè)的升級。
回看過去十年,4G 時代最大的新物種是智能手機,它帶來了人和人的聯(lián)接,引爆了移動互聯(lián)網(wǎng)。
以智能手機為核心,出現(xiàn)了購物軟件、打車平臺、地圖查詢等各種行業(yè)移動互聯(lián)網(wǎng)應用。
今年我們站在 5G 的元年,往前看十年,未來十年將是機器視覺作為感知入口的物聯(lián)網(wǎng)的十年,它的核心就是驅動行業(yè)數(shù)字化。
所以,這句話在我們公司內部達成了高度一致:
過去十年,華為抓住了 4G 時代,成功從一個 ICT 公司成為了擁有消費者業(yè)務的公司,未來十年,華為將緊緊抓住 5G 時代,打造機器視覺,搶占萬物感知入口,真正引爆行業(yè)數(shù)字化。
在華為看來,機器視覺就是 5G 時代行業(yè)數(shù)字化的智能手機。
既然我們把智能世界、機器視覺放在這樣一個高度,華為認為未來智能化發(fā)展有兩大問題需要解決:
一是智能深化,亟需理論和新范式突破瓶頸。
過去十年,我們解決了深度學習和數(shù)據(jù)標注的問題,未來十年,在深度學習遇到瓶頸,千行百業(yè)的智能化創(chuàng)新不斷深化后,業(yè)內要持續(xù)在三個領域進行創(chuàng)新和突破:
1. 理論的突破。深度學習不僅僅是做感知,還要做認知。
2. 技術創(chuàng)新。要進行新范式下的視覺研究,具體來講包括弱標注和無標注的深度學習,以及新模型和多模態(tài)的模型突破,還有算力節(jié)約的模型研究。
3. 工程創(chuàng)新。在監(jiān)督學習上進行延長。
那么,我們的智能一定會從安防走向各個終端,走向自動駕駛,走向醫(yī)療,走向千行百業(yè)。
二是智能惠普,進入 1T 算力起步的時代。
往回看五年,我們發(fā)現(xiàn)安防 AI 成本在逐年快速下降,AI 已經(jīng)逐步進入到一個普惠的時代。
可以看到過去五年,目標識別單路價格已經(jīng)大幅度下降,變成之前的十分之一,這一系列價格下降也得益于底層算力價格下降,其實算力的平均價格下降幅度更大,遠超十倍,所以 AI 已經(jīng)不貴,算力也不貴。
所以華為大膽展望,未來兩年,智能攝像機一定會超過網(wǎng)絡攝像機。
沒有記錯的話,大概七八年前,當國內主要還是功能機,大家都在談智能手機很貴的時候,我在瑞士買了第一臺智能手機,那時候我和國內同學講,雖然智能手機很貴,但是很好用,將來會大爆炸。
后來千元智能手機出現(xiàn)了,連我的爸媽都要求用智能手機,一直到現(xiàn)在,幾乎看不到非智能手機了。所以我們認為在攝像機行業(yè),未來兩年也會出現(xiàn)這樣一個轉折點,整個行業(yè)都會進入到普惠 AI 時代,1T 算力將成為整個行業(yè)的起步配置。
上半部分給大家分享了華為未來智能世界的愿景以及我們對智能世界的一些理解,所以我們今年年初改名叫“機器視覺”,我們也聚焦打造兩個核心能力:
一是前端的全息感知能力,二是后端用數(shù)據(jù)驅動,反作用于物理世界的數(shù)據(jù)智能治理能力,這個理解和整個行業(yè)是一樣的。
從現(xiàn)在開始往未來 3-5 年看,華為機器視覺會堅定地擁抱超級視野,也就是堅定地擁抱 5G、人工智能等技術,不斷拓展 AI 的廣度和深度。
我們將聚焦打造的 4 個核心產(chǎn)品和平臺分別是:
前端的軟件定義攝像機、后端的智能視頻存儲、類似于智能手機應用市場的智能算法應用商城,以及華為機器視覺云服務。這就是我們未來 3-5 年會持續(xù)耕耘的 4 大核心戰(zhàn)略產(chǎn)品。
在這個戰(zhàn)略下,今天具體分享的是我們將在 4 個方面的投入:
戰(zhàn)略一,積極投入全棧全場景的 AI 研究。
華為的全棧全場景是什么意思?就是從 AI 芯片到算法、算子開發(fā)的工具框架,到整個端、邊、云上獨立和協(xié)同的訓練算法框架,以及全流程的應用使能服務上,華為將進行全棧全場景的戰(zhàn)略投入。
華為在“全棧、全場景”的 AI 戰(zhàn)略牽引下,將持續(xù)投資計算視覺、自然語言處理、決策推理等領域的基礎研究,積極面向全球建設開放生態(tài),加強人才培養(yǎng)和內部效率提升。
把 AI 思維和技術引入現(xiàn)有產(chǎn)品和服務,打造面向云、邊緣和端等全場景的、獨立的、協(xié)同的全棧解決方案,提供充裕、經(jīng)濟的算力資源,簡單高效的全流程 AI 平臺。
過去幾年,華為在算法上的宣傳并不多,甚至我有時候碰到一些客戶伙伴,他們也會問華為是否做算法。在這里我分享一下,華為在算法應用上可能做得不多,因為我們更多地是通過“平臺+生態(tài)”的戰(zhàn)略去擁抱所有算法廠家,建立算法生態(tài)。
不過我們有超過 2000 人在進行 AI 相關的算法研究和開發(fā),并持續(xù)在 AI 算法領域投入。
戰(zhàn)略二,重構產(chǎn)業(yè)架構,加速智能化升級。
1、華為希望通過重新定義技術架構,讓硬件和算法解耦,構建開放式的平臺。
前端攝像機軟件定義(HoloSens SDC),算法按需加載,讓通用攝像機秒變專用攝像機。
后端智能視頻存儲(HoloSens IVS),以全云架構,多算法融合,打通數(shù)據(jù)孤島,實現(xiàn)算力、算法、數(shù)據(jù)和任務協(xié)同。
2、一站式智能視頻算法商城 HoloSens Store,重新定義生態(tài)模式。
讓使用者按需選擇,經(jīng)濟適用,讓開發(fā)者專注需求,快速迭代,實現(xiàn)使用者和開發(fā)者雙向溝通,讓交易得以遠程、在線、一站式完成。
下面我具體講解下這個戰(zhàn)略。
前端方面,第一,軟件定義的攝像機內置專業(yè) AI 芯片,最高端的 X 系列算力是 4T,部分款型比如 AI 超微光卡口攝像機總共有 20T 算力。
第二,我們有開放的 OS,它和手機安卓以及現(xiàn)在華為打造的鴻蒙操作系統(tǒng)一樣,未來這個 OS 也是鴻蒙的一部分。因此,華為所有前端的硬件都可以通過開放的 OS 進行底層硬件和上層算法應用的解耦。
第三,我們致力于打造豐富的生態(tài),讓行業(yè)里所有的玩家都可以和華為一起成長。
今年,我們發(fā)布了幾款具有標志性的攝像機,包括全場景的 5G 攝像機,基于終端產(chǎn)業(yè)鏈進行創(chuàng)新的“二郎神”雙模球機,20T 算力的 AI 超微光卡口,以及生態(tài)型攝像機,這都是我們在前端打造差異化產(chǎn)品的一些嘗試。
在后端,我們有智能視頻云 HoloSensIVS,也是像智能手機一樣打造生態(tài)系統(tǒng),只不過這個系統(tǒng)是云聯(lián)接的、集群的大聯(lián)網(wǎng)架構。
比如,最近打造的一個邊緣交通盒子有 20T 算力,支持開放的生態(tài),廠家的算法只要滿足我們 SDK 或 SPI 的接入方式,都可以進入這個平臺,我們叫做多算法倉。
通過這樣的方式,我們可以為各行各業(yè)打造“總部+分支”的中心邊緣的大聯(lián)網(wǎng)的架構,我們把它叫“全網(wǎng)一片云”,這也是我們在云化架構上的一些嘗試。
另外,我特別想強調的是 HoloSens Store 智能安防新生態(tài)使能平臺,我們想打造在 AI 時代支持算法和應用交易的線上平臺,或者說類似于手機的應用市場。
以前傳統(tǒng)的客戶有各種場景的智能化訴求時,可能會不斷找算法,找算法很難,開發(fā)者尤其算法的開發(fā)者,找用戶很難,這個平臺支持算法一站式服務,自動地上線,然后自動地下載,自動地交易,一切都可以遠程在線云化方式完成。
想象一下,你有一臺華為的軟件定義攝像機,你到華為的 HoloSens 商城上去下載算法,它的使用體驗和你現(xiàn)在用手機到應用市場下載一個 APP 的使用體驗基本完全一致,這就是我們正在打造的生態(tài)平臺。
所以我們希望在中間打造一個交易平臺,服務使能開發(fā)者和用戶,通過這種方式真正讓開發(fā)者和用戶直接握手。
戰(zhàn)略三,平臺+生態(tài),賦能千行百業(yè)。
華為會始終堅持開放,安防行業(yè)為什么要談開放?舉個例子,在功能手機時代,確實沒有生態(tài)可言,買一個諾基亞手機,所有的東西都由諾基亞提供。但是到了智能時代,一個廠商不可能做所有的應用,絕大多數(shù)都是依賴伙伴。
正是因為我們有了智能手機的實踐,所以在智能世界我們堅定地擁抱開放。
具體來說,我們的平臺+生態(tài)是怎么做的?
主要通過“算法+應用”和“生態(tài)倉+傳感器”方式。華為機器視覺產(chǎn)品,無論是攝像機、視頻存儲,還是算法和應用商城均面向產(chǎn)業(yè)開放,以華為最新發(fā)布的“生態(tài)型攝像機”為例,AIoT 生態(tài)倉架構設計,實現(xiàn)“算法”和“硬件”雙開放,進一步實現(xiàn)全息感知,為千行百業(yè)賦能打下堅實的基礎。
我簡單介紹一下兩個標志性的產(chǎn)品:
第一,HoloSens Store,華為機器視覺的智能算法應用商城。
目前,我們已經(jīng)有 70 多個算法可以在線交易、在線下載,200 家嚴選的算法入駐,客觀來講,我們對算法質量要求非常高,算法上到華為的商城,還有很多的測試和驗證。
另外,我們有中國 130 多家 AI 算法合作伙伴,目前已經(jīng)有幾萬次的算法下載和應用。
HoloSens Store 應該是安防行業(yè)的一些創(chuàng)新和嘗試,我看今年有些友商也在做類似的嘗試,這非常好,就像智能手機一樣,一定是有多個應用市場,才能真正讓算法深入千行百業(yè)。
第二,生態(tài)型攝像機。
除了算法和應用開放以外,華為在生態(tài)上也是開放的。
在華為做 AIoT 這么多年中發(fā)現(xiàn)了很多問題,其中一個是 AIoT 的回傳和連接,為此我們在無線網(wǎng)絡上做了很多創(chuàng)新,但是難度很大,商業(yè)模式也不夠清晰。
基于此,我們認為既然要做萬物感知或者全息感知,機器視覺其實是眼睛,我們一定要把耳朵、鼻子、皮膚等都集成起來。
今年 5 月份華為發(fā)布了一個生態(tài)型攝像機,它典型的特點是除了具備傳統(tǒng)攝像機的功能外,還有生態(tài)倉功能,它自帶各類有線、無線的接口,讓生態(tài)伙伴自己在攝像機里開發(fā)生態(tài)主板,來接入各個廠家的傳感器。
那么,我們可以把水位、濁度、溶解氧以及各行各業(yè)的傳感器都接入到我們的軟件定義生態(tài)型攝像機,然后由后臺進行統(tǒng)一的數(shù)據(jù)處理、數(shù)據(jù)分析和數(shù)據(jù)呈現(xiàn)。如此一來,華為的生態(tài)型攝像機就真正把硬件的生態(tài)打開了。
戰(zhàn)略四,端邊云協(xié)同,深挖數(shù)據(jù)價值。
華為在機器視覺領域會堅定地擁抱端邊云,我們在端側、邊側、云側都有較強的技術投入和布局,通過前端的智能感知、分支邊緣存儲,基于華為云進行深入的智能分析。
和傳統(tǒng)的云廠商不同,我們在端側和邊側更加注重充分挖掘多維數(shù)據(jù)。
比如,以前交通路口有不同的設備,分別采集不同的數(shù)據(jù),但是這些數(shù)據(jù)分別傳到不同的系統(tǒng)進行處理,數(shù)據(jù)非常碎片化。
華為看到了這個痛點,聚焦打造了一個智慧交通方案,我們叫做全息路口,通過在路口部署攝像機、雷達,同時在路側邊緣部署 ITS800,把視頻的感知數(shù)據(jù)和雷達的感知數(shù)據(jù)進行擬合。
在這個方案中,華為全息路口能夠感知 5 類源數(shù)據(jù),包含了車牌、車速、車的位置、車的屬性以及車的行駛姿態(tài)等等,進行全方位的感知,同時產(chǎn)生 40 多種在后端進行交通治理的數(shù)字應用。
在華為全息路口的使能下,數(shù)據(jù)就不僅僅是單維度的,不僅僅是單元的,而是多元和多維度的,是真正把數(shù)據(jù)做到了全域、全量和全時的數(shù)據(jù)挖掘。
在全息路口基礎上,加上端、邊、云的協(xié)同,我們就能在交通治理和安全防范上發(fā)揮以前發(fā)揮不到的價值。
我們最近在全國大概 30 多個項目里進行了相關的測試和部署,目前都認為這是劃時代的變革,真正做到數(shù)據(jù)的全息匯聚。
當然,華為機器視覺不僅僅是一家技術公司,也是要賦能千行百業(yè)的,所以我們今年選定了 10 大行業(yè)來進行相關的產(chǎn)品和解決方案推廣,目前來講進展也不錯。
最后,感謝大家的聆聽,希望這 30 分鐘的時間能夠讓大家很好地理解華為智能世界的愿景,以及華為機器視覺四大戰(zhàn)略方向。
也借此機會呼吁各位同行和伙伴,尤其是做算法和物聯(lián)網(wǎng)各種傳感器件的伙伴,可以主動聯(lián)系我們,因為我們有一個口號,“將開放進行到底”,未來的智能世界很復雜,華為不可能一個人包攬全部的工作,希望大家和我們一同成長!