借力仿真的強大力量,訓練AI模型所需的數(shù)據(jù)可“信手捏來”

原創(chuàng)
2019/05/27
61
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

人工智能是一項革命性技術,它不光在競技方面打破了世界記錄,未來會影響我們生活的方方面面。經(jīng)過幾年的發(fā)展,在安防監(jiān)控、語音交互、醫(yī)療行業(yè)已經(jīng)開始落地,語音識別、人臉識別、自動醫(yī)療監(jiān)控已經(jīng)越來越多地進入我們的生活。根據(jù)中商產(chǎn)業(yè)研究院的統(tǒng)計數(shù)據(jù),2018 年中國人工智能市場規(guī)模約為 238.2 億元,增長率達到 56.6%。預計 2019 年,中國人工智能市場規(guī)模將近 280 億元。

在近期舉辦的 MATLAB 技術大會上,MathWorks 首席戰(zhàn)略師 Jim Tung 以“超越智‘我’”為主題發(fā)表了演講,他分析,人工智能在提高生產(chǎn)率方面有巨大的潛力, McKinsey 預測 AI 到 2030 年會創(chuàng)造 13 萬億美元的價值,但是很多人工智能項目也面臨走向失敗的風險,比如:數(shù)據(jù)太多、數(shù)據(jù)不足、工具不完整、無法與其它系統(tǒng)交互等因素。他認為,人工智能不僅是算法的智能,還需要在洞見、實現(xiàn)和交互三個方面做出努力。

Jim 舉了改進新西蘭的乳制品加工的例子,從鮮奶到奶粉的生產(chǎn)過程中,提取數(shù)據(jù),建立 AI 模型,盡早檢測出缺陷產(chǎn)品。由于同一工廠每年的狀況完全不同,需要為每個工廠建立一個單獨的模型,而且工廠的經(jīng)營狀態(tài)每年都在改變,奶粉松密度預測不正確,這是因為缺乏證據(jù)的假設得以證實。

他總結,要想在人工智能方面取得成功,我們必須將人工智能模型與科學和工程的洞見相結合,伴隨可跨科學與工程和數(shù)據(jù)科學的工具,使用跨越整個設計流程的工具鏈,設計如何集成系統(tǒng)并在他們的環(huán)境中進行交互。


MathWorks 首席戰(zhàn)略師 Jim Tung

在接受媒體采訪的環(huán)節(jié),Jim 就 AI 領域中增強學習的實現(xiàn)、仿真驗證和真實場景中關系,以及工作流程和創(chuàng)新的關系等問題作了討論。

增強學習是人工智能的一個分支
在本次大會上,Mathworks 還強調(diào)了 AI 領域的一個重要分支,那就是增強學習(Reinforcement Learning),它通過 trial 或者 error 進行學習,完成復雜的任務。Jim 認為,增強學習并不是要把機器學習算法或者深度學習算法做一個強化版本,它只是機器學習或者深度學習的一個分支。針對機器學習或者深度學習,傳統(tǒng)的做法是將帶標簽的數(shù)據(jù)放進去,訓練出一個模型,這需要人工準備數(shù)據(jù)和標簽,但是很多場景無法準備足夠的數(shù)據(jù),比如,復雜的圖像處理,很難通過對行為做標簽提供足夠的數(shù)據(jù)。

增強學習本質(zhì)上是一個反饋系統(tǒng),他是另外一種學習 AI 的手段。可以是增強通用機器學習算法,也可以增強深度學習算法,不需要通過大量數(shù)據(jù)訓練模型,而是創(chuàng)造一個環(huán)境,設立懲罰機制,如果實現(xiàn)既定目標給予獎勵,如果沒有實現(xiàn)既定目標給予處罰。Jim 強調(diào),“它在本質(zhì)上是一個優(yōu)化問題,在增強學習的場景之下,他可以根據(jù)外界的輸入進行調(diào)整,根據(jù)懲罰或者獎勵去優(yōu)化最終的目標,它的目標是得到更多的獎勵、最少的懲罰,這是增強學習的目標。因此,增強學習是學習模型的一種。

仿真驗證和真實場景驗證相輔相成
在使用方針的過程中,用戶最大的擔心是仿真數(shù)據(jù)是否能夠代替真實場景獲取的數(shù)據(jù)?以自動駕駛汽車為例,因為實際路況非常復雜,需要自動駕駛汽車長時間上路測試,積累應對各種突發(fā)事件的處理機制,從而確保自動駕駛系統(tǒng)的安全。現(xiàn)在可以通過 MATLAB 生成仿真數(shù)據(jù)注入自動駕駛系統(tǒng),從而對實際上路測試的數(shù)據(jù)進行補充,需要考慮的是仿真數(shù)據(jù)能否覆蓋所有真實場景?

Jim 解釋,“仿真最大的好處就是即使在沒有真實系統(tǒng)的情況下,系統(tǒng)還可以通過仿真產(chǎn)生上百萬、上千萬的數(shù)據(jù),在大規(guī)模的集成運算環(huán)境里進行仿真。而且通過仿真可以產(chǎn)生現(xiàn)中很難遇到的問題,也可以通過仿真把真實的測量數(shù)據(jù)導入 MATLAB 進行驗證,因此真實場景和純粹仿真模型可以相結合。如果仿真中含有真實場景數(shù)據(jù),我們可以從真實數(shù)據(jù)驗證仿真的真實性,另外,在仿真模型中混入真實場景數(shù)據(jù)可以評估已經(jīng)遇到的場景,同時可以創(chuàng)造出未來可能遇到的場景?!?/p>

通過 Jim 的解釋不難理解,仿真可以補充真實場景無法測量到的數(shù)據(jù),真實場景也可以驗證仿真數(shù)據(jù)的可信程度,兩者相輔相成讓 AI 系統(tǒng)更完善。

工作流程是創(chuàng)新落地的必要條件
MathWorks 對深度學習的支持不只是技術點,而是整個工作流程,從算法到應用部署,都有相應的工具。關于對工作流程的支持,Jim 認為,流程是把一個創(chuàng)新實現(xiàn)的過程,如果沒有算法來支撐的話,就等于是沒有創(chuàng)新的內(nèi)容。如果把算法看作是一種創(chuàng)新,流程是把創(chuàng)新落地的要素,兩者無法脫節(jié)。

在 AI 領域,工作流程尤其重要,Jim 表示,MathWorks 更關注在如何把 AI 的想法更快地落實到真實的系統(tǒng)里面。工作流程更關注團隊的協(xié)作認知,Mathworks 可以更快地把一些 AI 算法在產(chǎn)品上得到實現(xiàn)。

毋庸置疑,AI 在未來世界中充當越來越重要的角色,人臉識別、智能語音交互已經(jīng)得到應用,AI 還在尋找更多落地點,Jim 認為,讓 AI 和工程相結合是目前 AI 最大的挑戰(zhàn)也是最大的機遇。

與非網(wǎng)原創(chuàng)內(nèi)容,未經(jīng)允許,不得轉(zhuǎn)載!


?

Mathworks

Mathworks

MathWorks是為工程師和科學家提供數(shù)學計算和基于模型的設計的軟件開發(fā)商和供應商,總部位于美國馬薩諸塞州納蒂克(Natick)。MathWorks擁有5000多名員工,在全球擁有33個辦公地點,公司開發(fā)的MATLAB和Simulink在計算生物學、芯片設計、控制系統(tǒng)、圖像處理與計算機視覺、數(shù)據(jù)科學、物聯(lián)網(wǎng)、機器人、機器學習、信號處理、無線通信等領域均有廣泛應用。

MathWorks是為工程師和科學家提供數(shù)學計算和基于模型的設計的軟件開發(fā)商和供應商,總部位于美國馬薩諸塞州納蒂克(Natick)。MathWorks擁有5000多名員工,在全球擁有33個辦公地點,公司開發(fā)的MATLAB和Simulink在計算生物學、芯片設計、控制系統(tǒng)、圖像處理與計算機視覺、數(shù)據(jù)科學、物聯(lián)網(wǎng)、機器人、機器學習、信號處理、無線通信等領域均有廣泛應用。收起

查看更多

相關推薦