• 正文
    •  
    • 如何實(shí)現(xiàn)?
    •  
    • 背后的作者
  • 相關(guān)推薦
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

我用90年代的古董電腦訓(xùn)練CNN

2021/02/20
157
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

在90年代的電腦上實(shí)現(xiàn)CNN是一種什么體驗(yàn)?

最近,一位日本小哥武田廣正(音譯)就在1990年的電腦PC-9801上實(shí)現(xiàn)了CNN來(lái)識(shí)別手寫(xiě)字符。

就像這樣。

可能因?yàn)殡娔X性能的限制,整個(gè)識(shí)別過(guò)程要消耗一分多鐘。

原來(lái)30年前CNN是這樣實(shí)現(xiàn)的。

他還將整個(gè)過(guò)程分享到了推特上,得到了大量的關(guān)注。

不少網(wǎng)友驚嘆之余,還表示,心疼這個(gè)電腦,學(xué)習(xí)AI一定很難……

 

如何實(shí)現(xiàn)?

雖然目前這項(xiàng)技術(shù)還沒(méi)有開(kāi)源,但早在93年就已經(jīng)有人將CNN玩得很溜了。

這個(gè)人就是LeCun。

前不久,一段關(guān)于LeCun93年的視頻火了。視頻中展現(xiàn)的是,當(dāng)時(shí)的文字識(shí)別系統(tǒng)已經(jīng)用上了CNN。

他首先是電腦的系統(tǒng)中編寫(xiě)了一種網(wǎng)絡(luò)數(shù)據(jù)結(jié)構(gòu)的編譯器,并生成了可編譯的 C 語(yǔ)言代碼,在源代碼中以權(quán)重和網(wǎng)表(netlist)代表文字。

整套系統(tǒng)是在算力為20MFLOPS 的DSP版上運(yùn)行。

當(dāng)時(shí),手寫(xiě)數(shù)字?jǐn)?shù)據(jù)集 MNIST還沒(méi)有問(wèn)世,LeCun則用攝像拍攝來(lái)構(gòu)建文字識(shí)別系統(tǒng)的。除此之外,還需要解決文字縮放、位置等問(wèn)題。

只需在紙上寫(xiě)好任意數(shù)字,不管任意大小形狀,或者帶有一定的“藝術(shù)性”,只要用攝像頭導(dǎo)入電腦,就可以識(shí)別。

而這位日本小哥則是在MNIST數(shù)據(jù)集上構(gòu)建的,電腦上清晰展現(xiàn)了識(shí)別過(guò)程。

首先,讀取MNIST的數(shù)字圖像的信息。

隨后,進(jìn)行一波卷積、池化等操作。

最后經(jīng)過(guò)SoftMax層,每個(gè)數(shù)字轉(zhuǎn)換成概率或者權(quán)重,按照權(quán)重大小選出所得數(shù)字。

 

背后的作者

武田廣正,來(lái)自巖手縣立大學(xué)信息學(xué)研究院,喜歡操作系統(tǒng)以及研究復(fù)古電腦,曾撰寫(xiě)《Raspberry Pi GPGPU入門》

因?yàn)檫@個(gè)項(xiàng)目,他在enPiT的PBL活動(dòng)中獲得了優(yōu)秀獎(jiǎng)。

他表示,會(huì)將這一教程編寫(xiě)進(jìn)《令和的PC-98編程》一起發(fā)行,源代碼將在GitHub上提供。

參考鏈接:

https://twitter.com/T_taisyou/status/1357655009618399232

相關(guān)推薦