?
該研究論文登上《自然—光子學(xué)》封面
衍射光電智能計(jì)算體系構(gòu)架和理論方法在很大程度上解決了領(lǐng)域內(nèi)困擾已久的難題,為研發(fā)高性能光電智能處理器和芯片打開(kāi)了更為廣闊的空間,也為促進(jìn)該領(lǐng)域的發(fā)展及其產(chǎn)業(yè)落地做出了一定貢獻(xiàn)。
■本報(bào)記者 袁一雪
在過(guò)去的十年,電子驅(qū)動(dòng)的計(jì)算處理器對(duì)人工智能(AI)發(fā)展產(chǎn)生了巨大影響。但隨著技術(shù)的發(fā)展,電子硬件的性能即將觸摸到“天花板”,而只有突破“天花板”才能讓人工智能發(fā)展更進(jìn)一步。
能夠替代電子驅(qū)動(dòng)計(jì)算處理器的光學(xué)計(jì)算處理器,一直為研究人員所倚重。它不僅能夠克服電子學(xué)的固有限制,還可以將能效、處理速度和計(jì)算吞吐量提高幾個(gè)數(shù)量級(jí)。
目前,已經(jīng)有研究人員利用光學(xué)計(jì)算的特性,構(gòu)建專用光學(xué)處理器,其在數(shù)據(jù)和信號(hào)處理方面所表現(xiàn)出的性能遠(yuǎn)遠(yuǎn)超過(guò)現(xiàn)在的電子處理器。然而,現(xiàn)有的光學(xué)AI加速器只能為特定神經(jīng)網(wǎng)絡(luò)體系結(jié)構(gòu)或特定任務(wù)定制單一功能。換言之,對(duì)于不同任務(wù)的不同AI算法,現(xiàn)在的“設(shè)備”顯得有些“力不從心”。不僅如此,現(xiàn)有的光神經(jīng)網(wǎng)絡(luò)模型復(fù)雜度和實(shí)驗(yàn)性能水平較低,導(dǎo)致網(wǎng)絡(luò)性能(如分類精度)與最先進(jìn)的電子神經(jīng)網(wǎng)絡(luò)相比存在較大差距。
近日,中國(guó)工程院院士戴瓊海團(tuán)隊(duì)提出了一種光電可重構(gòu)計(jì)算模式,針對(duì)光學(xué)網(wǎng)絡(luò)設(shè)計(jì)空間的靈活性有限、難以集成理想的非線性運(yùn)算,以及難以靈活控制復(fù)雜的數(shù)據(jù)流等問(wèn)題提出了新的解決思路。
將AI加速處理器推向新高度
5月5日,這篇第一作者是清華大學(xué)博士研究生周天貺、通訊作者為戴瓊海的論文登上《自然—光子學(xué)》期刊封面。該論文作者之一、清華腦與認(rèn)知科學(xué)研究院及未來(lái)芯片技術(shù)高精尖創(chuàng)新中心特聘研究員林星在接受《中國(guó)科學(xué)報(bào)》采訪時(shí)表示,針對(duì)現(xiàn)有光學(xué)神經(jīng)網(wǎng)絡(luò)模型復(fù)雜度低、可重構(gòu)難以實(shí)現(xiàn)以及實(shí)驗(yàn)性能不佳等難題的關(guān)鍵原因,該團(tuán)隊(duì)通過(guò)以下三方面進(jìn)行了突破:
首先,該團(tuán)隊(duì)在空頻域開(kāi)辟了衍射光學(xué)計(jì)算的新型光電計(jì)算構(gòu)架?!把苌渲悄芄庥?jì)算構(gòu)架,縮寫為DPU,是基于光學(xué)衍射的物理現(xiàn)象,通過(guò)構(gòu)建大規(guī)模的光學(xué)相控陣列以實(shí)現(xiàn)高復(fù)雜度的光學(xué)互聯(lián)和神經(jīng)網(wǎng)絡(luò)構(gòu)架。其原理具備高度的可擴(kuò)展性和集成潛力?!绷中墙忉尩?,“我們這次的研究工作通過(guò)采用高通量可編程的光電器件,融合光計(jì)算和電計(jì)算的互補(bǔ)性優(yōu)勢(shì),將其在構(gòu)建人工智能加速處理器的應(yīng)用推向了一個(gè)新的高度?!?/p>
其次,這次提出的DPU充分利用了光的波粒二象性,神經(jīng)網(wǎng)絡(luò)權(quán)重的調(diào)整通過(guò)控制光波傳播的波前分布來(lái)實(shí)現(xiàn),采用光電效應(yīng)實(shí)現(xiàn)人工神經(jīng)元的功能,包括對(duì)衍射光場(chǎng)的線性加權(quán)求和以及非線性激活響應(yīng)。林星解釋說(shuō),系統(tǒng)運(yùn)行過(guò)程衍射光計(jì)算部分幾乎承擔(dān)所有計(jì)算操作,而采用高通量可編程的光電器件并結(jié)合電子計(jì)算的靈活特性,能夠?qū)崿F(xiàn)高速數(shù)據(jù)調(diào)控及大規(guī)模網(wǎng)絡(luò)參數(shù)的編程和網(wǎng)絡(luò)結(jié)構(gòu)的重構(gòu)。此外,由于光計(jì)算部分采用了三維光場(chǎng)傳播,避免了對(duì)圖像和視頻的向量化處理和尋址操作,從而實(shí)現(xiàn)了視覺(jué)信息的高效處理。
最后,此次研究提出了一種自適應(yīng)在線訓(xùn)練方法來(lái)校正系統(tǒng)誤差累積,而這種自適應(yīng)的訓(xùn)練方法通過(guò)測(cè)量神經(jīng)網(wǎng)絡(luò)內(nèi)部的狀態(tài)實(shí)現(xiàn)對(duì)計(jì)算參數(shù)的實(shí)時(shí)調(diào)整。因此,在不依賴網(wǎng)絡(luò)結(jié)構(gòu)且不增加系統(tǒng)復(fù)雜度的情況下,該DPU能夠普適于現(xiàn)有的光電智能計(jì)算系統(tǒng)。
“可以說(shuō)我們這次研究工作所提出的衍射光電智能計(jì)算體系構(gòu)架和理論方法在很大程度上解決了上述領(lǐng)域內(nèi)困擾已久的難題,通過(guò)構(gòu)建原型系統(tǒng)及可擴(kuò)展性分析驗(yàn)證了光電智能計(jì)算的優(yōu)越性和巨大潛力,為研發(fā)高性能光電智能處理器和芯片打開(kāi)了更為廣闊的空間,也為促進(jìn)該領(lǐng)域的發(fā)展及其產(chǎn)業(yè)落地做出了一定貢獻(xiàn)?!绷中茄a(bǔ)充道。
分類識(shí)別精度有所提升
取得這樣的成績(jī)并不容易。事實(shí)上,在研究之初,該團(tuán)隊(duì)研究人員就已經(jīng)對(duì)前路的崎嶇有著充足的心理準(zhǔn)備?!拔覀兊难芯磕繕?biāo)是要通過(guò)解決光電智能計(jì)算領(lǐng)域中的難點(diǎn)問(wèn)題,提高其在執(zhí)行分類和識(shí)別等任務(wù)上的模型與實(shí)驗(yàn)精度?!绷中腔貞浾f(shuō)。
起初,研究人員構(gòu)建的全連接的網(wǎng)絡(luò)模型性能有限,也曾經(jīng)受到系統(tǒng)不穩(wěn)定的困擾。不過(guò),解決問(wèn)題的過(guò)程就是團(tuán)隊(duì)不斷創(chuàng)新的過(guò)程。團(tuán)隊(duì)成員經(jīng)過(guò)反復(fù)討論并調(diào)整光電神經(jīng)網(wǎng)絡(luò)構(gòu)架和超參數(shù),最終創(chuàng)建了網(wǎng)絡(luò)中網(wǎng)絡(luò)模型?!拔覀兊墓怆娚窠?jīng)網(wǎng)絡(luò)在MNIST手寫數(shù)據(jù)集和Fashion-MNIST時(shí)尚產(chǎn)品數(shù)據(jù)集上的模型精度都超越了卷積神經(jīng)網(wǎng)絡(luò)LeNet-4,并逼近LeNet-5?!绷中潜硎?。
而且,通過(guò)不斷進(jìn)行的硬件系統(tǒng)優(yōu)化,包括更換所采用的光電器件及其相應(yīng)機(jī)械固定件設(shè)計(jì)等,以及開(kāi)發(fā)自適應(yīng)訓(xùn)練算法,研究人員也提升了系統(tǒng)實(shí)驗(yàn)的穩(wěn)定性。
“此外,我們也花了大量的時(shí)間優(yōu)化和升級(jí)光電器件的數(shù)據(jù)接口,以提升系統(tǒng)帶寬和數(shù)據(jù)調(diào)控速度,最終實(shí)現(xiàn)了高速的圖像和視頻的分類識(shí)別?!绷中歉嬖V記者,“運(yùn)行同樣的神經(jīng)網(wǎng)絡(luò),光電計(jì)算系統(tǒng)與特斯拉V100圖形處理器(GPU)相比,計(jì)算速度提高了8倍,系統(tǒng)能效提升超過(guò)1個(gè)數(shù)量級(jí),核心模塊計(jì)算能效則能夠提升4個(gè)數(shù)量級(jí)?!?/p>
有望讓我國(guó)在新一輪科技變革中占得先機(jī)
“長(zhǎng)期以來(lái),我國(guó)在電子計(jì)算以及芯片領(lǐng)域受到高精度光刻機(jī)等制約,一直處于落后位置。光電計(jì)算為我國(guó)擺脫這一制約提供了可能?!贝鳝偤8嬖V《中國(guó)科學(xué)報(bào)》,“光電智能計(jì)算與芯片是一個(gè)非常廣闊的前沿研究領(lǐng)域,這需要多學(xué)科的交叉融合。希望我們的研究工作能夠吸引國(guó)內(nèi)更多不同背景的科研人員和研究機(jī)構(gòu)從事這個(gè)領(lǐng)域的研究,從而推動(dòng)我國(guó)在該領(lǐng)域?qū)W術(shù)圈乃至產(chǎn)業(yè)生態(tài)圈的建設(shè)?!?/p>
戴瓊海團(tuán)隊(duì)抓住光學(xué)計(jì)算與芯片發(fā)展的機(jī)遇,在其原理驗(yàn)證和原型系統(tǒng)的構(gòu)建等方面率先展開(kāi)了原創(chuàng)性的研究工作,所提出的計(jì)算范式將促進(jìn)領(lǐng)域光電材料、光電器件、加工工藝以及集成方法的研發(fā)。
談及未來(lái),戴瓊海與林星皆表示,將進(jìn)一步挖掘光電智能計(jì)算技術(shù)的潛力,致力于解決系統(tǒng)小型化和芯片集成的難點(diǎn)問(wèn)題?!拔覀儗⑹褂贸牧蠘?gòu)建片上相控陣列實(shí)現(xiàn)原型系統(tǒng)的芯片集成,從而更為全面地體現(xiàn)光電智能計(jì)算的優(yōu)越性?!贝鳝偤Uf(shuō)。
巴黎中央理工—高等電力學(xué)院教授Daniel Brunner與瑞士聯(lián)邦理工學(xué)院洛桑分校教授Demetri Psaltis認(rèn)為,這項(xiàng)研究的準(zhǔn)確性與能源效率,都可以和競(jìng)爭(zhēng)性數(shù)字NN基準(zhǔn)測(cè)試模型以及現(xiàn)代GPU相媲美,并證明了光學(xué)解決方案與未來(lái)高性能計(jì)算的相關(guān)性。“這項(xiàng)研究的非線性運(yùn)算放大了數(shù)據(jù)表示的維數(shù),最終使NN能夠挖掘出隱藏的特征,進(jìn)而利用它們來(lái)進(jìn)行具有挑戰(zhàn)性的計(jì)算。盡管其互連受到嚴(yán)格限制,但是它們通過(guò)級(jí)聯(lián)多層實(shí)現(xiàn)了競(jìng)爭(zhēng)性能。”
“這一工作屬于我們研究路徑規(guī)劃中的階段性成果。我們預(yù)期最終集成化的光電智能芯片能夠?qū)崿F(xiàn)光載海量信息的實(shí)時(shí)處理,將極大促進(jìn)其在終端計(jì)算、邊緣端計(jì)算、數(shù)據(jù)中心的應(yīng)用,推動(dòng)自動(dòng)駕駛、機(jī)器人技術(shù)領(lǐng)域的發(fā)展。其中,小型化的空間光智能光電計(jì)算系統(tǒng)可應(yīng)用于空間光通信,與視覺(jué)成像系統(tǒng)融合實(shí)現(xiàn)光載視覺(jué)信息(包括高維光譜視覺(jué)信息及光場(chǎng)視覺(jué)信息)的實(shí)時(shí)處理。同時(shí),集成化的光電智能計(jì)算系統(tǒng)還能夠和光纖通信融合,實(shí)現(xiàn)大規(guī)模光信息的高效處理,應(yīng)用于無(wú)線通信、云計(jì)算和數(shù)據(jù)中心等領(lǐng)域,從而引領(lǐng)新一代智能產(chǎn)業(yè)和信息技術(shù)的變革?!绷中钦雇馈?/p>
相關(guān)論文信息:https://doi.org/10.1038/s41566-021-00796-w
《中國(guó)科學(xué)報(bào)》 (2021-05-06 第3版 信息技術(shù))