以深度學習為代表的人工智能技術已在包括自動駕駛、醫療診斷、語音翻譯等眾多領域帶來巨大的變革。隨著深度學習算法的迅猛發展,人工神經網絡規模的不斷增大,迫切需要不斷提升計算處理器的運算速度和能效。采用傳統電子計算方式已經越來越難以滿足未來人工智能對處理器計算性能的需求。近年來,基于光計算高速、低功耗、高并行的顛覆性優勢,通過光電融合的方式構建光學神經網絡與智能光電計算處理器已經成為國際信息技術前沿的熱點研究領域。
然而,現有的光電智能計算技術距離實際應用還面臨著以下挑戰:(1)模型構架簡單,現有的光學神經網絡模型復雜度較低,光學非線性實現較為困難,因此模型性能與電子的人工神經網絡有較大的差距;(2)系統誤差難校正,光計算系統誤差大小和系統復雜度成正相關,因此誤差校正算法對于構建大規模智能光計算系統至關重要,然而迄今為止尚缺普適性的誤差校正方法;(3)系統重構困難,現有光學神經網絡結構難以重構,因此計算功能單一,而網絡參數編程則依賴較為復雜的光學效應,大規模參數的快速精準寫入仍存在困難。
圖一:光電智能衍射計算處理器的基本原理
針對上述挑戰,來自清華大學信息學院的戴瓊海教授研究團隊提出并構建了光電智能衍射計算處理器(Diffractive Processing Unit, DPU),能夠有效地重構實現包含百萬神經元的多類新型光電神經網絡,通過自適應的在線訓練算法實現了高性能的視覺分類任務,并驗證了光電智能計算的優越性。
DPU 的構架采用了光學衍射的物理現象,能夠產生大規模的光學互聯,從而助力構建高復雜度的光學神經網絡(圖一)。此外,該光學處理器原理充分利用了光的波粒二象性,神經網絡權重的調整通過控制光波傳播的波前分布來實現,采用光電效應能夠實現人工神經元的功能。DPU 的運行過程光計算部分則幾乎承擔所有的計算操作,采用高通量可編程的光電器件并結合電子計算的靈活特性,能夠實現高速數據調控以及大規模網絡結構和參數的編程。“在這項工作中我們定義了光電的衍射人工神經元,能夠實現對衍射光場的線性加權求和以及非線性激活響應,這是構建復雜光電深度學習系統的基礎。” 林星特聘研究員說到。
通過軟件編程重構 DPU 實現了包括前饋和循環的多種類型的深度神經網絡架構,每個神經網絡都包含數百萬個神經元,具備較高的模型復雜度。這些神經網絡通過所提出的自適應在線訓練方法校正系統誤差累積,從而優化實驗計算性能。這種自適應的訓練方法通過測量神經網絡內部的狀態實現對計算參數的實時調整,因此不依賴網絡結構,能夠普適于現有的光電智能計算系統。
將所構建的系統應用于分類和識別任務,并在深度學習的標準數據集上進行了性能驗證,包括手寫數字圖像數據集(MNIST,圖二)、時尚物品圖像數據集(Fashion-MNIST),以及人類動作視頻數據集(Wetzmann 和 KTH,圖三)。光電智能計算模型性能首次超越了 LeNet-4 電子神經網絡模型。系統還能實現高速、高精度的人類動作識別。運行同樣的神經網絡,光電計算系統與特斯拉 V100 圖形處理器(GPU)相比,計算速度提高了 8 倍,系統能效提升超過一個數量級,核心模塊計算能效則能夠提升四個數量級。
戴瓊海教授指出,“當前光電智能計算技術的潛力還有待深入挖掘,未來使用超材料構建片上相控陣列,能夠極大提升處理器的計算性能,而實現光電計算機的目標則需要多學科的交叉融合。” 未來已來,推動類腦光電子芯片的研發將極大促進人工智能的發展,將為大規模數據的實時智能處理,高速低功耗智能化無人系統,以及從十億像素到百億像素光場成像奠定基礎,具備極為廣闊的應用前景。
這項工作發表在 Nature Photonics 期刊上,周天貺博士研究生為該論文的第一作者,林星特聘研究員(清華腦與認知科學研究院、未來芯片技術高精尖創新中心)、方璐副教授(清華電子系)、戴瓊海教授(北京信息科學與技術國家研究中心)為通訊作者。工作得到了國家科技部和國家自然科學基金委的支持。
原文標題:清華團隊打造光學人工智能,讓《三體》中的計算機成為現實
文章出處:【微信公眾號:DeepTech深科技】歡迎添加關注!文章轉載請注明出處。
責任編輯:haq
-
人工智能
+關注
關注
1796文章
47683瀏覽量
240336 -
深度學習
+關注
關注
73文章
5516瀏覽量
121559
原文標題:清華團隊打造光學人工智能,讓《三體》中的計算機成為現實
文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論