中科院計算所等機構推出了世界首個完全由AI設計的CPU芯片,不僅比目前GPT-4所能設計的電路規模大了4000倍,而且性能也達到了與Intel 486相當的水平。
中科院計算所的處理器芯片全國重點實驗室及其合作單位,用AI技術設計出了世界上首個無人工干預、全自動生成的CPU芯片——啟蒙1號。 這顆完全由AI設計的32位RISC-V CPU,相比GPT-4目前所能設計的電路規模大4000倍,并可運行Linux操作系統,且性能堪比Intel 486。 而這項研究,更是有望顛覆傳統的芯片設計流程!
論文地址:https://arxiv.org/pdf/2306.12456
世界首個AI全自動生成的CPU芯片
眾所周知,CPU設計是一項非常挑戰且耗費人力和資源的工作。 這通常需要由工程師團隊編寫代碼(如Verilog、Chisel或C/C++等),然后在電子設計自動化(EDA)工具(如邏輯綜合或高層次綜合工具)的輔助下生成電路邏輯。 除此之外,工程師團隊針對人工編寫的代碼,還需反復使用測試用例對其進行迭代的功能驗證和性能/功耗優化。 然而,該過程極其復雜瑣碎,通常需要上百人團隊迭代數月或數年才能完成。以典型Intel CPU為例,超過500位工程師花了兩年時間才完成整個設計過程[1]。
為了減少人力和資源投入,研究人員采用AI技術直接從測試用例的輸入-輸出(IO)自動生成CPU設計,無需工程師提供任何代碼或自然語言描述。 該方法在5小時內生成了超過4,000,000個邏輯門的32位RISC-V CPU——啟蒙1號(見圖1),比目前GPT-4所能設計的電路規模大4000倍。
圖1 啟蒙1號芯片版圖及實物圖,其中CPU核部分完全由算法自動生成,芯片于2021年12月采用65nm工藝流片,運行頻率300MHz
該CPU于2021年12月流片,回片后成功運行了Linux操作系統和SPEC CPU 2000程序,其性能與Intel 486 CPU相當(見圖2)。 啟蒙1號是世界上首個無人工干預、全自動生成的CPU芯片。該方法甚至自主地發現了包含控制器和運算器等在內的馮諾依曼架構,為后續發現人類未知的體系結構優化知識提供了參考。
圖2啟蒙1號芯片可以成功運行Linux操作系統及性能對比(CPU-AI為啟蒙1號)
全自動CPU設計:設計流程及挑戰
與傳統CPU設計流程中需要大量人工參與不同,研究人員考慮使用「輸入-輸出(IO)」作為輸入,因為IO可以從大量現成的測試用例中直接獲取或自動生成。 因此,可以將CPU自動設計問題形式化為「滿足輸入-輸出規范的電路邏輯生成問題」。 這也使得傳統的CPU設計流程發生了巨大變化:只需測試用例即可以直接生成滿足功能需求的電路邏輯,摒棄了傳統設計流程中非常耗時的、依賴人工的邏輯設計與驗證環節(見圖3)。
圖3 (a)傳統的CPU設計流程包括耗時的邏輯設計與驗證;(b)所提出的全自動CPU設計流程直接從IO生成保證功能正確的電路邏輯
然而,從IO生成滿足規范的電路邏輯面臨兩大挑戰: (1)規模挑戰:在沒有任何專家給出的形式化或非形式化電路描述時,設計空間大小等同于全部可能存在的電路設計。對于以IO描述的電路來說,一個典型RISC-V CPU的設計空間約為;在如此巨大空間中找到功能正確的CPU超出了當前自動化設計方法的能力; (2)精度挑戰:生成的目標電路邏輯必須要足夠精確(例如功能驗證準確率>99.99999999999%),否則任何微小錯誤都將造成巨大損失,這遠遠超過了傳統AI算法和應用對精度的要求。
符號主義的重生:基于BSD的電路自動設計方法
針對前面所提到的挑戰,不同于傳統基于連接主義的深度學習方法,研究人員所提出的方法是基于對二元決策圖(Binary Decision Diagram,BDD)進行擴展的二元猜測圖(Binary Speculation Diagram, BSD)。 與傳統的BDD構建依賴于形式化的描述不同,BSD使用常數0/1對BDD中的子圖進行功能猜測。 在設計流程中,首先使用僅有1個節點的BSD作為對未知黑盒函數的初始估計,然后利用動態規劃方法逐步增加BSD中的節點個數,從而豐富電路細節(見圖4)。該工作理論上證明了隨著BSD節點個數的增加,其電路準確率會逐步提升。
圖4 具體的電路生成流程:從1個節點的BSD出發,逐步增加BSD中的節點個數以豐富電路細節
自主發現人類知識:蘊含馮諾依曼架構的CPU
此外,從IO自動生成的RISC-V CPU并不是雜亂無章的黑盒邏輯,而是蘊含了馮諾依曼架構的人類知識:由BSD表示的CPU設計包含了控制單元和運算單元(見圖5)。 其中控制單元是由BSD的頂層生成,用于整個CPU的全局控制,而運算單元則完成算術和邏輯運算。 同時上述單元可以進一步分解為更細粒度的子模塊,如譯碼器和ALU等,直到其最底層由基本的邏輯門構成。
圖5 自主發現馮諾依曼結構:啟蒙1號中包含了控制單元和運算單元,同時可以進一步分解為更細粒度的子模塊
對比與展望:不同人工智能路徑的交叉探索
自動的電路邏輯設計長期以來都是計算機科學的核心問題之一[2]。 近年來隨著人工智能技術的發展,也出現了一批基于行為主義和連接主義(如深度強化學習和GPT-4大語言模型等)的自動邏輯設計工作(見表1)。
表1自動邏輯設計的代表工作對比情況 可以看出,相關工作主要聚焦于生成單個模塊或小規模CPU,其規模與實際CPU芯片還有多個數量級的差距。 中科院計算所團隊及其合作單位(包括中科院軟件所、中科大、寒武紀公司等)所提出的方法生成了超過4,000,000個邏輯門的完整RISC-V CPU,相比目前GPT-4所能設計的電路規模大4000倍。 同時,該工作在符號主義的框架下從理論上保證了功能正確性,顛覆了傳統流程中的邏輯設計和功能驗證環節。 未來,通過符號主義、行為主義及連接主義等不同人工智能路徑的交叉探索,自動生成的CPU有望在5年或10年內達到甚至超越人類專家所設計的CPU,徹底顛覆現有的芯片設計流程。
團隊介紹
自2008年起,中科院計算所便開始長期從事芯片設計和人工智能的交叉研究。其中一項為人熟知的產出就是人工智能芯片寒武紀。
而在面向芯片設計的人工智能方法上,中科院計算所也已有十多年的積累,并且從未停止探索如何用人工智能方法使得芯片設計完全自動化。
依托中國科學院計算技術研究所建立的處理器芯片全國重點實驗室,是中國科學院批準正式啟動建設的首批重點實驗室之一,并被科技部遴選為首批 20個標桿全國重點實驗室,2022年5月開始建設。
其中,實驗室學術委員會主任為孫凝暉院士,實驗室主任為陳云霽研究員。
實驗室近年來獲得了處理器芯片領域首個國家自然科學獎等6項國家級科技獎勵;在處理器芯片領域國際頂級會議發表論文的數量長期列居中國第一;在國際上成功開創了深度學習處理器等熱門研究方向;孵化了總市值數千億元的國產處理器產業頭部企業。
-
cpu
+關注
關注
68文章
10905瀏覽量
213032 -
AI
+關注
關注
87文章
31536瀏覽量
270352 -
自動化
+關注
關注
29文章
5622瀏覽量
79670 -
人工智能
+關注
關注
1796文章
47683瀏覽量
240311
原文標題:世界首顆AI全自動設計CPU!中國團隊重磅推出,性能堪比486,規模提升4000倍
文章出處:【微信號:WW_CGQJS,微信公眾號:傳感器技術】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
走進"香山":解密國產開源處理器的技術創新
阿里達摩院發布玄鐵R908 CPU
【龍芯2K0300蜂鳥板試用】1 龍芯中科必知3件事
中科院半導體所在高性能電泵浦拓撲激光器研發方面獲進展
![<b class='flag-5'>中科院</b>半導體所在高性能電泵浦拓撲激光器研發方面獲進展](https://file1.elecfans.com//web2/M00/EF/9A/wKgZomZwuaGAJ_cWAAE_68sYF7g886.jpg)
業界首個一云多芯遷移標準 中國信通院聯合浪潮云海發布
![業<b class='flag-5'>界首個</b>一云多芯遷移標準 中國信通<b class='flag-5'>院</b>聯合浪潮云海發布](https://file1.elecfans.com//web2/M00/E4/62/wKgZomY_aSWAL03sAADyub0QpCM961.jpg)
評論