中國光計算芯片領域取得重大突破。
據最新消息,上海交通大學科研人員近日在新一代光計算芯片領域取得重大突破,首次實現支持大規模語義媒體生成模型的全光計算芯片LightGen,相關成果12月19日發表于《科學》雜志。
光計算具有可擴展、低功耗、超高速、寬帶寬、高并行度的天然優勢,是破解高維張量運算、復雜圖像處理等大規模數據快速計算的關鍵技術,為人工智能(AI)、科學計算、多模態融合感知、超大規模數據交換等“算力密集+能耗敏感”場景提供硬件加速。
重大突破
據新華社消息,上海交通大學科研人員近日在新一代光計算芯片領域取得突破,首次實現了支持大規模語義媒體生成模型的全光計算芯片。
據了解,隨著深度神經網絡和大規模生成模型迅猛演進帶來超高算力和能耗需求,傳統芯片架構的性能增長速度已出現嚴重缺口,光計算等新型架構受到廣泛關注。
“所謂光計算,可以理解為,不是讓電子在晶體管中運行,而是讓光在芯片中傳播,用光場的變化完成計算。光天然具備高速和并行的優勢,因此被視為突破算力與能耗瓶頸的重要方向。”論文作者、上海交大集成電路學院助理教授陳一彤表示,把光計算真正用到生成式AI上并不簡單,已有的全光計算芯片主要局限于小規模、分類任務,光電級聯或復用又會嚴重削弱光計算速度。如何讓下一代算力光芯片運行復雜生成模型,是全球智能計算領域公認的難題。
陳一彤課題組此次提出并實現了全光大規模語義生成芯片LightGen,采用極嚴格算力評價標準的實測表明:即便采用性能較滯后的輸入設備,LightGen仍可取得相比頂尖數字芯片2個數量級的算力和能效提升。團隊表示,LightGen之所以實現性能飛躍,在于其在單枚芯片上同時突破了“單片上百萬級光學神經元集成”“全光維度轉換”“不依賴真值的光學生成模型訓練算法”三項關鍵瓶頸,使得面向大規模生成任務的全光端到端實現成為可能。
據介紹,LightGen可完整實現“輸入—理解—語義操控—生成”的閉環,完成高分辨率(≥512×512)圖像語義生成、3D生成(NeRF)、高清視頻生成及語義調控,同時支持去噪、局部與全局特征遷移等多項大規模生成式任務。
“LightGen為新一代光計算芯片助力前沿AI開辟了新路徑,也為探索更高速、更高能效的生成式智能計算提供了新的研究方向。”陳一彤說。
光計算的優勢
光計算作為非馮·諾伊曼結構代表,具有可擴展、低功耗、超高速、寬帶寬、高并行度的天然優勢,是后摩爾時代破解高維張量運算、復雜圖像處理等大規模數據快速計算的關鍵技術,為AI、科學計算、多模態融合感知、超大規模數據交換等“算力密集+能耗敏感”場景提供硬件加速。過往幾年,學術界和產業界持續對光計算芯片的矩陣規模、光學主頻開展深度探索,以臺積電的光計算芯片矩陣規模(~512x512)和美國加州理工學院的光計算光學主頻(>100GHz)為典型代表,分別呈現逼近工藝極限和物理極限的趨勢,進一步取得突破難度頗大。
因而,有效擴展計算并行度是光計算性能提升的前沿發展方向,也是光計算邁向實用的必由之路。
今年6月17日,據中國科學院上海分院官網消息,中國科學院上海光學精密機械研究所空天激光技術與系統部謝鵬研究員團隊在解決“光芯片上高密度信息并行處理”難題上取得突破,研制出超高并行光計算集成芯片——“流星一號”,實現了并行度>100的光計算原型驗證系統。
相關研究成果以《具備100波長復用能力的并行光計算》(Parallel Optical Computing Capable of 100-Wavelength Multiplexing)為題,以封面論文形式發表于《光:快訊》。
上海光機所研究團隊圍繞光計算技術并行度提升,創新超高并行光計算架構,破解光計算芯片的信息高密度信道串擾抑制、低時延光信號高精度同步和跨尺度高密度器件集成等核心挑戰,在融合了多波長光源、高速光交互、可重構光計算、高精度光矩陣驅動和并行光電混合計算算法的基礎上,成功研發了全新片上并行光計算集成芯片系統。
該系統核心光芯片全部自主研制,包含了自主研制的集成微腔光頻梳(頻率間隔~50GHz,輸出光譜范圍>80nm,可支撐波長復用計算通道數>200),作為芯片級多波長光源子系統;自主研制的大帶寬、低時延、可重構光計算芯片(通光帶寬>40nm),作為高性能并行計算核心;自主研制的高精度、大規模、可擴展的驅動板卡,作為光學矩陣驅動子系統(通道數>256);基于該光子集成芯片系統,首次驗證了并行度>100的片上光信息交互與計算原型;在50GHz光學主頻下,單芯片理論峰值算力>2560TOPS ,功耗比>3.2TOPS/W。
此研究進展為突破光計算的計算密度瓶頸,提升光計算性能開辟了新途徑,為發展低功耗、低時延、大算力、高速率的超級光子計算機帶來了可能性。