人民網北京7月4日電 (記者趙竹青)近日,北京大學集成電路學院楊玉超教授、人工智能研究院陶耀宇研究員領銜的科研團隊在智能計算硬件領域取得突破,首次實現了基于存算一體技術的高效排序硬件架構。這一成果攻克了傳統計算架構處理復雜非線性排序時效率低下的核心難題,為具身智能、大語言模型、智能駕駛、智慧交通與智慧城市等人工智能應用提供了全新的高效算力支持。相關研究發表于國際學術期刊《自然·電子》。
在人工智能系統中,排序通常作為數據預處理或決策中間環節存在,一旦執行效率不高,將成為整個系統的主要瓶頸。存算一體技術雖在矩陣計算等規則運算中成效顯著,卻因排序操作邏輯復雜、非線性強、數據訪問不規則等特性,長期被視為該領域的核心難點。
北京大學團隊圍繞“讓數據就地排序”的目標展開攻關,取得系列核心技術突破:開發了一套基于新型存內陣列結構的高速位讀取機制;開創性地引入了憶阻器陣列,實現了低延遲、多通路的硬件級并行排序電路設計;在算子層面,優化了面向人工智能任務的算法-架構協同路徑,同時兼容現有矩陣計算;完全自主設計的器件-電路-系統級技術棧整合。
“排序的核心在于復雜條件下的精準比較與數據搬移,傳統存算一體架構難以支持此類運算。”論文第一作者、北京大學集成電路學院博士生余連風介紹,“團隊創新性地設計出‘無比較器’存算一體排序架構,成功解決了這一難題?!?/p>
實測結果顯示,該硬件方案在典型排序任務中提升速度超15倍,面積效率提升超過32倍,具備并行處理百萬級數據元素排序任務的潛力,功耗僅為傳統CPU或GPU處理器的1/10。在人工智能推理場景中,支持動態稀疏度下的推理響應速度可提升70%以上,特別適用于要求極高實時性的任務環境。
論文通訊作者、北京大學人工智能研究院陶耀宇研究員說,“正因為排序計算在人工智能中是高頻、通用、基礎且極難處理的一類操作,這一難題的突破意味著存算一體從‘適合特定應用’走向‘可支持更廣泛的通用計算’,為人工智能相關任務構建了全鏈路的底層硬件架構支持?!?/p>
陶耀宇介紹,該技術具有廣泛的應用前景,可用于智慧交通圖像排序系統、金融智能風控評分引擎、邊緣監控設備的目標優先識別模塊等場景。在測試中該技術展現出高速度與低功耗的顯著優勢。例如,在智慧交通場景中,系統有望在毫秒級內完成十萬級事件優先級評估,為超大規模交通決策、應急響應調度等提供高效的實時算力支持。