發展異構計算 宋繼強分享英特爾最新底層技術創新進展

近日,英特爾研究院副總裁、英特爾中國研究院院長宋繼強博士出席了由中國計算機學會主辦的第一屆“中國計算機學會芯片大會”,並發表了題爲“堅持半導體底層技術創新,激發算力千倍級提升”的主題演講。在演講中,針對“突破算力瓶頸,滿足多元計算需求”這一產學研界所普遍關注的熱門話題,宋繼強博士分享了英特爾的最新洞察,以及在相關領域所取得的技術進展。

中國目前正走在全球數字化轉型浪潮的前列,發展數字經濟也成爲中國把握新一輪科技革命和產業變革新機遇的戰略選擇。宋繼強表示,對數字經濟的發展而言,底層基礎設施提供的算力、計算效率等方面的支持十分關鍵,此外,爲了讓這些基礎設施的性能得到最大限度的發揮,需要構造一個以能源、計算能效性爲優先綜合佈局的新型算力網絡。中國開始佈局“東數西算”工程,也正是基於計算和網絡融合的需要。

因此,在數字經濟的增長過程中,對算力的需求會“水漲船高”,一方面,數據量會保持指數級增長,另一方面,數據形態也會越來越多元化,對計算的實時性和智能化處理能力的要求也越來越高。從數據量和質來看,傳統的單一計算架構肯定會遇到性能和功耗的瓶頸。爲了應對這一挑戰,宋繼強強調,首先要突破算力的瓶頸,通過不同的方式解決多樣化數據的計算有效性,而在提升算力的同時,還需要考慮到“綠色計算”這個主題,以能量優化的方式解決數據處理的問題。

發展異構計算與異構集成技術

基於這兩點原則,宋繼強認爲異構計算和異構集成是算力突破的新抓手。異構計算就是用不同的架構處理不同類型的數據,真正做到“用好的工具解決好的問題”。異構集成則可以把不同工藝下優化好的模塊更好地集成到未來的解決方案當中,從而更加高效地處理複雜計算。

宋繼強表示,建立完整的異構計算體系需要軟硬件結合,在硬件上,需要“全面發展”,有不同的架構積累,在軟件上,也需要有一套方便且好用的軟件,只需上層應用者指定功能需求,下層就可以隨着異構變化。具體到英特爾自身的異構計算佈局,表現爲“XPU+oneAPI”,既有非常全面的硬件架構佈局,覆蓋從終端到邊緣再到服務器,在 CPU、GPU、IPU、FPGA、AI 加速器等領域,都有具有代表性的成熟產品,又有 oneAPI 這一開放統一的跨架構編程模型,讓現有的和未來將出現的新硬件都能很好地發揮能力。oneAPI 也在全球積極開展各項合作,去年還和中科院計算所聯合建立了中國首個 oneAPI 卓越中心。

實現異構計算常常需要將不同製程節點的芯片封裝在同一個大封裝裡,這時就需要應用異構集成,也就是先進封裝技術,來滿足尺寸、成本、帶寬等方面的要求。宋繼強介紹,英特爾在異構集成上主要有兩項技術,2.5D 封裝技術 EMIB 能把在平面上集成的芯片很好地連接起來,3D 封裝技術 Foveros 則可以通過把不同尺寸的芯片在垂直層面上封裝,進一步降低封裝凸點的間距,提高封裝集成的密度。

宋繼強進一步補充,Foveros Omni 和 Foveros Direct 是英特爾在 3D 封裝上未來會使用的兩種技術。在上面是一個大的芯片,底下是幾個小芯片的時候,Foveros Omni 可以把不同芯片之間互連的接觸點間距微縮到 25 微米,同時還可以通過封裝邊上的銅柱直接給上層芯片供電,和 EMIB 相比有接近 4 倍的密度提升。Foveros Direct 則通過一種更高級的不需要焊料、直接讓銅對銅鍵合的技術,實現更低電阻的互連,進一步縮小凸點間距到 10 微米以下,將整個互連的密度提升到新的數量級。

目前,英特爾迄今爲止最複雜的高性能計算 SoC Ponte Vecchio 就運用了英特爾在異構計算和異構集成上的新技術,集成了來自 5 個不同製程節點的 47 種不同晶片,而下一代旗艦級數據中心 GPU 代號 Rialto Bridge 將進一步大幅提高計算密度、性能和效率,同時通過 oneAPI 提供軟件一致性。

堅持推進摩爾定律

爲了突破算力瓶頸,在異構計算與異構集成技術之外,還需要堅持推進摩爾定律,打造功耗更低,性能更強的半導體。宋繼強在演講中也介紹了英特爾的製程工藝革新和路線圖。

宋繼強表示,英特爾的製程工藝革新主要包括以下三大技術:在工具上,英特爾將自 Intel 4 開始使用下一代基於高數值孔徑的極紫外光刻機(EUV)技術,降低整個製程工藝的複雜度,提高良率;在晶體管結構上,Intel 20A 將使用全新的 RibbonFET 結構,進一步降低平面上晶體管所佔面積,同時可以有更快的驅動速度,也增加驅動電流的強度;在供電層面,Intel 20A 同樣將啓用全新的 PowerVia 技術,實現底部給所有上層功能邏輯部件供電,把供電層和邏輯層完全分開,從而可以更有效地使用金屬層,大幅減少繞線和能量消耗。

在路線圖方面,英特爾計劃在四年內推進五個製程節點:Intel 7 已經開始批量出貨;Intel 4 將於今年下半年投產,採用 EUV 技術,將晶體管的每瓦性能將提高約 20%;Intel 3 將於 2023 年下半年投產,在生產過程當中會更大量地使用 EUV,在每瓦性能上實現約 18%的提升;Intel 20A 預計將於 2024 年上半年投產,通過 RibbonFET 和 PowerVia 這兩項技術在每瓦性能上實現約 15%的提升;最後,Intel 18A 預計將於 2024 年下半年投產,在每瓦性能上將實現約 10%的提升。宋繼強表示,目前英特爾在 Intel 18A 和 Intel 20A 上都取得了不錯的進展。

探索前沿研究領域

展望未來,一些新興、前沿研究領域有望爲計算帶來更多的可能性。宋繼強分享了英特爾在以下三個領域所取得的主要進展:組件研究、神經擬態計算和集成光電。

在組件研究上,英特爾的工作主要圍繞三方面展開:第一,是提供更多的核心微縮技術,涵蓋混合鍵合(hybrid bonding)技術、CMOS 晶體管 3D 堆疊技術和對晶體管新材料的探索;第二,通過疊加新的晶體管材料和結構,給硅晶體管注入新的功能,包括增強模式的高 K 氮化鎵晶體管和硅 FinFET 晶體管的組合技術,以及反鐵電體材料的嵌入式內存;第三,是量子領域的工作,包括應用在邏輯計算的磁電自旋電子器件,磁疇壁電子器件和 300 毫米量子比特製程工藝流程。

神經擬態計算可以直接模擬人類神經元的形式構造芯片底層的計算單元,再通過脈衝神經網絡的方式編程實現人工智能算法,與傳統上主要使用 CPU 和 GPU,靠堆乘加器的方式提供算力的模式相比,可以實現能效比千倍級以上的提升。宋繼強介紹,目前英特爾的神經擬態計算芯片已經發展到了第二代 Loihi 2,基於 Intel 4 製程工藝,速度比上一代提升了 10 倍,單個芯片裡的神經元數量也提升了 8 倍,達到 100 萬。同時,英特爾也推出了一套完整的開源的軟件框架 Lava 對神經擬態計算的開發提供全面支持,並和北京大學、復旦大學、鵬城實驗室、中科院自動化所、聯想等近 200 家國內外合作伙伴一起提升計算的效率。

在集成光電上,英特爾則致力於大幅提高光電轉換效率。在關鍵技術構建模塊上,英特爾基於 CMOS 工藝,實現了在一個平臺上集成所有的關鍵光學技術構建模塊,包括光的產生、放大、檢測、調製等等,大幅降低了尺寸和功耗;在器件層面,英特爾研製了一個集成在硅晶圓上的 8 波長激光器陣列,提升了準確性和能效比,爲以後光電共封裝和光互連器件的量產鋪平了道路。此外,英特爾也繼續和大學合作,在高速光互連、I/O 技術、性能擴展和節能方面做廣泛的研究。

未來,英特爾將繼續攜手產學研界各合作伙伴,推動綠色半導體創新,實現千倍級算力提升,並且對地球生態的可持續發展做出貢獻。