高效能運算帶動零組件需求、產品創新
全球高效能運算供應商市佔率
高效能運算的零組件可分爲伺服器、儲存、網路設備、雲端與其他支援軟硬體服務,其中伺服器在2021年爲主流,這歸因於廠商在數位化轉型趨勢下,持續投資託管與本地基礎設施以支撐對公有云或混合雲的需求,推進企業資源整合、彈性生產系統、供應鏈管理等數位化轉型項目進程,從而帶動資料中心市場快速成長,促使資料中心數量逐年遞增。
該零組件市場重點在於主要的高效能運算伺服器供應,例如Fujitsu、聯想與IBM,因這些供應商能針對自研的高效能運系統,長期提供解決方案、維護管理與升級,以確保資料中心與設備可以正常運行。
再者,隨着資料中心持續擴建和伺服器的規格與效能要求提升,將帶動其垂直產業成長與創新,特別是儲存、通訊設備、晶片與系統,以維持資料中心運行,並利於解決方案、維護管理與軟硬升級。
HPC設計與軟體重要性
晶片雖是高效能運算的重要組成,但並不是高效能運算技術的全部,因高效能運算使用的CPU涉及到體系結構設計、高速互聯網路、並行檔案系統、儲存陣列等方面,因此對CPU堆砌較爲複雜、技術壁壘高,即使堆再多的CPU高效能運算,其整體效能提高的程度也有限。
此外,隨着運算力增強、應用課題規模與複雜度的增加,Supercomputer對並行檔案系統的效能要求也隨之提高。
故高效能運算的技術溢出效益也相對明顯,尤其伺服器可平滑地採用高效能運算的互聯技術、CPU技術、作業系統技術與並行軟體設計等技術,使得在高效能運算方面的技術累積也能自然溢出到伺服器產業,甚至可以應用在資料中心、智慧運算中心,透過雲端形式提供服務。
以實現AI需求爲例,推理、訓練與模擬爲AI的3個主要任務,在此維度上,晶片的應用上限由其底層構造決定,即使採用軟體優化也無法再提升。
從晶片層面來看,若底層晶片採用的是CPU+專用AI晶片,其只能完成AI推理和訓練的任務,無法完成模擬。
因AI晶片無法實現雙精度浮點運算,雙精度浮點運算大量涉及線性代數求解,這也是HPE與Intel於2021年共同合作並參與Argonne National Laboratory(隸屬美國能源部)的Aurora百億億級電腦系統開發案,HPE也針對高效能晶片特性提供Apollo Systems、Superdome Flex伺服器,協助解決AI與端到端基礎設施的問題。