聯想加碼佈局AI算力
作者 | 劉寶丹
編輯 | 周智宇
面對AI帶來的確定性機遇,聯想提出AI for All的願景,算力就是其中最重要的一環。
近日,聯想正式發佈了包含服務器、存儲、數據網絡、邊緣在內的算力基礎設施新品,包括新一代服務器聯想問天WR5220 G5等,以及全新NetApp AFF A全閃系列、救急1110災備一體化解決方案,聯想問天100G核心交換機等。
這次發佈是對聯想“一橫五縱”AI導向的基礎設施版圖的進一步豐富。縱觀聯想發展算力的脈絡可知,聯想算力正在進入快速發展階段。
去年8月,聯想正式發佈AI算力戰略,提出全面打造以AI爲導向的算力基礎設施。今年2月,聯想在巴塞羅那世界移動通信大會(MWC)上首次公佈了“一橫五縱”戰略,由此揭開了聯想對算力基礎設施的發展藍圖。“一橫”是指聯想萬全異構智算平臺,“五縱”包括服務器、存儲、數據網絡、軟件及超融合、邊緣基礎設施產品和方案。
而在4月,聯想正式發佈了萬全異構智算平臺。其融合了聯想的五大技術創新,是AI 2.0時代大模型訓練和推理的基礎設施底座。聯想集團副總裁、中國基礎設施業務羣總經理陳振寬表示,該平臺是AI 2.0時代聯想基礎設施戰略框架的核心。
隨着這次新產品的發佈,無疑將推動聯想算力基礎設施加快落地。
以新一代服務器聯想問天WR5220 G5爲例,這是一款2U2S服務器,主要爲雲計算、大數據、人工智能中大型數據中心、虛擬化、在線交易、高性能計算、關鍵業務流和業務協同等場景提供算力。
再比如,全新發布的NetApp AFF A全閃存儲系列等產品,可爲生成式AI、虛擬化、企業數據庫等客戶IT工作負載提供助力,具備性能提升高達2倍、達到經過驗證的6個9的數據可用性等優勢。
加快佈局背後,聯想看中了AI人工智能技術迭代所帶來的市場機遇,尤其是正在爆發的AI算力需求。IDC預測,到2026年中國智算規模將達到1271.4 EFLOPS,未來五年複合增長率達52.3%,同期通用算力規模的複合增長率爲18.5%。
正如一個硬幣的兩面,在市場機遇背後是挑戰。世界上的主流科技公司都在重押AI,聯想要想在AI算力市場拿下更多份額,必須不斷提升實力,以應對激烈的市場競爭。
聯想可謂是對AI佈局最全面的企業之一,從AI智能終端、AI導向的基礎設施到AI原生的方案服務,聯想均有佈局。根據財報,2023年公司研發費用達148億元,研發投入規模約爲稅前淨利潤的6倍,可見其決心。
作爲一家有着40年發展歷程的科技企業,聯想成功穿過多輪技術週期,公司能否在AI時代重現昔日的榮光,時間會給出答案。
以下爲交流實錄(經編輯):
問:以大模型爲代表的AI技術發展迅猛,對中國算力基礎設施提出了哪些要求?
陳振寬:算力在今天人工智能的時代是一個核心的動能。2022年年底國際上出現了大模型ChatGPT,引爆了整個大語言模型的需求以後,在人工智能算力上取得了迅猛的發展。過去算力還是以通用算力爲基礎,大模型讓人工智能進入2.0時代,每年對算力的需求增速是10倍。
整個算力基礎設施還是不能非常好地滿足對算力的需求的,特別是以CPU爲算力的基礎設施肯定無法再滿足人工智能算力發展的需求,包括GPU、TPU等等新的加速計算的算力基礎設施得到了非常大的關注。在過去一年多的時間裡,加速計算從20%左右的佔比到了去年超過1/3的佔比,這是算力的發展。
問:未來我國算力產業將如何發展?聯想準備如何承接這一趨勢?有哪些佈局?
陳振寬:算力不僅是對服務器的要求,同時對於高速存儲、數據調度同樣提出了更加嚴苛的要求。對於在算力節點之間,集羣之間進行計算的調度和協同,對高速連接網絡要求也非常高。要能夠支持超大規模的訓練,支持各種場景的推理,算力彈性要求也非常高。同時,對於節能、散熱要求也非常高。
我們在今年首次提出了“一橫五縱”戰略框架,“一橫”是聯想萬全異構智算平臺,可以幫助我們的用戶在使用算力基礎設施的時候可以更加高效地對算力進行調度。同時異構智算平臺可以進行GPU虛擬化,支持集合通訊算法庫,能夠實現分鐘級的斷電續訓,對傳統HPC科學計算的算力基礎設施和AI基礎設施之間跨集羣進行統一調度。
“五縱”包含了服務器、存儲、數據網絡、軟件及超融合、邊緣基礎設施產品和方案,“五縱”在聯想過去就已經有了非常全面的佈局。但是我們重新爲它以AI爲導向,對它進行重新的打造,對它進行全面的升級,讓它更加具備以人工智能,全面AI化,能夠承接AI時代算力的發展。
問:4月聯想和中國智算產業聯盟啓動了異構智算生態產業聯盟,接下來會有哪些計劃,對異構智算產業聯盟有哪些推動?
陳振寬:聯想作爲一個在算力產業上的鏈主企業,有這樣一個責任來推動整個產業的發展。我認爲,產業聯盟成員在三個層面上貢獻不同維度的力量。
第一個,AI芯片層面。國際有非常多的,非常好的AI芯片企業。國內也有非常多,尤其這一兩年裡面在推理上越來越成熟,在訓練上越來越先進。
第二個,系統和設備層面。像聯想所承擔的角色,我們把芯片不同的算力根據不同的應用場景,訓練推理的場景,把這些芯片進行更加高效的應用,貢獻在產業裡面的力量。
第三個,軟件和應用層面。比如說像大模型的企業,包括大模型之上再做企業大模型、行業大模型這樣一些生態企業。
芯片層、系統設備層、應用軟件層,這三個層面缺一不可,整個產業生態聯盟也要發揮所有成員之間,他們在幾個不同維度上的能力,一起設定標準,一起相互進行更好的融合。
問:這次聯想問天和聯想ThinkSystem四款服務器在定位上有什麼樣的不同?各自具備什麼樣的特點?相較於去年在算力大會上發佈的兩款問天服務器,有哪些技術上的升級呢?
陳振寬:今天我們主要發佈的四款服務器,兩款聯想問天服務器,兩款聯想ThinkSystem服務器。
聯想問天這兩款是去年發佈的下一代產品。第一個是WR5220 G5,是目前市場上用量最多的產品,具備更高的性能,同時是低功耗的。相較去年,我們融入了更多人工智能管理引擎,能夠降低由於部件帶來的計劃外的宕機,同時也減少部件更換的頻率。
第二款是WA5480 G5,這是一款專門爲AI設計的訓推一體服務器,它支持最多10個雙寬PCA的GPU,目前可以支持到多品牌的、多廠商的GPU,不僅僅是國際的,國內的各種GPU都可以在上面支持,它在AI的訓練推理上是最適合的一款AI場景下的服務器。
另外兩款是聯想ThinkSystem服務器,一個是SD520 V4,這是高密度的服務器,非常適合高密部署,高性能計算等等。另外聯想ThinkSystem SR630 V4,它是1U2CPU的機型,1U的服務器主要應用場景還是在雲計算、算力租賃。
問:聯想萬全異構智算平臺這一塊未來的市場規劃是怎麼樣的?
陳振寬:“一橫”是對“五縱”能力的全面升級,對於我們今天整體佈局的基礎設施進行重新的改造和升級,實現真正的AI導向,這是萬全異構計算平臺所起到的作用,它將無處不在。
問:聯想服務器這幾年增速非常迅猛,背後的原因是什麼?另外我們看到做服務器企業比較多,我們聯想的優勢在哪裡?
陳振寬:IDC發佈《2024第一季度中國x86服務器市場報告》顯示,聯想x86服務器銷售額同比大幅增長200.2%,市場份額躍升至國內市場第三位。
今年是聯想的第5個十年的開年,每一個十年聯想都經歷了一個週期,包括創業期、PC的時代、國際化的時代、多元化的時代等等,經歷了多個週期。我們產品的服務,不管是PC還是基礎設施遍佈全球180多個國家和地區,構建的能力是“端-邊-雲-網-智”五位一體全面的產品能力。聯想躋身前三,是AI導向基礎設施戰略穩步推進的結果。
問:我國AI服務器總體發展情況怎麼樣,面臨哪些挑戰?這次發佈了全棧算力基礎設施新品,有哪些亮點可以跟我們分享一下。
陳振寬:2023全年中國加速服務器市場規模達到94億美元,比2022年增長104%。國產芯片性能明顯提升,相關產業鏈逐步形成,與此同時,人工智能芯片的應用場景更加多樣化,更有針對性的人工智能芯片正被投資到更精準的細分市場。
聯想新一代服務器更是專門爲客戶“匠心打造”,主打卓越算力、極致能效比和AI智能運維智能三大價值主張。首先在性能方面,單處理器核數增加了2.25倍,人工智能負載性能提升2倍,在雲服務器應用場景下每機櫃輸出性能提升42%;內存帶寬提升14%,全面支持CXL 2.0,E3.S容量提升2倍。在能效比方面,處理器每核能耗降低70%,且全線支持液冷模式,通過98%的功耗部件覆蓋率實現數據中心PUE降到1.1以下。在AI智能運維方面,可針對關鍵部件如內存和硬盤的日誌進行智能分析,有效規避或減少部件失效次數,從而減少客戶計劃外停機時間。