天璣9400問世:旗艦SoC競爭升級

10月9日,聯發科新一代MediaTek天璣旗艦芯片——天璣9400正式亮相,成爲安卓陣營首顆採用臺積電第二代3nm製程的手機SoC。

平靜已久的手機SoC賽道,由此畫出了一道全新的起跑線。

全球智能手機在2016年以後進入存量市場,國產手機品牌帶頭圍繞相機、摺疊屏做硬件創新,在不斷拉長的換機週期爭取珍貴的單機利潤增長,而作爲性能引擎的手機SoC,這些年來卻少有令人印象深刻的進步。

去年問世的天璣9300成爲最近幾年爲數不多的令人驚豔的手機SoC之一,各項性能跑分力壓同期的蘋果A17 Pro和高通驍龍8Gen3。以天璣9300爲開端,三巨頭之間開始瀰漫的硝煙,爲新一輪競爭週期打了個前瞻。

2024年是智能手機新一輪換機潮的開始。伴隨着各類硬件創新陷入同質化瓶頸,智能手機的較量回歸最硬核的主線——手機SoC。而迎面趕上的生成式AI浪潮,也將給穩固已久的手機SoC競爭格局,帶來不小的變數。

3nm的博弈

手機SoC的新競爭是從3nm的博弈開始的。

今年第二季度開始,全球芯片行業進入緩慢復甦期,臺積電以營收同比達40.1%的高增獨領風騷,去年下半年才正式開始接單營業的3nm佔據晶圓總收入的15%。

手機SoC作爲臺積電3nm異軍突起的主要推手,對於製程工藝的選擇向來激進。從2007年進入智能手機時代開始,芯片製程每推進一代,手機SoC總能最早吃到螃蟹,3nm也沒有例外。

臺積電3nm的第一單是蘋果A17 Pro,天璣9400是安卓陣營首顆採用臺積電第二代3nm的SoC。業內透露,臺積電3nm產能利用率已達100%,且嚴重供不應求,未來不排除5nm產線轉換爲3nm填補供應[1]。

手機SoC向3nm蜂擁而至的背後,是智能手機在明顯放緩的硬件創新節奏中,越發尖銳的“性能-功耗”矛盾。

衡量手機SoC性能,簡單理解就是單位時間裡乾的活越多,性能越高,但同時功耗也就越大,這就會直接影響手機的續航。

手機品牌在硬件上的“過分努力”加劇了這種矛盾。一個例子是摺疊屏手機,其展開後屏幕尺寸相較於直板手機成倍增長,代價卻是同樣倍增的功耗,所以手機品牌纔會急着將電動車還沒普及的硅碳電池安上手機,核心就是爲了解決功耗問題。

但由於存在SoC “性能-功耗”劃定的硬件創新上限,種種手段不過是在螺獅殼裡做道場,成全這個總要犧牲那個,而製程升級是個昂貴卻能夠一勞永逸的辦法。

製程數字越小,代表晶體管體積越小,同樣面積的芯片內能塞更多的晶體管,而電信號能在更短的距離內傳輸,提高了芯片的工作頻率和運行速度,兩廂綜合,能帶來芯片整體性能質的飛躍;同時由於製程越小、工作電壓更低,使得功耗降低。

芯片行業有一句老話,“一代產品,一代工藝”,說的就是製程提升所帶來的產品端性能和功耗的飛躍。

全球第一顆採用臺積電4nm的手機SoC是天璣9000,問世至今已有3年,過去幾年手機SoC發展進入瓶頸期,怪臺積電不夠努力也並非毫無道理。

如今3nm雖遲但到,越早用上的也就在手機SoC新一輪競賽中確立了優勢。

相比於蘋果A17 Pro採用的初代3nm,天璣9400採用的第二代3nm在技術上更加成熟,而相比於採用4nm的天璣9300,在整體設計上也徹底放開了手腳。

CPU採用了“1+3+4”全大核架構,其中“1”是指Cortex-X925(代號黑鷹),是Arm全新一代超大核,對比上代X4性能提升36%,AI性能提升41%,是Arm五代超大核中性能提升最大的,直接對齊PC級CPU。

GPU採用了最新Immortalis-G925,是Arm史上性能最高、效率最高的GPU。同時成爲業內首顆將PC端頂級OMM追光引擎引入移動端的SoC。

AI加速方面,全新搭載的NPU 890 AI性能跑分超過6700分,功耗降低了35%,具備率先支持端側LoRA訓練和端側高畫質視頻生成,並面向開發者提供AI智能體化的能力。

臺積電第二代3nm給了聯發科更鋒利的武器,但天璣9400的突破還在於日臻成熟的設計哲學,在“既要且要”的行業語境下,有了更明確的取捨和堅持。

9400突破了什麼?

衡量手機SoC性能有一個基本公式:性能=時鐘頻率(每秒執行多少個週期) × IPC(每一時鐘週期內執行多少指令)。產品迭代也主要圍繞這兩個維度做提升。

天璣9400的CPU部分沿用了天璣9300“1+3+4”的架構,主核“黑鷹”Cortex-X925時鐘頻率爲3.62GHz,較9300的Cortex-X4的3.25GHz穩步提升,但更讓業內矚目的卻是IPC進一步提升了15%。

外界常常將時鐘頻率視衡量性能更直觀的標尺,但高頻的代價往往是更高的功耗和更嚴重的發熱問題,卡住了智能手機的脖子。

作爲一種對便攜性要求很高的設備,智能手機一方面不能像PC一樣長期插電使用,電池容量又受限於體積,續航本就捉襟見肘;另一方面由於體積小,散熱差,對發熱極其敏感,如果GPU一樣暴力堆核心懟性能,那大概率會收穫一面能煎蛋的“平底鍋”。iPhone早期被詬病的發熱問題就來源於此。

因此更科學的設計思路,是在一定時鐘頻率的基礎上,首先考慮儘可能地做IPC提升。

類似於CMOS圖像傳感器的“底大一級壓死人”,IPC就是手機SoC的“底”,而提升IPC,考驗的是芯片的架構設計,也是芯片設計公司內功的體現。

天璣9400的IPC提升主要來源於“黑鷹”Cortex-X925,作爲Arm最新一代超大核,聯發科深度參與了“黑鷹”的設計,新的架構帶來最新優化的指令集,通過更科學的資源調度,例如線程分配,在不同場景中儘可能“物盡其用”,減少性能的冗餘。

比如在瀏覽網頁等一些無需高算力輸出的場景下,SoC能夠在相對低頻的情況下,遊刃有餘地完成任務,使得整體功耗進一步下探。

IPC和功耗以外,天璣9400還突破了手機SoC在算力時代的另一個痛點——存儲。

一顆SoC的基本運算流程是:CPU從內存調取數據,根據指令分配給GPU/NPU做對應的計算工作,再把結果重新返回給內存/緩存。

決定整個過程速度的除了CPU/GPU/NPU的計算速度之外,還有數據從內存調取以及輸送的速度。隨着CGN(CPU、GPU、NPU)性能的瘋漲,與內存傳輸速度之間的差距也越來越大,也就是所謂的“內存牆”,決定了芯片算力的上限。

爲此,天璣9400業內首個搭載了三星LPDDR5X 10.7Gbps,後者是目前全球最快的移動內存,性能較上一代提升了25%,功耗降低了25%。並以“黑鷹”架構爲底,提升了緩存容量,緩存較內存距離CGN更近,數據傳輸耗費的時間更短。

自2021年推出天璣9000系列起,聯發科在高端手機SoC的發展駛入了快車道。

從天璣9000採用臺積電4nm,到9300系列果斷拋棄大小核設計、領先業內採用全大核設計,聯發科逐漸從追逐者轉變成爲了技術引領者——截至今年上半年,天璣9300仍霸佔各大手機SoC性能天梯圖、跑分排行榜的榜首位置。

天璣9400站在前代的肩膀上,重新對照消費者的真實需求,對紙面性能數字的實際效益進行了更深入的思考,和麪向更長遠未來的設計預埋。

在大模型入端浪潮迭起、即將深刻改變終端設備的當下,這種反思是必要且及時的。

AI手機由SoC定義

隨着各大機構公開上半年銷售數據,智能手機的復甦被一再確定。而在研報和手機品牌新品會上被頻繁提及的“AI手機”,成爲這一波復甦不可或缺的推手。

大模型入端是AI大模型浪潮的下半場,智能手機作爲過去十幾年體量最大的移動終端被賦予了重任:既要爲大模型變現,又要利用大模型爲智能手機貢獻新的增長點。

但相較於手機品牌和機構的熱鬧,消費者對AI手機的概念仍然模糊,體驗仍然雞肋,根源在於AI手機的硬件核心——SoC還沒到位。

調研機構IDC和Counterpoint都給出過AI手機的定義,共同將手機SoC列入“准入門檻”。

IDC認爲,AI手機是搭載了滿足AI算力需求的移動端芯片,並加載了深度學習AI功能的智能手機,且NPU算力必須大於30 TOPS[2],Counterpoint規定AI手機需要擁有集成或獨立的神經網絡運算單元(如APU/NPU/TPU),本身具備強大的AI算力[3]。

按這樣的標準在市面上所謂的AI手機中挑挑揀揀,符合要求的所剩無幾,因爲算力“過線”的手機SoC,在很長時間裡只有天璣9300、蘋果A17 Pro、高通驍龍8Gen3,而搭載這幾款芯片的AI手機其實並不算多。

圖源:千際投行

天璣9400預告已久,早前就被傳出已經被多家頭部手機品牌旗艦機型鎖定,也反映了這種“僧多粥少”的窘境。

作爲AI手機SoC的新晉成員,天璣9400確實不負衆望。除了算力的成倍提升和功耗可觀的下降外,天璣9400的更大突破在於業內首個在端側實現了推理和訓練,並面向開發者提供AI智能體化的能力。

受制於電池容量、內存大小等硬件配置,目前終端設備執行復雜的生成式AI任務,大多是依靠雲端協同的方式,即雲端訓練模型、終端用模型進行推理,但這種模式也面對諸如數據安全、傳輸速度等問題,始終會犧牲一部分消費者體驗,例如流暢性。

天璣9400的解決思路是,在端側直接實現訓練和推理兩條腿走路,既規避了數據安全和傳輸問題,又能讓手機“越用越懂”。根據介紹,通過搭載天璣9400,手機可以在消費者夜間休息時,通過NPU做到低功耗訓練,“睡醒的時候就越懂消費者一點。”

過去的十幾年,相較於PC廠商跟隨芯片大廠處理器的迭代節奏亦步亦趨、將“首發XXX處理器”作爲宣傳標語大寫加粗,手機品牌在產品創新的維度上,總是有除了SoC以外更好的選擇。

生成式AI浪潮催生了AI手機的誕生,將智能手機的競爭與手機SoC前所未有地緊密聯繫在一起,也將創新的壓力從手機品牌的手上移交給了SoC廠商。

“30 TOPS的NPU”卡住了絕大多數SoC廠商,但這其實只是個基線。如今大多數生成式AI的應用還在APP層面,而大模型入端的未來在於AI操作系統(AIOS)的應用。

有機構測算,以蘋果開發的多模態大語言模型Ferret-UI(參數量130億)爲例,以手機屏幕分辨率1920*1080、用戶允許最長推理時間2s、硬件算力利用率60%測算,要AI生成一張高分辨率的圖像所需峰值算力是99 TOPS[4]。

由此得出搭載AI OS的的處理器算力門檻在100 TOPS。隨着AI大模型與手機軟硬件更加深度的融合,對SoC算力的需求只會越來越大。

業界首發端側視頻生成、端側LoRA訓練、端側混合專家(MoE)模型…在移動終端向着智能體化的發展路徑上,天璣9400已在AI要地完成戰略部署,帶來近年來同領域內最大的一場革新。

性能向個別指標的傾斜,也將徹底顛覆SoC傳統的設計思路,賽道的重塑已箭在弦上,看似熱鬧的AI手機SoC大軍中,拿到入場券的實則比想象中更少。

1983年,摩托羅拉生產了世界上第一部手機DynaTAC 8000X(大哥大),30多個電路板上的幾千顆晶體管,組成了重達2磅(907g)的機身,充電10小時,通話半小時。

DynaTAC 8000X

1995年,LSI Logic爲索尼PlayStation設計了第一顆SoC,將微處理器、JPEG視頻解碼器和3D圖像引擎集成在一塊電路板上,手機由此走上了“瘦身”之路,便攜性加身,得以飛入尋常百姓家。

以此爲起點,芯片製程的推進、晶體管的微縮得以讓越來越多的零部件被加入機身,手機的“功能箱”不斷壯大,兌現成每年指數級增長的銷售額。回顧手機發展的歷史,每一部令人印象深刻的作品背後,都有一顆SoC作爲創新的引擎。

如今,生成式AI爲智能手機勾勒了嶄新的形態以及更不可測的未來,手機SoC再次擔負起了落地的重擔,爲智能手機在AI終端的未來圖景裡力爭一隅。

參考資料

[1]臺積電Q2財報全方位超預期將重點擴產先進製程,上調全年資本開支,科創板日報

[2]The Future of Next-Gen AI Smartphones,IDC

[3]Generative AI Phone Industry Whitepaper,Counterpoint

[4]2024年AI手機行業研究報告,千際投行

[5]警惕高價AI手機,遠川科技評論

作者:何律衡

編輯:李墨天

視覺設計:疏睿

責任編輯:何律衡

封面圖片來自ShotDeck