☰

雷軍向AI大模型發起猛攻

作者 | 周智宇

小米在大模型上正發起一輪迅猛的攻勢。

華爾街見聞了解到，大模型上非常低調的小米，在過去幾個月裡持續提升算力儲備，也有了更高的算力資源投入規劃，爲自家大模型研發提供更充分的算力供給。

在算力資源上進一步提升資本開支，是小米創始人雷軍向AI大模型發起一輪猛攻的側寫。此前，小米在內部組織能力建設、外部人才引入上，已有了諸多動作。

今年11月中旬，小米基礎技術平臺部成立AI平臺部，曾被雷軍公開稱讚是“小米的大神”的張鐸，擔任AI平臺部負責人。

隨後，DeepSeek-V2 的關鍵開發者之一羅福莉也傳將入職小米，或入職小米AI實驗室。羅福莉在自然語言處理（NLP）領域享有盛名，尤其是其參與的DeepSeek-V2，因大模型使用成本遠低於行業均值，引發行業關注。羅福莉的加入也將助力小米在大模型領域研發加速。

從種種跡象看，在雷軍的領導下，小米正在加速推進大模型的研發進展。不過小米在大模型上，過去一段時間裡頗爲低調。

去年年度演講中，雷軍就表示小米會全面擁抱AI大模型。小米AI實驗室也在2023年4月設立了專門的大模型團隊。

接近小米的人士表示，小米對需要大規模燒錢的預訓練態度謹慎，而輕量級模型在某些特定任務上，比千億級大模型也具備一定優勢。這也使得小米在大模型上的側重點在於“輕量化”和“本地部署”。

小米的大模型參數規模在百億，作爲對比，vivo在11月初推出的藍心大模型已經有了千億級參數量級的模型。

小米相關人士認爲，小米與其他公司不一樣的點，在於注重產品落地。這使得大模型會跟着產品出來。

小米集團總裁盧偉冰也曾表示，目前發佈的號稱AI手機的都是AI Feature （特徵）手機，也就是用AI的技術做了一些AI功能，而真正的AI手機是搭載基於AI大模型重構的操作系統。

這種思路使得外界對小米的大模型認知度並不高。

在今年底多家手機廠商的發佈會中，大模型對自家產品智能化的賦能，都成爲發佈會宣傳的重點。小米則在今年旗艦手機小米15的發佈會中，將小米澎湃OS 2.0作爲突出重點，但對於大模型沒有更詳細的介紹。

不過小米自研大模型進展不小。今年5月，小米的大語言模型MiLM已成功通過大模型備案。

今年11月，小米第二代模型MiLM2系列發佈，擁有0.3B到30B多個參數規模，以適配雲邊端各側場景的需求。

從模型規模上看，MiLM2系列也延續的是輕量化思路，參數規模依舊在百億。MiLM2-30B模型專爲雲端場景設計，在指令遵循、常識推理和閱讀理解等方面，超越了主流競品大模型。

此外，截至11月中旬，小米智駕總算力達到了8.1E FLOPS，在目前整車廠中處於第一梯隊。且累計數據積累達到了300萬Clips，與同期理想處於一個梯隊。按照小米方面預期，其年底會完成1000萬Clips數據積累。

當然，這距離特斯拉100E FLOPS的算力還有不小差距。在新能源汽車智能化下半場裡，小米要繼續“守正出奇”，也需要在智能化上加速。由此，小米在算力資源上進一步增加投入，並不意外。

相比其他科技大廠，小米擁有廣袤的終端生態，涵蓋手機、汽車和IoT等。這在AI大模型經歷百模大戰，進入尋找AI應用落地的階段裡，會是個優勢。但這也需要小米在AI大模型領域有更加突出的表現。

隨着小米加碼AI大模型領域，這場AI應用之爭也漸入高潮。

相關資訊