雷軍向AI大模型發起猛攻
作者 | 周智宇
小米在大模型上正發起一輪迅猛的攻勢。
華爾街見聞了解到,大模型上非常低調的小米,在過去幾個月裡持續提升算力儲備,也有了更高的算力資源投入規劃,爲自家大模型研發提供更充分的算力供給。
在算力資源上進一步提升資本開支,是小米創始人雷軍向AI大模型發起一輪猛攻的側寫。此前,小米在內部組織能力建設、外部人才引入上,已有了諸多動作。
今年11月中旬,小米基礎技術平臺部成立AI平臺部,曾被雷軍公開稱讚是“小米的大神”的張鐸,擔任AI平臺部負責人。
隨後,DeepSeek-V2 的關鍵開發者之一羅福莉也傳將入職小米,或入職小米AI實驗室。羅福莉在自然語言處理(NLP)領域享有盛名,尤其是其參與的DeepSeek-V2,因大模型使用成本遠低於行業均值,引發行業關注。羅福莉的加入也將助力小米在大模型領域研發加速。
從種種跡象看,在雷軍的領導下,小米正在加速推進大模型的研發進展。不過小米在大模型上,過去一段時間裡頗爲低調。
去年年度演講中,雷軍就表示小米會全面擁抱AI大模型。小米AI實驗室也在2023年4月設立了專門的大模型團隊。
接近小米的人士表示,小米對需要大規模燒錢的預訓練態度謹慎,而輕量級模型在某些特定任務上,比千億級大模型也具備一定優勢。這也使得小米在大模型上的側重點在於“輕量化”和“本地部署”。
小米的大模型參數規模在百億,作爲對比,vivo在11月初推出的藍心大模型已經有了千億級參數量級的模型。
小米相關人士認爲,小米與其他公司不一樣的點,在於注重產品落地。這使得大模型會跟着產品出來。
小米集團總裁盧偉冰也曾表示,目前發佈的號稱AI手機的都是AI Feature (特徵)手機,也就是用AI的技術做了一些AI功能,而真正的AI手機是搭載基於AI大模型重構的操作系統。
這種思路使得外界對小米的大模型認知度並不高。
在今年底多家手機廠商的發佈會中,大模型對自家產品智能化的賦能,都成爲發佈會宣傳的重點。小米則在今年旗艦手機小米15的發佈會中,將小米澎湃OS 2.0作爲突出重點,但對於大模型沒有更詳細的介紹。
不過小米自研大模型進展不小。今年5月,小米的大語言模型MiLM已成功通過大模型備案。
今年11月,小米第二代模型MiLM2系列發佈,擁有0.3B到30B多個參數規模,以適配雲邊端各側場景的需求。
從模型規模上看,MiLM2系列也延續的是輕量化思路,參數規模依舊在百億。MiLM2-30B模型專爲雲端場景設計,在指令遵循、常識推理和閱讀理解等方面,超越了主流競品大模型。
此外,截至11月中旬,小米智駕總算力達到了8.1E FLOPS,在目前整車廠中處於第一梯隊。且累計數據積累達到了300萬Clips,與同期理想處於一個梯隊。按照小米方面預期,其年底會完成1000萬Clips數據積累。
當然,這距離特斯拉100E FLOPS的算力還有不小差距。在新能源汽車智能化下半場裡,小米要繼續“守正出奇”,也需要在智能化上加速。由此,小米在算力資源上進一步增加投入,並不意外。
相比其他科技大廠,小米擁有廣袤的終端生態,涵蓋手機、汽車和IoT等。這在AI大模型經歷百模大戰,進入尋找AI應用落地的階段裡,會是個優勢。但這也需要小米在AI大模型領域有更加突出的表現。
隨着小米加碼AI大模型領域,這場AI應用之爭也漸入高潮。