中國大模型“狂飆”又一年:“大浪淘沙”後“由有到專”
圖蟲創意/供圖 翟超/製圖
證券時報記者 周春媚
最近,隨着OpenAI長達12天的“馬拉松式”新品發佈會告一段落,這家全球矚目的大模型明星獨角獸企圖霸佔全球科技媒體的頭條,但除了Sora等個別關注度高的新品外,實際並未掀起太大的漣漪。與兩年前發佈堪稱AI領域“原子彈”的ChatGPT-3.5相比,大模型過去一年的“進化”恰如這場漫長的發佈會,小步快跑、持續迭代,卻難以再現令人眼前一亮的巨大飛躍。
將目光收回國內,中國大模型在經歷去年白熱化的“百模大戰”後,今年又迎來了“大浪淘沙”,競爭格局趨於穩定,呈現互聯網大廠與初創公司“共舞”的局面。隨着大模型技術演進曲線趨於平緩,怎樣落地成爲被擺在檯面、亟待解決的問題,不同行業玩家開始調整各自的業務重點與前進方向,這或將在2025年迎來更爲激烈的“生死戰”。
技術演進曲線走向平緩
行業競爭格局走向收斂
“OpenAI年末的線上發佈會,從側面說明了基礎模型的能力可能已到達了一個臨界點,技術進步的曲線已從陡峭走向平緩。”一名人工智能行業資深從業人士在接受證券時報記者採訪時表示。
在大模型領域,Scaling Law(規模定律)被普遍推崇。所謂Scaling Law,指的是隨着參數規模、訓練數據集及計算資源越多,大模型的性能將越好。然而,業內開始形成的一個共識是,大模型規模已到達一定程度,加上高質量訓練數據逐漸枯竭,大模型能力的進化速度與去年相比有所放緩,能力並沒有十分明顯的提升。
不過,雖然指數級的能力增長未在今年復現,但國產大模型在技術層面始終在進步。對國內大模型行業來說,技術迭代速度放緩是件好事,領跑的人速度變慢,追趕者就獲得了更多的時間窗口。今年6月,在全球權威測評中,阿里通義千問Qwen2-72B超越美國最強開源模型Llama3-70B,問鼎全球性能最強的開源模型;12月,字節跳動火山引擎對豆包大模型家族進行全面升級,其中通用模型Pro已全面對齊OpenAI最新的GPT-4o模型。
“經過兩年的發展,中國大模型在技術上取得了長足的進步。各大廠商和研究機構紛紛推出新一代大模型,不僅在參數規模上有所提升,更在算法優化、性能提升等方面取得了顯著成果。”北京社科院研究員王鵬向證券時報記者表示。
在2023年初野蠻生長期的“百模大戰”之後,行業在2024年經歷了一場大浪淘沙,行業競爭格局從分散走向“收斂”。諮詢機構弗若斯特沙利文指出,中國目前在通用基礎大模型領域的競爭者已縮減至20餘家,主要由互聯網企業、雲計算巨頭及人工智能創業公司主導。
一方面,中國大模型創業公司在2024年形成了相對穩定的“六小虎”格局,智譜AI、月之暗面、MiniMax、百川智能、零一萬物和階躍星辰在投資機構一輪又一輪的資金加持下,迅速成長爲AI獨角獸。其中,智譜AI、月之暗面、百川智能均已躋身估值“200億俱樂部”,這一速度是上個時代“AI四小龍”們所望塵莫及的,顯示了大模型時代技術演進與融資歷程的加快。
另一方面,中國的傳統互聯網巨頭們也在表演“大象起舞”。百度是最早佈局大模型的大廠,今年11月舉行的百度世界2024大會上,百度首席技術官王海峰透露大模型產品文心一言的用戶規模已達到4.3億。動作稍慢的騰訊和字節跳動今年也在全力加大對大模型的投入,騰訊在今年5月推出了基於混元大模型的AI助手APP騰訊元寶,字節跳動也憑藉着流量投放的優勢讓旗下的AI大模型應用“豆包”活躍用戶數在短時間超越一衆競爭對手。
“這反映了當前中國大模型市場的多元化和競爭性。”針對傳統巨頭與初創公司“共舞”的現象,王鵬向記者表示,創業公司的優勢則在於創新能力強、反應速度快、市場敏感度高等,能夠更快地捕捉市場機會和技術趨勢,推出更具創新性和差異化的產品和服務。而互聯網大廠資金雄厚、技術積累豐富、用戶基礎廣泛,同時還能夠通過自身的生態系統和資源整合能力,爲大模型的發展提供更加廣闊的空間和機會。“二者各有優劣,誰能脫穎而出還需要看各自的技術實力、市場策略和執行能力。”王鵬說。
產業鏈上下游處境分化
模型廠商發展路徑分野
據諮詢機構賽智時代研究報告,大模型產業鏈主要包括上游基礎層、中游模型層和下游應用層。其中,基礎層主要包括算力和數據,模型層主要包括通用大模型和行業大模型,應用層主要包括生活消費應用、產業經濟應用和公共服務應用等。
值得注意的是,2024年,一級市場的大模型產品也頻頻引爆二級市場,相繼誕生了Kimi概念股、智譜AI概念股和豆包概念股,開了A股市場以創業公司設立概念板塊的先河。“這反映了市場對於人工智能長期發展潛力的認可以及對未來盈利模式的樂觀預期。”天使投資人、資深人工智能專家郭濤在接受證券時報記者採訪時表示。在這些概念板塊中,不僅包括爲產品提供算力支持及數據服務的廠商,也包括在主要產品中接入該大模型以實現產品升級的各行業公司。
與全球芯片巨頭英偉達在AI大模型的風口下營收與股價齊飛一樣,隨着國產大模型的加快發展,各大廠商在AI算力擴展、AI芯片採購以及數據中心升級領域的資本開支持續增加,產業鏈上游尤其是算力基礎設施率先受益。Wind數據顯示,年初以來,算力概念指數累計漲幅達47.66%,服務器概念指數累計漲幅達84.03%。“資本市場的表現往往基於對公司基本面和行業趨勢的綜合判斷。”郭濤認爲,相關概念板塊的優異表現,表明投資者普遍認爲隨着大模型技術的不斷進步和應用場景的豐富,對高性能計算能力和專業基礎設施的需求將持續增長,從而帶動相關產業鏈上下游企業的業績增長。
與產業鏈上下游相比,處於中游的模型廠商卻普遍面臨盈利困境。一方面,從雲服務商手中購買算力開支巨大;另一方面,產品商業化目前仍處於探索階段,遠未能形成穩定和足夠覆蓋成本的收入。同時,以字節火山引擎、阿里雲、百度云爲代表的雲廠商在2024年掀起了大模型價格戰,降價幅度普遍達到90%以上,有的甚至直接免費。雲廠商的目的是通過降價,以大模型來獲取雲客戶,但價格戰讓一些資金實力本就不足的廠商“雪上加霜”。
在激烈的市場競爭中,尤其是在互聯網大廠直接下場“搏鬥”的2024年,AI大模型創業公司告別同質化競爭,發展路徑開始分野。例如,很早就開始探索商業化的智譜AI主要發力B端市場,而主打大模型應用的月之暗面則以C端市場見長,MiniMax發力多模態與海外市場,百川智能目前的精力主要聚焦在醫療模型和產品領域。
政策密集催化前景可期
行業從淘汰賽走向生死戰
今年3月,開展“人工智能+”行動首次被寫入2024年《政府工作報告》,人工智能被賦予了實現技術變革、推動產業深度轉型升級的重要意義,也成爲當前加快培育新質生產力的重要抓手。
今年以來,各地人工智能產業相關政策密集出臺。例如12月18日,深圳印發《深圳市打造人工智能先鋒城市的若干措施》,其中提出每年發放最高5億元“訓力券”、5000萬元“語料券”、1億元“模型券”等真金白銀的措施,以超常規力度促進人工智能產業的快速發展。除此以外,北京、上海、成都等城市也不斷加大產業支持力度,彼此間你追我趕。
“大模型廠商的角逐,已經不僅僅是投資機構之間的競爭,而是已經上升到各個城市產業佈局、發展規劃的層面。”一名資深的創投行業從業者向證券時報記者表示,投資人在與一些一線城市政府官員交流時,往往驚詫於他們對行業的瞭解之多、認識之深,而且全國多地都已設立人工智能產業投資基金,AI獨角獸背後往往也站着國資背景的股東。
“當前,人工智能政策環境趨於友好,政府加大支持力度,促進了產學研用協同創新,爲大模型的發展提供了良好的生態土壤。”郭濤表示,政策的持續催化,爲AI大模型的發展前景增添了較強的確定性。展望2025年,相關領域的投入依然有望持續增加,帶動國產大模型在技術創新上的繼續深化和應用場景的進一步拓展。
如果說2023年的“百模大戰”是“從無到有”,那麼2024年國產大模型所經歷的“大浪淘沙”則是“由有到專”,而進入2025年,行業或將從“淘汰賽”進入到更激烈與殘酷的“生死戰”。中國科學院院士、清華大學計算機系教授張鈸曾公開表示,即使大模型落地之後,也只有少數企業能活下來,因爲暫時還沒有那麼大的市場,而且中國在AI投入的資本並沒有那麼大,還極度分散。“必須集中資源,因爲我們的資源本來就少。”張鈸說。
雖然人工智能代表着未來已經成爲行業共識,但是誰能夠引領這個未來卻依舊懸而未決。以大模型“六小虎”爲例,雖然它們取得了亮眼的成績,但同時也面臨着鉅額資金的持續投入、技術商業化落地等挑戰。同時,在經歷了2024年火箭般的融資速度後,它們的估值已經達到了較高的水平,明年的融資可能會面臨一定的調整壓力。“一方面,高估值可能導致部分投資者持謹慎態度;另一方面,創業公司需證明其商業模式的可持續性和盈利能力以吸引後續投資。預計下一階段融資將更加註重公司的核心競爭力和市場表現,而非單純依賴概念炒作。”郭濤表示。