外媒:儘管缺乏頂尖芯片,中國人工智能正快速追趕上來
12月25日消息,儘管中國在獲取尖端芯片方面面臨限制,但中國初創企業在追趕美國前沿人工智能模型方面的速度卻超出了業界許多人的預期。
今年11月,總部位於北京的DeepSeek公司發佈了其最新大語言模型的預覽版本,並聲稱該模型的能力可媲美OpenAI於9月發佈的推理模型o1預覽版。
近期,其他中國公司也提出了類似的聲明。由阿里巴巴和騰訊支持的初創企業月之暗面表示,其開發的一款專注數學的模型在性能上已接近o1模型。而阿里巴巴則進一步聲稱,其實驗性研究模型在數學領域的表現甚至優於o1的預覽版。
這些公司尚未發佈詳細闡述其模型性能的論文,同時,目前對人工智能模型能力也缺乏統一的測試標準,因此很難對這些聲明的準確性進行驗證。不過,一些美國專家對中國模型的表現表示認可。
OpenAI前研究員、現人工智能企業家安德魯·卡爾(Andrew Carr)指出,中國人工智能領域正在“快速追趕”。他提到,DeepSeek的研究團隊在短短數月內成功複製了OpenAI的推理模型,這一成就“讓許多同行感到驚訝”。
用於比較模型性能的一個測試是美國數學邀請賽(AIME),該賽事旨在挑戰全球最聰慧的高中數學人才。
DeepSeek聲稱,其模型在AIME測試中的表現優於OpenAI。但美國媒體針對今年AIME的15道試題進行的實驗發現,儘管OpenAI的o1預覽模型在解題速度上領先於DeepSeek、月之暗面及阿里巴巴的實驗模型,但所有模型在首次嘗試中便得出正確答案,這本身已是一項顯著成就。例如,在解答一個關於雙人遊戲策略的字謎問題時,OpenAI程序僅用10秒便得出答案,而DeepSeek則耗時兩分多鐘。
自2022年以來,中國人工智能開發人員受到美國尖端AI芯片出口限制的影響,其中包括英偉達的高性能芯片。今年12月,拜登政府進一步收緊了出口管制政策。
儘管如此,中國開發人員通過創新技術找到了解決辦法。例如,在阿里巴巴和騰訊支持的月之暗面,創始人楊植麟表示,公司正專注於強化學習,通過模仿人類的試錯過程提高模型性能。這種方法不僅提升了模型能力,還降低了對計算資源的需求。
此外,自去年年底以來,人工智能開發人員越來越多地採用“混合專家”(MoE)技術。這種技術通過一個初始路由機制,將特定問題分配給最擅長處理該類問題的專家模型,就像餐廳廚師長根據訂單將菜品分配給合適的廚師一樣。這種方法有效降低了對高性能芯片的依賴。
騰訊在今年11月宣佈,其最新發布的MoE模型在性能上已可媲美Meta於今年7月推出的Llama 3.1模型。然而,美國研究人員通過審閱兩家公司發表的論文指出,騰訊的模型可能僅使用了Meta模型十分之一的計算資源完成訓練。
DeepSeek最初是High-Flyer旗下的人工智能研究部門,High-Flyer是一家管理着80億美元資產的量化對衝基金管理公司,以利用人工智能技術進行交易而聞名。2021年,DeepSeek將大約1萬顆英偉達A100芯片連接起來,構建了一個名爲Fire-Flyer 2的AI訓練集羣。
在今年8月發表的一篇論文中,DeepSeek表示,Fire-Flyer 2的性能已接近英偉達相似芯片構成的系統,但其成本和能耗均顯著降低。此外,DeepSeek於5月發佈的關於其“混合專家”(MoE)模型的論文,也因採用更高效的數據處理技術而在業界引發廣泛關注。
Anthropic聯合創始人傑克·克拉克(Jack Clark)在其博客中提到,DeepSeek的Fire-Flyer 2集羣是中國應對出口管制的一個典型策略。他寫道:“中國通過利用現有硬件資源構建卓越的軟件與硬件堆棧,繞過了出口管制。正如在電動汽車、無人機等領域的表現,中國製造也將在人工智能模型領域佔據重要地位。”
儘管如此,許多中國AI開發者通過中間商交易和海外數據中心,找到了獲取受限制英偉達芯片的方法。然而,中國公司高管指出,尖端芯片的短缺依然是限制初創企業發展的主要瓶頸,而這一差距可能進一步擴大。目前,英偉達的客戶正在準備大規模部署其最新的AI數據中心芯片Blackwell。
在國際競爭中,美國企業持續加碼。埃隆·馬斯克(Elon Musk)旗下的xAI已建成一個由10萬顆英偉達芯片組成的數據中心,並籌集了50億美元用於進一步擴展。亞馬遜AWS也計劃使用數十萬顆自主研發的芯片,打造一臺規模空前的人工智能超級計算機。
DeepSeek專注於開源模型研究,特別側重數學和編程能力。而另一家初創企業月之暗面則憑藉其類似ChatGPT的聊天機器人Kimi,成功吸引了中國消費者的青睞,並因其出色的長文本處理能力而聲名鵲起。
然而,與OpenAI等美國公司相比,中國AI初創企業的估值仍相對較低。OpenAI最近的估值已高達1570億美元,而中國初創企業則面臨融資挑戰。在這種激烈的市場競爭中,價格戰在AI模型供應商之間已然爆發。
以北京爲基地的智譜AI爲例,據知情人士透露,該公司已推遲最早在2025年下半年上市的計劃。投資銀行家認爲,其可能難以獲得預期估值。在最新一輪融資中,智譜AI的估值約爲30億美元。值得注意的是,智譜AI於11月底展示了其AI智能體,並於7月推出了一款與OpenAI Sora相似的視頻生成模型。
霍華德·黃(Howard Huang),一位曾在北京一家人工智能公司負責基礎設施的高管,將中國的人工智能行業形容爲“戴着鐐銬跳舞”。他表示:“專注於我們擅長的領域是唯一的生存機會,也可能是我們在全球競爭中取勝的關鍵。”(小小)