瘋狂對標OpenAI,智譜AI要背水一戰
撰文 | 張 宇
編輯 | 楊 勇
題圖 | IC Photo
近日,AI大模型“獨角獸”智譜AI以200億元的投前估值,完成了由中關村科學城公司領投的新一輪融資,融資金額高達數十億元。據悉,該輪融資爲智譜AI自2024年以來完成的第三輪融資。
2024年6月,有報道稱,中東石油巨頭沙特阿美(Aramco)旗下風險投資部門管理的基金Prosperity7對智譜AI進行了投資,投資金額爲4億美元,該輪融資直接助推智譜AI的估值進入了“200億元俱樂部”,而200億元估值,也被普遍認爲是進入行業第一梯隊的基準線。
截至目前,在智譜AI的股東名單中,既有高瓴資本、啓明創投、紅杉資本等知名投資機構,也有美團戰略投資部、螞蟻集團、阿里巴巴、騰訊投資等互聯網巨頭的身影,此外,還有社保基金中關村基金、北京市人工智能產業基金、中關村科學城等國資力量。
智譜AI成立於2019年6月,由清華大學知識工程實驗室(KEG)技術成果轉化而來,是目前國內唯一全內資、全自研的大模型企業,早在2020年開始GLM預訓練架構的研發,並訓練了100億參數模型GLM-10B;2022年合作研發了1300億級超大規模預訓練通用模型GLM-130B;2023年,智譜AI推出千億開源基座對話模型GLM系列,並在2024年1月推出GLM-4,此後,智譜AI又在6月發佈了GLM-4-9B開源模型,以及在7月上線了視頻生成工具清影。
“追趕OpenAI”“對標Open AI是智譜AI的目標”,是智譜AI CEO張鵬在對外分享時屢次提及的口號,然而當前大模型的競爭已經不再是從0到1的有與無之爭,而是落地之爭,在衆多資本力量的加持下,被稱爲“中國OpenAI”的智譜AI能否在大模型角逐戰中順利突圍?
一、OpenAI仍是領先者
自智譜AI成立以來,一直將OpenAI作爲追趕目標。截至目前,智譜AI已經打造了完整對標OpenAI的模型產品,包括AI提效助手智譜清言、高效率代碼模型CodeGeeX、多模態理解模型CogVLM和文生圖模型CogView等等。
不過,儘管智譜AI號稱中國第一開源大模型,但對標OpenAI卻並不容易。
比如智譜AI在2024年1月舉行的首屆技術開放日(Zhipu DevDay)上發佈了新一代語言模型GLM-4,雖然GLM-4整體性能相比上一代大幅提升60%,號稱“比肩GPT-4”,但實際上也只是達到GPT-4約90%左右的水平。
張鵬也坦言,和國外大模型相比,國內的大模型發展起步晚了一些,加上高性能算力限制、數據質量的差距等,國內大模型在規模和核心能力上都與世界先進水平存在一定差距,這樣的差距大約在一年左右。
首先,從技術路線來看,OpenAI更加註重通用性、可移植性和可擴展性,其GPT系列模型可以在多個場景下應用,並且具有高度的可定製性。相比之下,智譜AI的技術路線是“大模型+小模型”,通過大模型的預訓練和微調,來適應不同場景和任務的需求,這種技術路線可以提高模型的泛化能力和應用範圍,但也存在着模型複雜度高、計算量大、訓練時間長等問題。
其次,OpenAI的GPT系列模型規模較大,可以處理大量的自然語言數據,從而獲得更好的模型性能。相比之下,智譜AI的模型規模可能較小,處理數據的能力有限,這可能會影響其模型性能和泛化能力。
此外,在數據資源方面,OpenAI擁有大量的自然語言數據資源,可以用來訓練和優化其模型,而智譜AI的數據資源可能相對較少,導致其模型訓練的效果和性能受到限制。
雙方的差距在用戶數上體現得最爲直觀。2022年11月,OpenAI旗下ChatGPT僅上線五天用戶數便突破百萬,2023年1月其月活用戶數突破了1億,成爲歷史上用戶數增長速度最快的消費級應用。相比之下,截至2023年11月,智譜AI旗下智譜清言的日活用戶數區間僅爲10萬至40萬。
實際上,智譜AI與OpenAI之間的差距正越拉越大。9月13日,OpenAI發佈o1系列模型,包括o1預覽版和o1-mini。在一系列基準測試中,o1相比GPT-4o再次有了巨大提升,甚至在物理、生物、化學問題的基準測試中“與人類專家相媲美”。
比如在在國際奧數考試(IMO)中,GPT-4o得分13.4%,o1的得分高達83.3%;在Codeforces編程比賽中,o1拿到了89%的優異成績,而GPT-4o準確率僅爲11%。此外,在GPQA-diamond測試中,人類專家的準確率爲69.7,而o1則高達78%。
可見,智譜AI距離OpenAI還很遙遠,儘管智譜AI取得的成績已非常難得,但面對OpenAI新推出o1系列模型,智譜AI無疑還需要更努力一些。
二、價格戰愈演愈烈
自2024年5月開始,大模型領域的價格戰至今已經打了四個多月,導致越來越多的大模型企業被捲進了價格戰的漩渦。
這場價格戰始於私募巨頭幻方量化旗下的AI公司DeepSeek。5月6日,DeepSeek宣佈開源第二代MoE大模型DeepSeek-V2,標價爲GPT-4-Turbo的近1%,百萬tokens只需1元。
智譜AI緊隨其後,5月11日,智譜AI宣佈個人版GLM-3Turbo調用價格從5元/百萬tokens降低至1元/百萬tokens。在6月5日舉辦的智譜AI Open Day活動中,智譜AI再次宣佈全模型矩陣價格下降。其中,GLM-4-Air和GLM-3-Turbo價格降低至0.6元/百萬tokens,Embedding-2模型低至0.3元/百萬Tokens,GLM-4-Flash模型的價格最低降到了0.06元/百萬tokens。
字節跳動也加入了價格戰,打着低於行業平均價99.3%的旗號,宣佈豆包主力模型(豆包通用模型pro)在企業市場的定價爲0.0008元/千Tokens,而市面上同規格模型的定價一般爲0.12元/千Tokens,是豆包模型價格的150倍。
此後,阿里、騰訊、百度、科大訊飛紛紛宣佈大模型降價。如阿里雲將Qwen-Long的輸入價格降至0.0005元/千tokens,輸出價格直降90%至0.002元/千tokens;百度智能雲則宣佈文心大模型的兩款主力模型ENIRE Speed、ENIRE Lite免費開放。
OpenAI也是價格戰的主力軍,其GPT-4o價格較GPT-4-Turbo再次減半,這是自2023年初以來OpenAI進行的第4次降價。按照OpenAI的預期,其大模型將以每年50%-75%的幅度繼續下調。
值得一提的是,雖然大模型定價的持續走低有望帶來更快的商業化落地,但同時價格戰往往意味着大模型企業需要在價格上做出讓步,對於智譜AI而言,其自身盈利能力本就有限,如果再進行持續的價格戰,或將導致利潤進一步下降,實現盈利也將變得更爲艱難。
相比之下,價格戰對於OpenAI的影響或許更小,畢竟早在2023年12月,OpenAI CEO山姆·阿爾特曼就曾透露,OpenAI目前的月收入已經達到上億美元級別,年化收入很可能突破15億。第三方機構也預測,OpenAI在2024年的收入很可能將達到2023年的一倍以上,樂觀估算將達到50億美元。
可以預見,價格戰疊加技術差距,智譜AI在2024年的日子或並不好過,張鵬也坦言,2024年智譜AI所面臨的挑戰是非常艱鉅的:一方面,2024年OpenAI在超級認知、超級對齊上的技術會實現新的突破,這要求智譜AI不斷迭代技術,跟進世界領先腳步;另一方面,2024年大模型會迎來商業化落地潮,智譜AI的商業化競爭壓力也會加大。
三、加速生態投資
產品佈局和投資佈局是智譜AI實現商業化落地的兩條主線。
張鵬曾公開解釋過智譜AI的投資思路:“我們希望打造一個大模型生態,在這個生態中我們與合作伙伴攜手共進,把生態圈越做越大,這是我們更長遠的商業化目標。”在談及2024年商業願景時,張鵬表示:“讓大模型真正落下來,接地氣,是我們的重要任務。”
2024年,智譜AI將發起開源開放的大模型開源基金,該計劃包括三個“1000”:智譜AI將爲大模型開源社區提供1000張計算卡,助力開源開發;提供1000萬元的現金用來支持與大模型相關的開源項目;爲優秀的開源開發者提供1000億免費API tokens。張鵬表示,大模型開源基金的目的在於推動大模型研發的大進展,促進大模型整個開源生態的大繁榮。
面對全球大模型創業者,智譜AI將升級“Z計劃”,聯合生態夥伴發起總額10億元的大模型創業基金用於支持大模型原始創新,覆蓋大模型算法、底層算子、芯片優化、行業大模型和超級應用等方向。
2024年8月,在智譜AI“Z計劃”企業路演日活動中,張鵬正式宣佈智譜AI聯合生態夥伴推出AGI生態基金:Z基金,以支持更多大模型賽道有潛力的早期項目。9月3日,人形機器人廠商動易科技完成數千萬元天使輪融資,領投方便是Z基金,這也Z基金的第一筆對外投資。截至目前,智譜AI已對外投資AI模型層企業“聆心智能”、智能法律服務產品提供商“冪律智能”、軟件和信息技術服務商“數道智算”、生成式AI應用提供商“生數科技”等等11家企業。
客觀而言,在產業鏈配套不足的情況下,投資佈局全產業鏈不失爲一種破局方式,但更關鍵的破局方式在於,如何打造拓展用戶想象力的產品,以及如何把這些產品化作生產力,這將是智譜AI接下來的必答題。