豆包們窮追不捨,Kimi要靠「深入推理」抵禦AI巨頭衝擊

大概一個月前,OpenAI 推出了 o1 模型,不僅展示了強大的語言生成能力,還通過引入強化學習,實現了更高層次的推理和自我糾錯能力。

9 月 16 日,月之暗面(旗下 Kimi)創始人楊植麟在天津大學宣懷學院做了一場分享,其中特別提到了 OpenAI 發佈的 o1 模型,標誌着通用智能(AGI)範式的變化,而下一個範式,「是通過強化學習來做的。」

或許在當時,或許更早,月之暗面就已經投入到了強化學習的新範式之中。

但不管如何,根據「大廠青年」公衆號最新爆料,月之暗面有團隊,在國慶期間「一直瘋狂趕進度」,主要就是爲了即將上線一個「很牛的功能」。

爆料進一步指出,該功能與模型的深度推理有關,預計將於下一個版本上線,會在搜索入口下方增加一個「深入推理」的功能開關,可以回答簡單搜索無法解決的問題,甚至可以自我反思。

這是 Kimi 的 o1?

接力 OpenAI o1,通用智能新範式的一次轉移

在 OpenAI o1 之前,AI 大模型的表現通常侷限於「快速應答」,也就是通過預測下一個詞來生成答案。這種方式效率高,但其思維模式單一,缺少對複雜問題的深入推理和自我反思能力。

圖/ OpenAI

但隨着 OpenAI 推出的 o1 模型,這種侷限性開始被突破。o1 的核心變化在於引入了強化學習機制,模型在面對問題做出響應之前,會花上更多時間思考問題,來進行深度推理和自我糾錯。

這就類似大腦的慢思考——一種被稱爲「系統 2」的能力,o1 有了學習並完善思維過程的能力,可以嘗試不同的策略,並認識到自己的錯誤。這種能力的提升對於 AI 的智能化帶來了顯著的影響。傳統模型通常只會對用戶輸入做簡單的直線型回答,而沒有「思考」過程的多樣性和深度。

例如,在處理複雜的數學題或法律案例時,模型只是依靠大量數據的模式匹配進行預測。o1 通過強化學習,讓 AI 可以進行多步驟推理,類似於人類解決問題時的思維路徑——先提出假設,逐步驗證推理,並且在過程中不斷自我修正錯誤。

通過這種慢思考模式,AI 不僅能給出更準確的答案,還能在面對不確定性時進行自我反思,在一定程度上避免過去模型常見的「幻覺」。

楊植麟同樣也在天津大學的演講中指出,AI 只有通過學習人類的思考過程,才能得到更好的泛化能力,而且能通過這個過程又產生了更多天然不存在的數據,應對更多未知的問題。

圖/上海創新新創業青年 50 人論壇

這對於最終用戶體驗的影響也是巨大的。對於普通用戶而言,推理能力的增強意味着在與 AI 互動時,能夠獲得更具深度、邏輯性更強的回答。

在 ChatGPT 中使用 o1-preview 模型就能明顯感受到,很多時候不再需要將問題簡單分解成多個小問題逐步提問,而是可以直接提出複雜的問題,AI 可以通過多步驟推理,給出綜合性的解決方案。

更重要的是,自我反思的引入讓 AI 可以像人類一樣在過程中發現自身的錯誤。

這種自我反思能力不僅能夠大幅減少錯誤率,還提升了用戶對 AI 的信任感。AI 不再是一個機械的應答者,而更像是一個具備「思考」能力的智能助手,可以理解上下文、深刻分析問題,甚至在發現自身錯誤時及時調整,從而爲用戶提供更高質量的答案。

所以不難理解,爲什麼 Kimi 要做「深入推理」。事實上,國內大模型也在向這一趨勢靠攏,在 9 月底舉辦的阿里雲棲大會上,一部分大模型公司和研究機構就達成了一定的共識,即 OpenAI 推出的 o1-preview 代表了通用智能新的進化方式的開端。

通用智能圓桌對話,圖/雲棲大會

但趨勢歸趨勢,Kimi 對於「深入推理」功能的迫切,還在於國內市場面臨的競爭態勢在發生變化。

假期趕進度,豆包給到Kimi的壓力越來越大

不管新功能是什麼,不難看出,頂着國慶假期趕進度,在一定程度上說明了 Kimi 團隊的的急迫感。而這些壓力,主要還是來自於國內其他大模型公司的激烈競爭。

經常看 B 站的朋友應該都會發現,之前一直出現在站內廣告中的 Kimi,存在感已經相當薄弱,取而代之則是滿屏的「豆包」。而字節跳動的豆包,也無疑是目前國內 AI 智能助手的領頭羊。

公開數據顯示,5 月上線以來,豆包連續數月一直佔據 App Store 免費榜的前列位置,6 月更是長達一個月霸佔榜首。即便到 10 月,豆包也仍排在第四。優秀的產品體驗以及海量的推廣,豆包可以說在短時間內迅速吸引了海量用戶,也佔領了市場。

圖/蘋果

a16z 公佈的全球 AI 產品前 100 榜單中,豆包同時出現在網頁端和移動端的前 50 名榜單中,顯示了其在全球市場的影響力。而與之對比,Kimi 在此榜單中未見蹤影。

不只是豆包。同爲大模型初創公司的 MiniMax 也在迎來爆發。從 9 月以來,旗下 AI 智能助手——海螺 AI 的數據出現爆發式增長,月訪問量翻了超過 8 倍,月活用戶接近 500 萬。

另一方面,Kimi 過去最爲人熟知的優勢就是長文本的處理能力,能夠支持大量資料的快速處理。但隨着技術的迭代,各家大模型的上下文處理能力都發生了很大的進步,谷歌 Gemini、阿里通義、騰訊元寶以及月之暗面 Kimi,都支持了 1000 萬 Token/字的長上下文。

而在此之後,Kimi 最明顯的「優勢」不再明顯,同時各家的競爭也開始多元,甚至更側重於產品功能層面。在這個階段中,Kimi 並沒有讓用戶感知到其他更明顯的優勢,也就很難守住 AI 智能助手「當紅炸子雞」的市場地位。

在這種背景下,Kimi 面臨的挑戰是顯而易見的。

抗擊巨頭衝擊波,Kimi 需要「深入推理」

Kimi 正在開發的「深入推理」功能,無疑是一劑強心劑。在激烈的競爭中推出「深入推理」功能,不僅有利於 Kimi 提供能夠與領先者競爭的差異化功能和能力,在競爭激烈的市場中重新站穩腳跟。

更重要的是,「深入推理」不僅意味着能夠得到更復雜問題的答案,還代表着 AI 可以在長時間對話中進行深度思考和自我反思,將極大提升用戶在使用 Kimi 過程中的體驗,尤其是面對複雜任務的場景中。

這也符合 Kimi 一直以來的用戶畫像——學生、大學生、實習生、打工人,並且用戶更聚焦在學習、辦公協助上。相較之下,不管是豆包還是海螺 AI 其實都有更多角色扮演、情感交流的定位。

圖/ Kimi

而且對於現在 AI 智能助手的用戶來說,簡單的答案生成已經不足以滿足他們的需求。越來越多的用戶期望 AI 不僅是簡單地回答問題,而是能夠幫助複雜的工作任務和日常的內容創作,甚至在推理過程中自我糾錯。

伴隨用戶對 AI 要求的不斷提高,Kimi「深入推理」或許能夠幫助用戶更好地應對他們面臨的更多現實問題和更高難度的任務,創造更強的用戶黏性。與此同時,「深入推理」對團隊自身的提振作用可能也不容忽視。

總而言之,Kimi 的「深入推理」功能或許將是一次關鍵的升級,對於 Kimi 來說也是一劑強心劑,既是在激烈的市場競爭中重新找回屬於自己的競爭優勢,也是爲通用智能的範式轉變奠定基礎。

或許再之後,「深入推理」將不只是一個功能,而是成爲 Kimi 背後大模型的底層能力。而在國產大模型以及 AI 智能助手之中,目前來看,Kimi 很可能是最早邁出這一步的廠商。