閃電奇襲!零一萬物新旗艦模型超越GPT-4o,排名世界第六

在人工智能的快速發展中,大模型技術已成爲全球科技競爭的焦點。

10月16日,繼上半年千億參數模型 Yi-Large 之後,時隔五個月,零一萬物發佈了最新的旗艦模型Yi-Lightning(閃電),中國大模型中首度超越 GPT-4o。

Lighting直譯爲閃電,從命名可以看出,本來應該是說新模型的推理速度進一步提升。但零一萬物這次,也確實做了個“閃電奇襲”!

國產大模型首超GPT-4o

在國際權威盲測榜單 LMSYS 上,Yi-Lightning 超越了超越了OpenAI的GPT-4o和 Anthropic 的 Claude 3.5 Sonnet,排名世界第六,中國第一,實現了歷史性的突破。

圖注:國際權威盲測榜單LMSYS 中,大語言模型綜合能力排名

值得關注的是,“Yi-Lightning”的評分幾乎與馬斯克最新推出的 xAI 模型 Grok-2-08-13持平,並大幅領先於 GPT-4o-2024-05-13、GPT-4o-mini-2024-07-18以及 Claude3.5Sonnet 等其他競爭對手。

這也意味着零一萬物緊隨 OpenAI、Google 之後,與xAI 打平,進擊全球前三大模型企業。

值得一提是,這次Yi-Lightning大舉殺出重圍,Lmsys團隊更是特意發帖子,稱這是競技場上的大新聞:

這一成就不僅展示了零一萬物在AI大模型領域的技術實力,也爲中國AI的發展注入了強心劑。Yi-Lightning模型的推理速度和生成質量都有了顯著提升,首包時間減少了一半,最高生成速度提升了近四成,展現了“極速”特點。

零一萬物的這一成就,是在公司堅持“模基共建”戰略,即模型訓練、AI基礎設施和AI應用三大團隊的協同合作下取得的。

這種模式使得零一萬物能夠在保持模型性能的同時,大幅降低推理成本,使得Yi-Lightning模型的API價格降至每百萬token僅需0.14美元(0.99元人民幣),直逼行業最低價,相比之下GPT-4o的成本爲4.40美元,爲開發者和企業客戶提供了極具性價比的選擇。

中美大模型差距縮短至五個月

在商業化方面,零一萬物也展示了其清晰的戰略佈局。

公司不僅在ToC端有所佈局,還在ToB端推出了AI 2.0數字人解決方案,聚焦零售和電商等場景,通過Yi-Lightning模型的加持,提升了數字人的實時互動效果和話術生成的準確性。

此外,零一萬物還計劃在近期發佈更多的ToB解決方案,包括AI Infra解決方案和私有化定製模型等,進一步拓展其在企業級市場的服務能力。

今年6月,零一萬物創始人李開復博士在《格隆博士會客廳》的訪談中,彼時也分享了他對中美大模型差距的最新見解。他分析,中國大模型與美國頂級大模型之間的差距已經從之前的7至10年迅速縮短至僅有六個月。

更令人振奮的是,通過技術創新和優化,零一萬物最新旗艦模型Yi-Lightning已將這一差距進一步縮減至五個月。李開復強調,這一成就標誌着中國在AI領域的巨大潛力和快速進步,展現了中國科研團隊的才能和決心。

他堅信,儘管未來可能會有新的挑戰,例如OpenAI等公司推出新模型版本可能會再次影響競爭格局,但零一萬物將繼續堅持預訓練模型的工作,不斷推動中國AI技術向前發展,縮小與國際領先水平的差距。

在AI大模型的競賽中,零一萬物的Yi-Lightning模型不僅在性能上取得了突破,還在成本控制上展現了優勢。

這得益於公司在模型架構上的創新,如採用MoE混合專家模型架構,以及在訓練過程中採用的多階段訓練方法和混合注意力機制。這些技術的應用,使得Yi-Lightning在處理長序列數據時能夠保持高性能,同時降低計算成本。

闢謠“掉隊”傳聞

近來,有市場消息稱,被稱爲“AI六小虎”的6家中國大模型初創企業月之暗面、百川智能、智譜AI、Minimax、零一萬物、階躍星辰,其中有2家逐步放棄預訓練模型,縮減了預訓練算法團隊人數,業務重心轉向AI應用,而零一萬物就是其中一家。

幾日前,李開復先是在在朋友圈進行了闢謠,他表示零一萬物一直在做預訓練,去年和今年發佈的Yi-34B、Yi-Coder,Yi-VL等都是發佈時全球第一梯隊。

此次發佈會上,李開復也公開闢謠稱,零一萬物絕不會放棄預訓練模型工作。

其迴應稱,預訓練既是技術活也是費錢的事兒,但據他了解,目前“AI六小虎”做預訓練仍不成問題。