大廠趕超ChatGPT

ChatGPT上線的兩百天裡,國內大模型發展開啓“狂飆”模式。

據稱,中國10億參數規模以上的大模型已發佈79個。

大模型進化場,講究一個百模混戰:百度文心大模型已進化至3.5形態;阿里通義千問構建家族模式;京東言犀大模型則是爲自己“量身定做”的產業大模型;美團牽手清華系,領投AI公司智譜華章;360智腦將接入“360全家桶”……

大廠大模型進化論,殘酷又現實,要麼趕超,要麼被淘汰。

搶跑且不停刻苦訓練的百度文心大模型3.5,近日宣稱最新版本文心一言能力已經超出ChatGPT 3.5。

物競天擇,適者生存,大廠大模型紛紛趕超ChatGPT。

作者|洛枳 辛夷

出品|新摘

一、大廠大模型

超過ChatGPT3.5

身穿黑色內搭外穿白色西服外套,搭配乾淨利落的短髮,出現在AI大模型技術能力評估報告大會上。

前一天晚上還在修改議題,剛剛出差回來的百度集團副總裁吳甜在會上說到:“新版本文心一言能力已經超出ChatGPT 3.5,這也是在我們國內開展相關技術工作是重要的里程碑。”

這是繼科大訊飛劉慶峰提到星火大模型即將趕超ChatGPT後,又一家大廠正式確認大模型超過ChatGPT。

今年3月,百度新一代知識增強大語言模型“文心一言”公開邀測,該模型基於文心大模型3.0版本打造。時隔3個多月,已經升級爲3.5版本的文心大模型,在效果、功能、性能全面提升。

文心一言3.5趕超ChatGPT3.5,很大可能是在功能方面新增了插件機制,文心大模型3.5通過插件方式擴增了大模型的能力邊界。

大模型強調大模型技術實力和底座能力。今年5月份,百度上線的新底座大模型正是文心大模型3.5,該模型是文心一言系統的基礎模型,給了文心大模型紮實的底座基礎,也讓文心一言3.5成功趕超ChatGPT。

值得一提的是,在基礎模型訓練中,3.5版本還採用了飛槳最先進的自適應混合並行訓練技術及混合精度計算策略,這大大加快了模型的迭代速度。

衆所周知,百度一直在深耕全棧式人工智能技術研發,共四層:芯片層、框架層、模型層和應用層。

芯片層有崑崙芯;框架層有深度學習平臺飛槳,有力支撐了大模型的高效訓練和推理;模型層有文心大模型;在應用層,目前有15萬家企業申請接入文心一言測試。

其中,飛槳平臺已經有750萬開發者,對比中國軟件從業人員800萬—1000萬,儘管軟件從業人員和深度學習開發人員不完全一致,但在人才數量上的優勢也爲文心3.5趕超ChatGPT提供了大容量智庫,類似超腦的存在。

中國企業在獲得中文語料和對中國文化的理解方面,相較於外國企業本來就有着天然的優勢,中國製造業門類最全,具有面向實體產業訓練產業AIGC的有利條件。

衆多因素合力助推,文心大模型3.0爲基座的文心一言發佈一百多天後,在飛槳與文心的協同優化下,文心大模型3.5成長飛速,最新模型效果提升50%,訓練速度提升2倍,推理速度提升30倍,成功趕超ChatGPT。

在基礎技術之上,百度額外開展了三大增強技術:知識增強、檢索增強和對話增強。

將大模型類比成人類,人如果用知識結構,知識體系的方式進行學習的話,學習效率更高。再學會使用工具進行搜索,實現端對端的極簡化檢索,又可以提升時效性。

大模型自己學習完之後,還得學會反饋式強化訓練,對話增強很像是不斷讓大模型在做題,在對話中告訴大模型哪裡對,哪裡不對,通過提示的方式,讓大模型能夠增強記憶機制,有效的讓他按照我們希望的方式來回答問題,教會這個孩子怎麼樣回答的更好。

除了技術實力,大模型需要落地。

在行業應用方面,百度文心大模型源於產業實踐,服務於產業實踐,已經摸索出大模型產業落地的關鍵路徑,還發布了涵蓋衆多行業和領域的大模型,加速對行業智能化轉型。

目前,國家電網、浦發、泰康、吉利、哈爾濱市、深圳燃氣、TCL等企業單位,百度文心大模型均有合作。

此外,百度十年來研發投入超1000億,2021年核心研發投入佔比超23%,人工智能專業申請量和授權量連續5年排名國內第一,深度學習專利申請量全球第一。百度能在AI大模型領域有突破,與百度在要素資源上的大力投入也息息相關。

可以看出,大廠大模式,拼研發的時刻到了。

二、大廠大模型哪家強?

今年上半年正式公開宣佈做大模型的企業就有近百家,各家大模型正陷入酣戰。其中,有阿里、百度、騰訊、京東、字節跳動等互聯網大廠玩家,也有科大訊飛、商湯科技等AI公司,還有其他“雜牌軍”也混入其中。

半年時間,大模型賽道完成了從概念到落地的進程,這放在任何賽道都很炸裂。

但是,到目前爲止,都沒有明確的指標或者準則去驗證誰家的大模型更優質,一個接着一個發佈會,“王婆賣瓜自賣自誇”式的自我評價,令人眼花繚亂之餘,並沒有太多客觀性。

那麼,百模大戰,究竟誰更勝一籌?

在IDC最新發布的《AI大模型技術能力評估報告,2023》中,首次提出AI大模型技術能力評估框架。

評估大模型共有三大維度:產品技術、服務生態、行業應用。

具體細分指標可達12個:算法模型、服務能力、通用能力、創新能力、平臺能力、安全可解釋、生態合作、行業覆蓋、金融、工業、醫療、能源。

其中,算法模型和行業覆蓋,是衡量大模型能力最重要的2個指標,特別是,二者可以形成持續迭代提升的飛輪。

產品技術能力中,“算法模型”維度是大模型能力最爲核心的要素,也是決定大模型應用效果的根本所在。

原因在於,只有通過算法模型技術的突破,實現具有通用效果優勢的大模型底座,才能支撐更廣泛的行業覆蓋,使各行各業充分享受技術突破帶來的紅利,破解AI落地門檻高的困境。

行業應用能力中,應用覆蓋的廣度是當下大模型廠商最爲關注的指標,是大模型效果通用領先性、行業結合能力的綜合體現。

所以,“行業覆蓋”通過企業級客戶數量和落地行業數,體現了大模型在產業落地上的實力。

國內主流大模型,包括百度、阿里、騰訊、華爲、科大訊飛、360、商湯、第四範式等14家廠商參與了本次評估。

大廠大模型的競爭咬合度很高,百度特點具有“芯片-框架-模型-應用”四層技術棧完整佈局的獨特優勢:芯片層-崑崙芯、框架層-飛槳、模型層-文心大模型,以及各種AI的落地應用,其中百度自研的深度學習平臺飛槳在大模型的高效訓練和推理上提供了強有力的支撐。

阿里雲,也很亮眼,12項指標獲得6項滿分,且是唯一獲得“服務能力”滿分的廠商。作爲基礎模型提供方,大模型廠商的平臺能力、服務能力和生態合作水平對行業發展至爲重要。阿里雲在這三個指標上都獲得了滿分。

目前,阿里雲的通義大模型家族現已具備處理或生成文本、語音和圖片等多種模態的能力。過去3個月,阿里雲先後推出了基礎模型“通義千問”、音視頻大模型產品“通義聽悟”、 AI繪畫創作大模型“通義萬相”,通義大模型家族仍在不斷迭代和進化中。

同爲互聯網大廠的騰訊雲和京東雲,都選擇根據自身特色,深耕產業側,發佈行業大模型。

騰訊雲在構建行業大模型的基礎上,用自身數據進行微調,打造出數據精準性更高、隱私安全性更強的專屬模型。

對於深耕數年供應鏈的京東來說,長期紮根於電商業務和物流業務,選擇奔向產業大模型,專注於供應鏈是更好的選擇。正如京東在言犀大模型發佈會上所言,“只有將供應鏈做實,才能將大模型做實”。

科大訊飛等AI廠家在垂直賽道也拿到了滿分,這些玩家在做透垂直行業上有機會,在廠商競爭中,垂直領域優勢明顯企業將領先。

以科大訊飛爲例,科大訊飛專注人工智能領域20多年,多項核心技術均處於國際領先水平,星火大模型將大模型的語言理解能力、概括表達能力結合類搜索插件,有效解決了新知識難以更新、事實類問答容易“張冠李戴”等行業難題,實現了知識問答能力相比原來24%的提升。

由於訓練大模型的成本極高,普通開發者和中小企業無從下手,這從報告結果也能看出:其他廠也很努力,但前途漫漫,說得更殘酷些,可能連上桌吃飯的機會都少有。

三、大模型

未來通往何方?

在前不久的WAIC大會上,入場大模型的玩家們其實已經劃出了重點:首先解決技術問題,再是場景落地,最後實現商業與規模化。

目前,我們看到大模型已經開始與場景、行業進行深度融合,例如,代碼生成、蛋白質結構預測等領域的大模型,驗證了大模型已不僅在科技企業中應用,也邁出了走向各行各業的步伐。

國內大模型飛快躍過大模型概念股階段,AI大模型已經從拼參數發展到拼應用。

比如,華爲盤古大模型已經在氣象、醫藥研發、電力、語種等領域落地,並交付了多個千億參數大模型。騰訊雲行業大模型能力將應用到金融風控、交互翻譯、數智人客服等場景中,提升了智能應用效率,一站式MaaS服務爲企業減負。

具體到應用場景,以金融領域爲例,行業大模型可以加持金融風控解決方案,相比之前有了10倍效率提升。

大模型結合過往積累的多年黑灰產對抗經驗和上千個真實業務場景,整體反欺詐效果相較於傳統模式,提升了20%左右。企業則可以基於prompt模式,迭代風控能力,從樣本收集、模型訓練到部署上線,實現全流程零人工參與,建模時間也從2周減少到僅需2天。

即便樣本積累有限的情況下,也可以完成快速搭建,跳過“冷啓動”過程。

如何落地及商業化,正在成爲廠商追求的重點。

這意味着,AI進入大規模可複製的產業落地階段,僅利用下游的小樣本或者零樣本學習就可以達到很好的效果,從而降低AI開發成本。百度文心大模型在升級後,就成功將成本降至過去的10%。

任何行業,最終都會形成寡頭態勢,大模型也不例外。

過去短短几個月,大量新的大模型涌現,是瘋狂想抓住風口,害怕掉隊,還是長遠佈局賽道,潛心鑽研,每位玩家只有自己心知肚明。

百模混戰只會是一個階段性的現象,終局仍然集中在少量的幾個大模型。原因不外乎以下幾點:

一是,在演變過程中,各企業和機構逐漸找到了自己的定位,逐漸走向細分方向,最終被更完善的大模型收入麾下。

二是,需要多年積累。真正從底層做起來的大模型,成本非常高,需要非常綜合的能力,在心態上也必須抱有絕對的長期主義,這就意味着沒有絕對經濟實力的玩家,會被甩在半路或者“死”在通往光明的路上。

三是,大模型在應用層面未來想象空間非常大。假設每一個行業都有巨大的發展空間,可以通過新AI技術提效,應用層面的價值一定會分流,依託幾個頭部大模型會有非常廣泛的應用生態。

不可否認的是,未來所有的企業都會強依賴大模型,所有的產品都會基於大模型來開發。

而行業滲透率和市場份額,儼然成爲企業大模型走向寡頭最重要的挑戰元素。