王小川還是不甘心
搜狗創始人王小川,攜舊部在2023年高調“捲土重來”。
一年過後,揹負着年底前“做出國內最好的大模型”的KPI,王小川交了一份初期答卷。
2024年春節期間,王小川發佈了自己的龍年願景,他表示:“與互聯網時代的應用相比,大模型時代的應用將是一個新物種。以前我們更多的是造工具,但現在,我們造的新物種,更像一個人類的夥伴,人類對夥伴的要求,不會要求它像工具一樣精確,更希望讓它與人類合作。”
▲(王小川)
2024年1月29日,王小川創辦的大模型公司百川智能,發佈了超千億參數的大語言模型Baichuan 3。百川方面強調,在多個權威通用能力評測中,Baichuan 3都展現了出色的能力,尤其在中文任務上更是超越了GPT-4。
百川智能也在一年之間估值就超10億美元,成爲國內估值增長最快的大模型創業之一。對王小川來說,當初因搜狗賣身騰訊,而沒能做成的事終於在這裡得到了延續。
王小川“不甘心”。正如他在創辦百川智能時所說:“搜狗未盡的使命,在機器掌握了語言後終於可以實現了。”
01、完成“搜狗未竟的使命”
事情還得回到2023年4月,沉寂兩年的王小川,在位於清華大學東門外十字路口的搜狐網絡大廈,召開了一場媒體見面會,宣佈與前搜狗COO茹立雲聯合成立大模型創業公司百川智能,並拿到了5000萬美元的啓動資金。
搜狐網絡大廈曾是搜狗的大本營,王小川可謂“舊地重遊”。當時,這裡匯聚了AI創業的羣星,美團聯合創始人王慧文成立的大模型公司——光年之外,辦公地點就選在這裡;估值目前已超百億元的智譜AI,也在樓裡安營紮寨。巧合的是,這三家公司的管理者,都是師出清華的同門。
正當不少人以爲王小川要就此上演“歸來記”時,他卻笑言“不跟他們在這裡卷”,最終帶隊轉戰到了搜狐對面的大廈,雙方一路之隔。
畢竟,王小川雖然起家於搜狐,但這裡也留下了他的遺憾。現在,他要來完成自己的技術理想了。
在2023年ChatGPT剛剛變得火熱時,王小川就按捺不住,激動地發了一條朋友圈:“OpenAI的勝利,是技術理想主義的勝利。”
互聯網圈一直津津樂道的,是當年“天才少年”王小川在搜狐十幾個月就幹出了搜狗搜索,後來拿出了“瀏覽器+輸入法+搜索”的“三級火箭”方法論,並在馬雲、馬化騰、周鴻禕、張朝陽等大佬中游走,一番合縱連橫,推動搜狗獨立在紐交所上市的故事。
但實際上,王小川一直念茲在茲的是一個基於AI的技術夢。
在他看來,搜索引擎的意義重大。它是能夠改變人們互動方式、進而改變互聯網世界的力量。而人工智能和搜索,是天然聯繫在一起的,搜索引擎本身就能對海量的數據進行處理和匹配,這就是AI。
王小川是個執着的人。每次搜狗的發佈會,他都在侃侃而談技術。2016年他就說,搜索的未來是人工智能時代的明珠。那時有人問他搜狗爲什麼要轉型做AI,他當時不好發作,但直到一年後他提起來,還憤憤不平地說,自己聽完“一肚子火”。
2017年初,搜狗的問答機器人汪仔登上了《一站到底》的舞臺。不過這些在綜藝上的宣傳噱頭都是表象,搜狗真正要做的,是想將搜索升級到對話系統、問答系統和翻譯系統。王小川相信,加大投入後,搜狗會推出顛覆性的產品。
2017年11月,搜狗登陸美股,上市當日市值突破50億美元。王小川意氣風發,他在內部信裡說,接下來“唯一的懸念是搜狗能否在搜索領域實現顛覆,能否在人工智能領域引領重大的創新”。
但接下來的四年,搜狗並沒能講出一個激動人心的AI故事。歸根結底,無論是搜索還是AI,都需要極大的投入,但當時的搜狗,“三級火箭”的流量紅利已經吃得差不多了,從2018年之後公司營收增長開始放緩,增長率從2017年的38%下降至2019年的4%,在2020年營收更是首次出現同比下滑。
與此同時,門戶網站的光輝時期已過,處於艱難求生境地的搜狐,自然也無法給予搜狗資金支持。
搜狐創始人張朝陽動起了賣掉搜狗的心思。2013年投資了搜狗的騰訊,也在2020年提出全資收購搜狗。思考了380多天後,王小川忍痛放手,在2021年10月15日宣佈卸任搜狗CEO。
這對搜狗獲取騰訊流量是件好事。但對於王小川當初的技術理想來說,卻未嘗不是一種失敗。他離開搜狐,也拒絕加入騰訊,獨歸江湖。
轉折點在2023年來臨。王小川在媒體報道中表示,他在2023年1月用了ChatGPT之後,突然感覺到“變天了”。這種大語言模型能夠用最自然的方法,根據提問作出回答,“不得了,通用人工智能時代已經到來了。”
當年的搜狗爲了問答,也做了百億參數模型,但即便使上了十八般武藝,也沒能實現今天大模型的效果。一旦有了大模型的加持,在搜索增強方面,將大有所爲。
王小川回憶,當時就有身邊的朋友對他說,“你特別適合做大模型”。因爲,這正好需要用到搜索、輸入法等相關的AI能力。
這話對王小川來說,也不知是激勵還是辛酸。王小川說,當時他回想了一下,自己過去幹了20多年搜索,卻從來沒人和他說過:“小川,你適合做搜索。”
於是,王小川重出江湖,要實現他的AI“初心”,彌補搜狗的遺憾。
百川智能旗下,重新聚集的就是原來“搜狗系”人馬。除了茹立雲之外,前搜狗CMO洪濤、前搜狗搜索總經理陳煒鵬也已迴歸。當初在搜狗時,王小川和茹立雲、洪濤、前搜狗CTO楊洪濤曾並稱爲“四大天王”,現在,其中的三位已經再度聚首。
截至去年10月,百川智能員工已超170人,公司技術聯合創始人陳煒鵬曾表示,搜狗之前各個業務線最優秀的干將如今已基本集結完畢。王小川也說,搜狗老班底互相之間有信任,會更優先歸隊。
在大模型如何發揮價值上,王小川也再度強調了“搜索”,他提出“搜索增強”的解決方案。搜索增強可以將大模型的能力與搜索引擎相結合,給大模型“投喂”更精準、更深入的搜索結果,有助於減少錯誤答案,即所謂的“幻覺”現象。
“從國內來看,搜索增強是大模型走向實用的第一步,甚至是最關鍵的一步,沒有搜索增強的大模型在企業裡是沒法落地的。”王小川在新年願景裡,也再次強調了這一點。
“我最動心的是,能和一羣有理想的人,用極致的技術驅動創造出顛覆性的智能產品。”在百川智能成立時的公開信中,王小川如是寫道。
02、創業急轉彎
衆所周知,王小川和百度董事長、CEO李彥宏一直“不來電”。創業之後,王小川再度調侃了李彥宏和百度的文心一言,隨後百度回嘴說,“王小川脫離一線太久,確實跟我們不在一個宇宙,自然對國內人工智能技術的發展缺乏瞭解。”
這句話戳中了王小川的“痛點”。第二天凌晨他就發佈一條微博懟了回去:“什麼樣的平行宇宙裡,才能做到讓一個脫離一線15年的人,去懟一個脫離一線1.5年的人。”一時間,空氣裡充滿了火藥味。
▲(2005年,推出搜狗搜索的王小川成爲搜狐最年輕的副總裁)
但這確實也是很多人所關注的一點:畢竟,王小川已經離開科技行業一年多了,這段時間裡,他做什麼去了?
王小川其實一直在創業,只不過他的經歷,在不少人眼裡,和人工智能以及大模型,離得有點兒遠。
在離開搜狗時,王小川說,之後將關注生命科學和醫學,“爲大衆健康做貢獻”。
彼時,醫療健康產業正站上風口。在2020年時,我國大健康產業規模已經突破10萬億元,根據“健康中國”戰略,到2030年產業總規模將達到16萬億。然後,他在2021年出手投資了腸道醫療技術開發商“熱心腸研究院”;以及專注於口腔人工智能醫療的公司DeepCare羽醫甘藍,該公司通過深度學習,推出了口腔影像AI分析系統。
從2021年到2022年,王小川連續註冊了三家名字帶“五季”的公司,包括北京五季科技有限公司、北京五季健康諮詢有限公司和五季醫學科技有限公司。後來有市場傳聞稱,當時王小川是準備做智能硬件,打造一款治療打鼾的智能枕頭;但在2023年初,王小川用了2周時間,就做出了決定,放下這個創業項目,去做大模型。
根據天眼查信息,茹立雲也曾在五季醫學科技有限公司持股。去年9月,茹立雲退出股東行列,全身心跟隨王小川創業。而“留守”在這家公司的另一位自然人股東,就是搜狗“四大天王”的最後一位楊洪濤。
從醫療健康到大模型,王小川在創業路上,猛然打了個急轉彎。
作爲從互聯網創業時代走過的“老兵”,王小川靈敏地嗅到了“技術變革”的氣息。過去,從搜索到人工智能,搜狗一直處於百度的下風,王小川也沒有擺脫李彥宏的“陰影”。現在,他終於看到了一次率領團隊、再度挑戰舊秩序的機會,這是他必須抓住的契機。
但之前創業的公司也尚未見眉目,再度轉向人工智能,在外界看來,王小川似乎是一直在追逐風口。
王小川自己並不這麼認爲。他在後來接受媒體採訪時表示,自己當年讀研期間做的課題,就是跟基因測序拼接算法相關的。因此,他也好奇“如何用數學模型去刻畫生命”,而人工智能的發展,同樣也是激發了他的想法,想用深度學習的方法去理解生命科學。
儘管有了這一番解釋,但AI技術實際上還遠沒有走到如此地步。即使是大語言模型,解決的還是人和機器如何對話的問題。
除此之外,業界最想了解的問題就是:大模型創業“前無古人”,在搜狗之後,王小川這次要怎麼講、以及能不能講好一個全新的AI故事?
03、百川智能,一路急奔
在創業之初,王小川和其他創業者一樣,都集中在研發通用大模型上。其中的邏輯也很簡單:既然OpenAI是這麼起家的,那麼國內也一定要有自己的底座大模型。但大模型賽道已逐漸變得擁擠:到去年10月時,國內已涌現了238個大模型;自2023年8月第一批國產大模型通過備案起,截至今年2月,已經有40餘款大模型獲批對外開放。
“百模大戰”中,百川智能做得究竟怎麼樣?爲了打一場和搜狗不同的“翻身仗”,佔領先機,王小川帶領百川一路跑得非常“急”。
依靠搜狗時積累的工程能力、王小川的清華技術背景和大佬人脈,百川智能已經成爲國內在2023年誕生的爲數不多大模型“獨角獸公司”之一。根據去年10月百川智能公開的信息,其年內累計融資已達3.5億美元。《晚點LatePost》估計,當前其估值約達18億美元。此外的三家估值超10億美元的公司分別是通用大模型公司MiniMax、智譜AI和李開復的零一萬物,它們共同成爲大模型創企中殺出的“黑馬”。
成立後半年內,百川智能接連發布了baichuan-7B/13B、Baichuan2-7B/13B四款開源可免費商用大模型及兩款閉源大模型;平均每28天就會發布一款新的大模型。
最引人注目的是,百川智能對“引領開源”的強調。“Baichuan2-7B以70億參數,在英文評測級上能與130億參數的LLaMA2(Meta AI正式發佈的新一代開源大模型)持平。”王小川在去年9月發佈該產品時表示,“我們現在可以獲得比LLaMA更友好且能力更強的開源模型,能夠幫助扶持中國整個生態的發展。”
這也直接把國內大模型競爭“卷”向了一個新的高度。越來越多的通用大模型開源,參數也越來越大。去年年中,阿里雲也加入戰團,成爲首家開源的國內大廠。去年12月,阿里雲又宣佈開源通義千問720億參數模型Qwen-72B。
但大模型能否如手機的安卓系統一樣,上演一出開源“逆襲”的故事,還是個未知數。
2023年11月、12月相對沉寂的百川智能,在今年1月底又突然發佈了超千億參數大模型Baichuan 3。超千億參數模型在訓練過程中對高質量數據,訓練穩定性、訓練效率的要求都高出幾個量級,而從Baichuan大模型1.0的發佈到如今3.0,百川只用了9個月時間。王小川給自己的“KPI”壓力之大,可見一斑。
王小川在創業時的交流會上,就給公司構建起了初步的目標:年底前預計會發布對標GPT-3.5的大模型,並有信心“做到國內最好”,還要做到搜索增強、多模態的增強。
Baichuan 3顯然目標是全面對標GPT-3.5、追趕GPT-4的。百川智能沒有透露模型參數量,相比之下,GPT-3.5是1750億參數。百川方面表示,在多個權威通用能力評測如CMMLU、GAOKAO和AGI-Eval中,Baichuan 3都展現了出色的能力;而在CMMLU、GAOKAO、HumanEval和MBPP等多箇中文評測榜單上,更是超越了GPT-4。
在創業時,王小川曾稱,百川智能將同時發展通用和垂類模型,尤其是在醫療等知識層面重點增強。可以看到,王小川在商業模式上,當時也有了自己的思考,先在具體場景裡做優化、積累行業用戶,構建生態,先把模式跑通。在行業選擇上,王小川則是萬變不離其宗,除了搜索老本行,他投資多年的醫療領域有了用武之地,進入了首選名單。
對於Baichuan 3,百川方面也強調了其在醫療領域內的能力。Baichuan3的醫療數據集Token數超千億,醫療能力逼近GPT-4。在對邏輯推理能力及專業性要求極高的MCMLE、MedExam、CMExam等權威醫療評測上的中文效果,Baichuan 3同樣超過了GPT-4,是中文醫療任務表現最佳的大模型。
趕在新年前面世的超千億大模型,可以說是王小川和百川智能給自己年初的目標,做的一個“年終總結”。
但這份成績顯然還有待繼續提高。畢竟,目前也沒有一款大模型可以成爲公認的“國內最好”。就在不久前的1月16日,智譜AI也發佈全國產的新一代基座大模型GLM-4,整體性能已逼近GPT-4。最引人注目的是,智譜AI還發布了定製化的個人GLM大模GLMs和GLMStore,全面對標OpenAI的GPT商店。
同時,對於大模型,資本的熱情已在漸漸消退。“下一階段,估計很少有人再會投這種基座大模型了,而是會把注意力放到各行業的應用上去。”一位投資人告訴「市界」。大模型融資創業的窗口也接近關閉,一位大模型創業者吐槽說,自己一段時間密集見了30多家投資機構,卻沒有人出手投資。
資本熱度已經逐漸減退,而大衆感興趣的“顛覆時刻”,似乎還沒有真正意義上到來。通用大模型紛紛開放後,下一步又將“卷”些什麼?同時,市場也迫切希望,能夠早日看到大模型們清晰的商業化路徑。
市場曾有聲音判斷,2024年將是AI應用迎來爆發。“AI原生時代,我們需要100萬量級的AI原生應用,但是不需要100個大模型。”李彥宏也在近期表示。
王小川不止一次在公開場合提到過“超級應用”。他認爲,中國的機會或許不是技術科研上比美國跑得快,而是在應用上跑得更快。即“理想上慢半步,落地上快一步”。去年6月,他去美國硅谷走了一圈,發現OpenAI正在嘗試把1000萬顆GPU連在一起,訓練一個大規模的模型。回來之後,這句話就被他調整成了“理想上慢一步,落地上快三步”,在產品應用上要跑得更快了。
但百川智能的超級應用仍然“在路上”。2023年的年底時,王小川在公開活動中還表示,針對C端的超級應用,預計會在2024年推出,“主要針對健康、快樂、個人助理方向”。
很多企業也發現,即使AI應用出現,大模型時代的應用模式,也和移動互聯網時代不同。這仍是一條需要探索的路徑。像去年火爆一時的妙鴨相機,就跳過了“免費獲取早期用戶市場”階段,在推出的第一天就開始收費,但很快其熱度也下降了。
對於大模型公司來說,現在探討如何穩定造血還爲時過早,目前還是處於卡位戰的階段。而在“百模大戰”的下半場,淘汰賽也即將開始。
2015年那波AI浪潮中,就誕生過業界公認的AI“四小龍”。後來,四小龍中的商湯科技、雲從科技都已經成功登陸資本市場。但是,以它們爲代表的那一代AI創企,也普遍都經歷過估值過高之後,商業化變現艱難等問題,很多公司直到現在還在苦惱盈利難題。
經歷過這些的投資人們,面對大模型時出手更爲謹慎,更加重視公司實現自我造血的能力。而無論是國內還是海外,大模型技術和產品都還處於探索期,從數據安全、應用場景到商業模式,都充滿着不確定性,所有人都在摸着石頭過河。
王小川這次創業,“押上”了自己的名字。他要實現昔日夢想,也要謹慎地避免重蹈覆轍。不過幸好,生成式AI大幕才拉開不久,未來舞臺還足夠廣闊。
作者 | 楊 潔
編輯 | 孫春芳
運營 | 劉 珊