☰

王小川還是不甘心

搜狗創始人王小川，攜舊部在2023年高調“捲土重來”。

一年過後，揹負着年底前“做出國內最好的大模型”的KPI，王小川交了一份初期答卷。

2024年春節期間，王小川發佈了自己的龍年願景，他表示：“與互聯網時代的應用相比，大模型時代的應用將是一個新物種。以前我們更多的是造工具，但現在，我們造的新物種，更像一個人類的夥伴，人類對夥伴的要求，不會要求它像工具一樣精確，更希望讓它與人類合作。”

▲（王小川）

2024年1月29日，王小川創辦的大模型公司百川智能，發佈了超千億參數的大語言模型Baichuan 3。百川方面強調，在多個權威通用能力評測中，Baichuan 3都展現了出色的能力，尤其在中文任務上更是超越了GPT-4。

百川智能也在一年之間估值就超10億美元，成爲國內估值增長最快的大模型創業之一。對王小川來說，當初因搜狗賣身騰訊，而沒能做成的事終於在這裡得到了延續。

王小川“不甘心”。正如他在創辦百川智能時所說：“搜狗未盡的使命，在機器掌握了語言後終於可以實現了。”

01、完成“搜狗未竟的使命”

事情還得回到2023年4月，沉寂兩年的王小川，在位於清華大學東門外十字路口的搜狐網絡大廈，召開了一場媒體見面會，宣佈與前搜狗COO茹立雲聯合成立大模型創業公司百川智能，並拿到了5000萬美元的啓動資金。

搜狐網絡大廈曾是搜狗的大本營，王小川可謂“舊地重遊”。當時，這裡匯聚了AI創業的羣星，美團聯合創始人王慧文成立的大模型公司——光年之外，辦公地點就選在這裡；估值目前已超百億元的智譜AI，也在樓裡安營紮寨。巧合的是，這三家公司的管理者，都是師出清華的同門。

正當不少人以爲王小川要就此上演“歸來記”時，他卻笑言“不跟他們在這裡卷”，最終帶隊轉戰到了搜狐對面的大廈，雙方一路之隔。

畢竟，王小川雖然起家於搜狐，但這裡也留下了他的遺憾。現在，他要來完成自己的技術理想了。

在2023年ChatGPT剛剛變得火熱時，王小川就按捺不住，激動地發了一條朋友圈：“OpenAI的勝利，是技術理想主義的勝利。”

互聯網圈一直津津樂道的，是當年“天才少年”王小川在搜狐十幾個月就幹出了搜狗搜索，後來拿出了“瀏覽器+輸入法+搜索”的“三級火箭”方法論，並在馬雲、馬化騰、周鴻禕、張朝陽等大佬中游走，一番合縱連橫，推動搜狗獨立在紐交所上市的故事。

但實際上，王小川一直念茲在茲的是一個基於AI的技術夢。

在他看來，搜索引擎的意義重大。它是能夠改變人們互動方式、進而改變互聯網世界的力量。而人工智能和搜索，是天然聯繫在一起的，搜索引擎本身就能對海量的數據進行處理和匹配，這就是AI。

王小川是個執着的人。每次搜狗的發佈會，他都在侃侃而談技術。2016年他就說，搜索的未來是人工智能時代的明珠。那時有人問他搜狗爲什麼要轉型做AI，他當時不好發作，但直到一年後他提起來，還憤憤不平地說，自己聽完“一肚子火”。

2017年初，搜狗的問答機器人汪仔登上了《一站到底》的舞臺。不過這些在綜藝上的宣傳噱頭都是表象，搜狗真正要做的，是想將搜索升級到對話系統、問答系統和翻譯系統。王小川相信，加大投入後，搜狗會推出顛覆性的產品。

2017年11月，搜狗登陸美股，上市當日市值突破50億美元。王小川意氣風發，他在內部信裡說，接下來“唯一的懸念是搜狗能否在搜索領域實現顛覆，能否在人工智能領域引領重大的創新”。

但接下來的四年，搜狗並沒能講出一個激動人心的AI故事。歸根結底，無論是搜索還是AI，都需要極大的投入，但當時的搜狗，“三級火箭”的流量紅利已經吃得差不多了，從2018年之後公司營收增長開始放緩，增長率從2017年的38%下降至2019年的4%，在2020年營收更是首次出現同比下滑。

與此同時，門戶網站的光輝時期已過，處於艱難求生境地的搜狐，自然也無法給予搜狗資金支持。

搜狐創始人張朝陽動起了賣掉搜狗的心思。2013年投資了搜狗的騰訊，也在2020年提出全資收購搜狗。思考了380多天後，王小川忍痛放手，在2021年10月15日宣佈卸任搜狗CEO。

這對搜狗獲取騰訊流量是件好事。但對於王小川當初的技術理想來說，卻未嘗不是一種失敗。他離開搜狐，也拒絕加入騰訊，獨歸江湖。

轉折點在2023年來臨。王小川在媒體報道中表示，他在2023年1月用了ChatGPT之後，突然感覺到“變天了”。這種大語言模型能夠用最自然的方法，根據提問作出回答，“不得了，通用人工智能時代已經到來了。”

當年的搜狗爲了問答，也做了百億參數模型，但即便使上了十八般武藝，也沒能實現今天大模型的效果。一旦有了大模型的加持，在搜索增強方面，將大有所爲。

王小川回憶，當時就有身邊的朋友對他說，“你特別適合做大模型”。因爲，這正好需要用到搜索、輸入法等相關的AI能力。

這話對王小川來說，也不知是激勵還是辛酸。王小川說，當時他回想了一下，自己過去幹了20多年搜索，卻從來沒人和他說過：“小川，你適合做搜索。”

於是，王小川重出江湖，要實現他的AI“初心”，彌補搜狗的遺憾。

百川智能旗下，重新聚集的就是原來“搜狗系”人馬。除了茹立雲之外，前搜狗CMO洪濤、前搜狗搜索總經理陳煒鵬也已迴歸。當初在搜狗時，王小川和茹立雲、洪濤、前搜狗CTO楊洪濤曾並稱爲“四大天王”，現在，其中的三位已經再度聚首。

截至去年10月，百川智能員工已超170人，公司技術聯合創始人陳煒鵬曾表示，搜狗之前各個業務線最優秀的干將如今已基本集結完畢。王小川也說，搜狗老班底互相之間有信任，會更優先歸隊。

在大模型如何發揮價值上，王小川也再度強調了“搜索”，他提出“搜索增強”的解決方案。搜索增強可以將大模型的能力與搜索引擎相結合，給大模型“投喂”更精準、更深入的搜索結果，有助於減少錯誤答案，即所謂的“幻覺”現象。

“從國內來看，搜索增強是大模型走向實用的第一步，甚至是最關鍵的一步，沒有搜索增強的大模型在企業裡是沒法落地的。”王小川在新年願景裡，也再次強調了這一點。

“我最動心的是，能和一羣有理想的人，用極致的技術驅動創造出顛覆性的智能產品。”在百川智能成立時的公開信中，王小川如是寫道。

02、創業急轉彎

衆所周知，王小川和百度董事長、CEO李彥宏一直“不來電”。創業之後，王小川再度調侃了李彥宏和百度的文心一言，隨後百度回嘴說，“王小川脫離一線太久，確實跟我們不在一個宇宙，自然對國內人工智能技術的發展缺乏瞭解。”

這句話戳中了王小川的“痛點”。第二天凌晨他就發佈一條微博懟了回去：“什麼樣的平行宇宙裡，才能做到讓一個脫離一線15年的人，去懟一個脫離一線1.5年的人。”一時間，空氣裡充滿了火藥味。

▲（2005年，推出搜狗搜索的王小川成爲搜狐最年輕的副總裁）

但這確實也是很多人所關注的一點：畢竟，王小川已經離開科技行業一年多了，這段時間裡，他做什麼去了？

王小川其實一直在創業，只不過他的經歷，在不少人眼裡，和人工智能以及大模型，離得有點兒遠。

在離開搜狗時，王小川說，之後將關注生命科學和醫學，“爲大衆健康做貢獻”。

彼時，醫療健康產業正站上風口。在2020年時，我國大健康產業規模已經突破10萬億元，根據“健康中國”戰略，到2030年產業總規模將達到16萬億。然後，他在2021年出手投資了腸道醫療技術開發商“熱心腸研究院”；以及專注於口腔人工智能醫療的公司DeepCare羽醫甘藍，該公司通過深度學習，推出了口腔影像AI分析系統。

從2021年到2022年，王小川連續註冊了三家名字帶“五季”的公司，包括北京五季科技有限公司、北京五季健康諮詢有限公司和五季醫學科技有限公司。後來有市場傳聞稱，當時王小川是準備做智能硬件，打造一款治療打鼾的智能枕頭；但在2023年初，王小川用了2周時間，就做出了決定，放下這個創業項目，去做大模型。

根據天眼查信息，茹立雲也曾在五季醫學科技有限公司持股。去年9月，茹立雲退出股東行列，全身心跟隨王小川創業。而“留守”在這家公司的另一位自然人股東，就是搜狗“四大天王”的最後一位楊洪濤。

從醫療健康到大模型，王小川在創業路上，猛然打了個急轉彎。

作爲從互聯網創業時代走過的“老兵”，王小川靈敏地嗅到了“技術變革”的氣息。過去，從搜索到人工智能，搜狗一直處於百度的下風，王小川也沒有擺脫李彥宏的“陰影”。現在，他終於看到了一次率領團隊、再度挑戰舊秩序的機會，這是他必須抓住的契機。

但之前創業的公司也尚未見眉目，再度轉向人工智能，在外界看來，王小川似乎是一直在追逐風口。

王小川自己並不這麼認爲。他在後來接受媒體採訪時表示，自己當年讀研期間做的課題，就是跟基因測序拼接算法相關的。因此，他也好奇“如何用數學模型去刻畫生命”，而人工智能的發展，同樣也是激發了他的想法，想用深度學習的方法去理解生命科學。

儘管有了這一番解釋，但AI技術實際上還遠沒有走到如此地步。即使是大語言模型，解決的還是人和機器如何對話的問題。

除此之外，業界最想了解的問題就是：大模型創業“前無古人”，在搜狗之後，王小川這次要怎麼講、以及能不能講好一個全新的AI故事？

03、百川智能，一路急奔

在創業之初，王小川和其他創業者一樣，都集中在研發通用大模型上。其中的邏輯也很簡單：既然OpenAI是這麼起家的，那麼國內也一定要有自己的底座大模型。但大模型賽道已逐漸變得擁擠：到去年10月時，國內已涌現了238個大模型；自2023年8月第一批國產大模型通過備案起，截至今年2月，已經有40餘款大模型獲批對外開放。

“百模大戰”中，百川智能做得究竟怎麼樣？爲了打一場和搜狗不同的“翻身仗”，佔領先機，王小川帶領百川一路跑得非常“急”。

依靠搜狗時積累的工程能力、王小川的清華技術背景和大佬人脈，百川智能已經成爲國內在2023年誕生的爲數不多大模型“獨角獸公司”之一。根據去年10月百川智能公開的信息，其年內累計融資已達3.5億美元。《晚點LatePost》估計，當前其估值約達18億美元。此外的三家估值超10億美元的公司分別是通用大模型公司MiniMax、智譜AI和李開復的零一萬物，它們共同成爲大模型創企中殺出的“黑馬”。

成立後半年內，百川智能接連發布了baichuan-7B/13B、Baichuan2-7B/13B四款開源可免費商用大模型及兩款閉源大模型；平均每28天就會發布一款新的大模型。

最引人注目的是，百川智能對“引領開源”的強調。“Baichuan2-7B以70億參數，在英文評測級上能與130億參數的LLaMA2（Meta AI正式發佈的新一代開源大模型）持平。”王小川在去年9月發佈該產品時表示，“我們現在可以獲得比LLaMA更友好且能力更強的開源模型，能夠幫助扶持中國整個生態的發展。”

這也直接把國內大模型競爭“卷”向了一個新的高度。越來越多的通用大模型開源，參數也越來越大。去年年中，阿里雲也加入戰團，成爲首家開源的國內大廠。去年12月，阿里雲又宣佈開源通義千問720億參數模型Qwen-72B。

但大模型能否如手機的安卓系統一樣，上演一出開源“逆襲”的故事，還是個未知數。

2023年11月、12月相對沉寂的百川智能，在今年1月底又突然發佈了超千億參數大模型Baichuan 3。超千億參數模型在訓練過程中對高質量數據，訓練穩定性、訓練效率的要求都高出幾個量級，而從Baichuan大模型1.0的發佈到如今3.0，百川只用了9個月時間。王小川給自己的“KPI”壓力之大，可見一斑。

王小川在創業時的交流會上，就給公司構建起了初步的目標：年底前預計會發布對標GPT-3.5的大模型，並有信心“做到國內最好”，還要做到搜索增強、多模態的增強。

Baichuan 3顯然目標是全面對標GPT-3.5、追趕GPT-4的。百川智能沒有透露模型參數量，相比之下，GPT-3.5是1750億參數。百川方面表示，在多個權威通用能力評測如CMMLU、GAOKAO和AGI-Eval中，Baichuan 3都展現了出色的能力；而在CMMLU、GAOKAO、HumanEval和MBPP等多箇中文評測榜單上，更是超越了GPT-4。

在創業時，王小川曾稱，百川智能將同時發展通用和垂類模型，尤其是在醫療等知識層面重點增強。可以看到，王小川在商業模式上，當時也有了自己的思考，先在具體場景裡做優化、積累行業用戶，構建生態，先把模式跑通。在行業選擇上，王小川則是萬變不離其宗，除了搜索老本行，他投資多年的醫療領域有了用武之地，進入了首選名單。

對於Baichuan 3，百川方面也強調了其在醫療領域內的能力。Baichuan3的醫療數據集Token數超千億，醫療能力逼近GPT-4。在對邏輯推理能力及專業性要求極高的MCMLE、MedExam、CMExam等權威醫療評測上的中文效果，Baichuan 3同樣超過了GPT-4，是中文醫療任務表現最佳的大模型。

趕在新年前面世的超千億大模型，可以說是王小川和百川智能給自己年初的目標，做的一個“年終總結”。

但這份成績顯然還有待繼續提高。畢竟，目前也沒有一款大模型可以成爲公認的“國內最好”。就在不久前的1月16日，智譜AI也發佈全國產的新一代基座大模型GLM-4，整體性能已逼近GPT-4。最引人注目的是，智譜AI還發布了定製化的個人GLM大模GLMs和GLMStore，全面對標OpenAI的GPT商店。

同時，對於大模型，資本的熱情已在漸漸消退。“下一階段，估計很少有人再會投這種基座大模型了，而是會把注意力放到各行業的應用上去。”一位投資人告訴「市界」。大模型融資創業的窗口也接近關閉，一位大模型創業者吐槽說，自己一段時間密集見了30多家投資機構，卻沒有人出手投資。

資本熱度已經逐漸減退，而大衆感興趣的“顛覆時刻”，似乎還沒有真正意義上到來。通用大模型紛紛開放後，下一步又將“卷”些什麼？同時，市場也迫切希望，能夠早日看到大模型們清晰的商業化路徑。

市場曾有聲音判斷，2024年將是AI應用迎來爆發。“AI原生時代，我們需要100萬量級的AI原生應用，但是不需要100個大模型。”李彥宏也在近期表示。

王小川不止一次在公開場合提到過“超級應用”。他認爲，中國的機會或許不是技術科研上比美國跑得快，而是在應用上跑得更快。即“理想上慢半步，落地上快一步”。去年6月，他去美國硅谷走了一圈，發現OpenAI正在嘗試把1000萬顆GPU連在一起，訓練一個大規模的模型。回來之後，這句話就被他調整成了“理想上慢一步，落地上快三步”，在產品應用上要跑得更快了。

但百川智能的超級應用仍然“在路上”。2023年的年底時，王小川在公開活動中還表示，針對C端的超級應用，預計會在2024年推出，“主要針對健康、快樂、個人助理方向”。

很多企業也發現，即使AI應用出現，大模型時代的應用模式，也和移動互聯網時代不同。這仍是一條需要探索的路徑。像去年火爆一時的妙鴨相機，就跳過了“免費獲取早期用戶市場”階段，在推出的第一天就開始收費，但很快其熱度也下降了。

對於大模型公司來說，現在探討如何穩定造血還爲時過早，目前還是處於卡位戰的階段。而在“百模大戰”的下半場，淘汰賽也即將開始。

2015年那波AI浪潮中，就誕生過業界公認的AI“四小龍”。後來，四小龍中的商湯科技、雲從科技都已經成功登陸資本市場。但是，以它們爲代表的那一代AI創企，也普遍都經歷過估值過高之後，商業化變現艱難等問題，很多公司直到現在還在苦惱盈利難題。

經歷過這些的投資人們，面對大模型時出手更爲謹慎，更加重視公司實現自我造血的能力。而無論是國內還是海外，大模型技術和產品都還處於探索期，從數據安全、應用場景到商業模式，都充滿着不確定性，所有人都在摸着石頭過河。

王小川這次創業，“押上”了自己的名字。他要實現昔日夢想，也要謹慎地避免重蹈覆轍。不過幸好，生成式AI大幕才拉開不久，未來舞臺還足夠廣闊。

作者 | 楊潔

編輯 | 孫春芳

運營 | 劉珊

王小川還是不甘心

相關資訊