☰

王小川的三階段論：從物理、語言到意識的數學化

來源：元界

整理編輯：抱一君

牛頓是科學時代起步時的一位科學家，他的重要工作是把物理學變成了數學。智能時代的起步，是從把語言變成數學開始的，以ChatGPT的突破爲標誌。

兩者都是非常重大的時代突破。而在這裡面，多模態並沒有那麼重要。

從科學時代、智能時代再往下走，迎來的將是共生時代，就是把生命變成數學問題，把意識變成數學問題，這個可能發生在十到二十年之後。

9月28日，2024清華五道口首席經濟學家論壇在北京舉行。百川智能創始人兼首席執行官王小川在主題演講，分享了他的科學時代、智能時代邁向共生時代的三個時代論。

他首先分享了他的被證實是對的三個有關技術發展路徑的認知：儘管多模態技術備受關注，但真正的突破在於語言處理技術。當行業普遍追求更大模型時，他認爲真正的機會在範式的轉變，GPT-o1的發佈就是這種體現。在場景應用上，醫療健康是大模型應用的“皇冠上的明珠”，最後通向AGI。

他認爲堆砌數據的大模型是“學而不思則罔”，學的東西很多，但是腦子是混亂的。拿它跟真實世界對齊，這個系統有它的天花板。走向慢思考背後的一套語言體系就是強化學習，強化學習的做法正好跟大模型截然相反，如果只是思考而沒有學習，就是“思而不學則殆”。

而無論美團、滴滴、抖音和搜索，改變的都是生產關係。大模型實現範式的改變，直接產出生產力。

他認爲，大模型時代，發現需求不是重點。很多需求已經天然存在，更多是供給不足，生產力不足。之前更多在造工具，有了大模型之後，實現的是造人，造自己的員工，造我們的夥伴，使得人類推向新的世界，人與智能形成共同面向世界的文明。

以下爲王小川演講的刪減精要版：

我發現這一年多來技術路徑怎麼發展、市場怎麼發展，我講的都是對的：

第一，我反覆強調語言爲中心，這是最重要的一件事，語言變成數學是這一代的變化。行業老提多模態，整個學術界把多模態當回事兒，但其實突破是在語言上。

第二，行業開始往做的足夠大的方向不斷髮展，但是有一個大的機會是範式的變化，GPT-o1的發佈，從快思考走向慢思考，改變了堆積參數的方向。

第三，在賦能千行百業的場景中，往下要驗證的就是醫療健康。醫療式大模型是皇冠上的明珠，最後走向AGI。

今天我的題目《從科學時代邁向智能時代》，開得有點大，先談幾個觀點。在去年年初的時候，就通用智能時代是不是到來了，有爭論。我是堅定地相信它到來了。我在2018年的時候講過一句話，“當機器掌握語言，強人工智能就到來。”那會兒還沒有到來。當我開始用GPT，開始看到機器掌握語言之後，我知道變天了，我們開始進入智能時代。

從工業時代、電氣時代、信息時代到智能時代，我們稱後者爲第四次工業革命，這似乎是大家形成的共識。我依然覺得智能時代要比大家想的還更大。我不是把它當工業革命去看，這樣看還有一種慣性。

我認爲當下是科學時代向智能時代的邁進。牛頓是科學時代起步時的一個科學家，他有一本鉅著叫做《自然哲學的數學原理》，在此之前有一本書叫《自然哲學》。牛頓重要的工作是把物理學變成了數學，科學實驗範式也是他提出來的。從康德的講法來講，數學是理性的空間，我們沒法得到真實的世界，但是物理學是今天最接近真實的學科。

天上星星怎樣運動的，蘋果怎麼落地的，以前是不同的自然現象，但是通過他的翻譯體系就變成了數學公式，變成了模型，變成了統一的一件事情了，世界的物理萬物變成數學解釋現實世界。像相對論、量子力學、麥克韋斯方程等等，都是以物理學變成數學作爲起點，因此叫做科學的時代。

今天智能時代，跟科學時代不一樣了！

首先，科學時代更多講我們對世界的觀測，智能時代的起步，是從把語言變成數學開始的。語言是人類認知世界中間重要的一個工具。其實人是觀測者，沒有觀測者就沒有創造者，觀測使得我們對世界重新以人的意義體系建模。

維特根斯坦講，語言的邊界就是你世界的邊界，包括語言是符號體系，數學、代碼都是語言的符號。學過高等數學的知道，一個等號是一件非常複雜的事情，1+1=2，什麼叫等號呢？這個等號是等價羣的意思。人類發明語言是一種重要的重新分類的活動，代表的就是智能。

語言是我們學習知識、思考和溝通的載體，當語言變成數學問題之後，我們的溝通、知識和思考就變成了數學問題。像物理變成數學一樣，這是非常重大的時代突破。多模態在這裡面，但是沒有那麼重要。

第二件事情是從快思考到慢思考。今天大模型拍腦袋靈光一現給人一點輸出，不是經過深思熟慮的。用強化學習和思維鏈解決慢思考的問題，就發生在兩週前重大的事件，這一大模型國內偏冷，但其實又有人類智慧巨大的突破。

前兩天有媒體讓我再預測下一個突破是什麼？我想在五年、十年後重要的一件事情是，機器能夠通過寫代碼去運行代碼，獲得解決問題的能力。

譬如機器可以生成代碼，生成一個下圍棋的code去運行它，運行完之後機器學會下圍棋，可以想象通過語言背後能夠產生代碼的連接。這個東西挺科幻，但我認爲是大的技術方向。

再往下還有一個時代，那就是怎麼把生命變成數學模型。後面我們再理解生命，理解活着本身背後的數學問題，理解意識背後的數學問題，人跟機器在共生當中都是以生命的視角來看，而不是物理的世界模型。我稱之爲共生時代，這是我做的一個預測，可能發生在十到二十年之後。

英偉達黃仁勳已經講過，今天出生的人不要再學習寫代碼了，寫代碼的工作未來機器都會幹，我們要學習生物、生命、生物醫藥學。從科學時代、智能時代再往下走，我認爲是走向共生時代。

智能時代核心在做四個階段性工作，前兩個在信息時代開始解決，我沿用DIKW的模型，它們分別指Data、Information、 knowledge、Wisdom。二十年以前人類最偉大的作品，開篇之作是搜索，是解決信息檢索的問題，數據變成了信息。收官之作的代表是抖音和TikTok，信息從搜索走向推薦。

再往後一直沒解決的問題是知識問題，大家都聽過一個詞叫知識圖譜，這是谷歌發明的一個詞knowledge graph，我用一個概念講叫做“苦海無崖，回頭是岸”。這樣的技術路線圖是不通向未來的，靠人在裡面大量地解三元組，人這樣教機器學會語言，本身是不可能實現的事情，但大模型一舉攻破了這個問題，把知識變成了數學問題。

之後開始走向搜索增強，把信息用起來，這個事情發生了18個月，GPT-o1的發佈代表了強化學習的開始，我們跳出原來已經有的知識學習的分佈。

從生成式大模型到推理大模型是重大的變化。語言模型的特點是數據越多越智能，除算力以外，儘可能多的數據進來，學的越多，它變得越聰明。這個學習系統，按照中國的古話來講叫做“學而不思則罔”。學東西很多，但是腦子是混亂的，並不經過自己的反思。拿它跟真實世界對齊，這個系統有它的天花板。

走向慢思考背後的一套語言體系就是強化學習，經典的代表之作是2016年發佈的AlphaGo。強化學習的做法正好跟大模型截然相反，強化學習讓數據越少越好，專家越少越好，每丟掉一些專家就變得越聰明，後來就是Alphazero，與AlphaGo動用了人類6000萬的起居做了訓練相比，Alpha zero用的是0，它不靠人教它怎麼下棋，通過規則、通過思考，它自己學會了下棋，反而得到比人更高的下棋的能力。如果它沒有學習，只是靠思考，按照中國論語講的就是“思而不學則殆”。

一個是今天之前的傳統大模型系統叫“學而不思則罔”，AlphaGo停在下圍棋不會新的東西，而學和思融合在一起會形成今天的範式，OpenAI發佈新的GPT-o1兼具這樣的學習能力和思考能力，通過多輪的思考讓自己憑空成長，你不用的時候它也在進化，這是新的思考範式。

今天還有一個大的變革，從科學時代的尾聲走向智能時代之後，一些範式在發生變化。之前我們更多是通過生產關係的變化推動社會進步。大家都用美團，美團連接了人和商家、店家，滴滴連接了司機，抖音和搜索都是不同的連接方式，它們都是生產關係方面的改變。大模型的範式的變化，是直接產出生產力，不是改變生產關係，而是自己產生了智能。我們今天做大模型當之無愧是新質生產力中的一個部分，甚至可能是中間最重要的部分，直接提升供給。

如果大家跟互聯網圈接觸的話，產品經理是中間一個最神聖、至高的位置，因爲他代表發現了需求，發現潛在但是沒有被滿足的需求，通過技術實現和市場的驗證，這是之前互聯網的工作範式。

但是大模型時代，發現需求不是重點。很多需求已經天然存在，更多是供給不足，生產力不足。像對醫生的需求，一直就是要能治好病，大模型時代對產品經理的要求不是洞見這一需求，而是對技術本身的理解，需要需求驅動。

我們之前更多在造工具，有了大模型之後，我們實現的是造人，造自己的員工，造我們的夥伴，使得人類推向新的世界，人與智能形成共同面向世界的文明。

未來知識庫是“ 歐米伽未來研究所”建立的在線知識庫平臺，收藏的資料範圍包括人工智能、腦科學、互聯網、超級智能，數智大腦、能源、軍事、經濟、人類風險等等領域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每週更新不少於100篇世界範圍最新研究資料。

王小川的三階段論：從物理、語言到意識的數學化

相關資訊