王小川的三階段論:從物理、語言到意識的數學化
來源: 元界
整理編輯:抱一君
牛頓是科學時代起步時的一位科學家,他的重要工作是把物理學變成了數學。智能時代的起步,是從把語言變成數學開始的,以ChatGPT的突破爲標誌。
兩者都是非常重大的時代突破。而在這裡面,多模態並沒有那麼重要。
從科學時代、智能時代再往下走,迎來的將是共生時代,就是把生命變成數學問題,把意識變成數學問題,這個可能發生在十到二十年之後。
9月28日,2024清華五道口首席經濟學家論壇在北京舉行。百川智能創始人兼首席執行官王小川在主題演講,分享了他的科學時代、智能時代邁向共生時代的三個時代論。
他首先分享了他的被證實是對的三個有關技術發展路徑的認知:儘管多模態技術備受關注,但真正的突破在於語言處理技術。當行業普遍追求更大模型時,他認爲真正的機會在範式的轉變,GPT-o1的發佈就是這種體現。在場景應用上,醫療健康是大模型應用的“皇冠上的明珠”,最後通向AGI。
他認爲堆砌數據的大模型是“學而不思則罔”,學的東西很多,但是腦子是混亂的。拿它跟真實世界對齊,這個系統有它的天花板。走向慢思考背後的一套語言體系就是強化學習,強化學習的做法正好跟大模型截然相反,如果只是思考而沒有學習,就是“思而不學則殆”。
而無論美團、滴滴、抖音和搜索,改變的都是生產關係。大模型實現範式的改變,直接產出生產力。
他認爲,大模型時代,發現需求不是重點。很多需求已經天然存在,更多是供給不足,生產力不足。之前更多在造工具,有了大模型之後,實現的是造人,造自己的員工,造我們的夥伴,使得人類推向新的世界,人與智能形成共同面向世界的文明。
以下爲王小川演講的刪減精要版:
我發現這一年多來技術路徑怎麼發展、市場怎麼發展,我講的都是對的:
第一,我反覆強調語言爲中心,這是最重要的一件事,語言變成數學是這一代的變化。行業老提多模態,整個學術界把多模態當回事兒,但其實突破是在語言上。
第二,行業開始往做的足夠大的方向不斷髮展,但是有一個大的機會是範式的變化,GPT-o1的發佈,從快思考走向慢思考,改變了堆積參數的方向。
第三,在賦能千行百業的場景中,往下要驗證的就是醫療健康。醫療式大模型是皇冠上的明珠,最後走向AGI。
今天我的題目《從科學時代邁向智能時代》,開得有點大,先談幾個觀點。在去年年初的時候,就通用智能時代是不是到來了,有爭論。我是堅定地相信它到來了。我在2018年的時候講過一句話,“當機器掌握語言,強人工智能就到來。”那會兒還沒有到來。當我開始用GPT,開始看到機器掌握語言之後,我知道變天了,我們開始進入智能時代。
從工業時代、電氣時代、信息時代到智能時代,我們稱後者爲第四次工業革命,這似乎是大家形成的共識。我依然覺得智能時代要比大家想的還更大。我不是把它當工業革命去看,這樣看還有一種慣性。
我認爲當下是科學時代向智能時代的邁進。牛頓是科學時代起步時的一個科學家,他有一本鉅著叫做《自然哲學的數學原理》,在此之前有一本書叫《自然哲學》。牛頓重要的工作是把物理學變成了數學,科學實驗範式也是他提出來的。從康德的講法來講,數學是理性的空間,我們沒法得到真實的世界,但是物理學是今天最接近真實的學科。
天上星星怎樣運動的,蘋果怎麼落地的,以前是不同的自然現象,但是通過他的翻譯體系就變成了數學公式,變成了模型,變成了統一的一件事情了,世界的物理萬物變成數學解釋現實世界。像相對論、量子力學、麥克韋斯方程等等,都是以物理學變成數學作爲起點,因此叫做科學的時代。
今天智能時代,跟科學時代不一樣了!
首先,科學時代更多講我們對世界的觀測,智能時代的起步,是從把語言變成數學開始的。語言是人類認知世界中間重要的一個工具。其實人是觀測者,沒有觀測者就沒有創造者,觀測使得我們對世界重新以人的意義體系建模。
維特根斯坦講,語言的邊界就是你世界的邊界,包括語言是符號體系,數學、代碼都是語言的符號。學過高等數學的知道,一個等號是一件非常複雜的事情,1+1=2,什麼叫等號呢?這個等號是等價羣的意思。人類發明語言是一種重要的重新分類的活動,代表的就是智能。
語言是我們學習知識、思考和溝通的載體,當語言變成數學問題之後,我們的溝通、知識和思考就變成了數學問題。像物理變成數學一樣,這是非常重大的時代突破。多模態在這裡面,但是沒有那麼重要。
第二件事情是從快思考到慢思考。今天大模型拍腦袋靈光一現給人一點輸出,不是經過深思熟慮的。用強化學習和思維鏈解決慢思考的問題,就發生在兩週前重大的事件,這一大模型國內偏冷,但其實又有人類智慧巨大的突破。
前兩天有媒體讓我再預測下一個突破是什麼?我想在五年、十年後重要的一件事情是,機器能夠通過寫代碼去運行代碼,獲得解決問題的能力。
譬如機器可以生成代碼,生成一個下圍棋的code去運行它,運行完之後機器學會下圍棋,可以想象通過語言背後能夠產生代碼的連接。這個東西挺科幻,但我認爲是大的技術方向。
再往下還有一個時代,那就是怎麼把生命變成數學模型。後面我們再理解生命,理解活着本身背後的數學問題,理解意識背後的數學問題,人跟機器在共生當中都是以生命的視角來看,而不是物理的世界模型。我稱之爲共生時代,這是我做的一個預測,可能發生在十到二十年之後。
英偉達黃仁勳已經講過,今天出生的人不要再學習寫代碼了,寫代碼的工作未來機器都會幹,我們要學習生物、生命、生物醫藥學。從科學時代、智能時代再往下走,我認爲是走向共生時代。
智能時代核心在做四個階段性工作,前兩個在信息時代開始解決,我沿用DIKW的模型,它們分別指Data、Information、 knowledge、Wisdom。二十年以前人類最偉大的作品,開篇之作是搜索,是解決信息檢索的問題,數據變成了信息。收官之作的代表是抖音和TikTok,信息從搜索走向推薦。
再往後一直沒解決的問題是知識問題,大家都聽過一個詞叫知識圖譜,這是谷歌發明的一個詞knowledge graph,我用一個概念講叫做“苦海無崖,回頭是岸”。這樣的技術路線圖是不通向未來的,靠人在裡面大量地解三元組,人這樣教機器學會語言,本身是不可能實現的事情,但大模型一舉攻破了這個問題,把知識變成了數學問題。
之後開始走向搜索增強,把信息用起來,這個事情發生了18個月,GPT-o1的發佈代表了強化學習的開始,我們跳出原來已經有的知識學習的分佈。
從生成式大模型到推理大模型是重大的變化。語言模型的特點是數據越多越智能,除算力以外,儘可能多的數據進來,學的越多,它變得越聰明。這個學習系統,按照中國的古話來講叫做“學而不思則罔”。學東西很多,但是腦子是混亂的,並不經過自己的反思。拿它跟真實世界對齊,這個系統有它的天花板。
走向慢思考背後的一套語言體系就是強化學習,經典的代表之作是2016年發佈的AlphaGo。強化學習的做法正好跟大模型截然相反,強化學習讓數據越少越好,專家越少越好,每丟掉一些專家就變得越聰明,後來就是Alphazero,與AlphaGo動用了人類6000萬的起居做了訓練相比,Alpha zero用的是0,它不靠人教它怎麼下棋,通過規則、通過思考,它自己學會了下棋,反而得到比人更高的下棋的能力。如果它沒有學習,只是靠思考,按照中國論語講的就是“思而不學則殆”。
一個是今天之前的傳統大模型系統叫“學而不思則罔”,AlphaGo停在下圍棋不會新的東西,而學和思融合在一起會形成今天的範式,OpenAI發佈新的GPT-o1兼具這樣的學習能力和思考能力,通過多輪的思考讓自己憑空成長,你不用的時候它也在進化,這是新的思考範式。
今天還有一個大的變革,從科學時代的尾聲走向智能時代之後,一些範式在發生變化。之前我們更多是通過生產關係的變化推動社會進步。大家都用美團,美團連接了人和商家、店家,滴滴連接了司機,抖音和搜索都是不同的連接方式,它們都是生產關係方面的改變。大模型的範式的變化,是直接產出生產力,不是改變生產關係,而是自己產生了智能。我們今天做大模型當之無愧是新質生產力中的一個部分,甚至可能是中間最重要的部分,直接提升供給。
如果大家跟互聯網圈接觸的話,產品經理是中間一個最神聖、至高的位置,因爲他代表發現了需求,發現潛在但是沒有被滿足的需求,通過技術實現和市場的驗證,這是之前互聯網的工作範式。
但是大模型時代,發現需求不是重點。很多需求已經天然存在,更多是供給不足,生產力不足。像對醫生的需求,一直就是要能治好病,大模型時代對產品經理的要求不是洞見這一需求,而是對技術本身的理解,需要需求驅動。
我們之前更多在造工具,有了大模型之後,我們實現的是造人,造自己的員工,造我們的夥伴,使得人類推向新的世界,人與智能形成共同面向世界的文明。
未來知識庫是“ 歐米伽未來研究所”建立的在線知識庫平臺,收藏的資料範圍包括人工智能、腦科學、互聯網、超級智能,數智大腦、能源、軍事、經濟、人類風險等等領域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每週更新不少於100篇世界範圍最新研究資料。