張鈸院士:ChatGPT出現後 建立人工智能理論有了可能性

來源:高校人工智能與大數據創新聯盟

WAIC 2023世界人工智能大會期間,清華大學人工智能研究院名譽院長、瑞萊智慧RealAI首席科學家張鈸院士,受邀出席昇騰人工智能產業高峰論壇。

在論壇上,張鈸院士分享了他對人工智能發展的深度思考。他認爲ChatGPT的出現,讓人工智能通用理論形成成爲可能,只有理論的支撐,AI才能實現革命性發展;同時他認爲通用人工智能的三要素數據、算力和算法,應該升級爲四個要素,分別是知識、數據、算法和算力。

以下爲張鈸院士演講全文

各位專家、各位嘉賓:

大家好!

非常高興在此分享,我覺得人工智能工作者需要鼓勵,因爲做人工智能是在闖無人區,非常艱難。大家不要認爲人工智能取得的每一個進步都是那麼容易,其實是非常困難的。

首先我想談一個問題:“怎麼評估ChatGPT?”

現在有兩種說法:一種說法是,ChatGPT是通用人工智能;還有一種說法,它不是通用人工智能,我的觀點是,這兩個說法都不對,也都對。

我認爲最恰當的說法是,ChatGPT向通用人工智能邁出了一步。按照微軟的說法,ChatGPT是通用人工智能的火花,我贊成這種觀點。

爲什麼呢?

ChatGPT具有通用人工智能的兩個特徵,一個特徵是,在對話或者聊天這個領域,它達到了人工智能的目標,或者達到了行爲主義所主張的人工智能的目標。行爲主義人工智能現在是人工智能主流,它背後的哲學是唯物主義、實用主義,其追求的人工智能目標是使機器的行爲跟人類的行爲相似。爲什麼說ChatGPT達到了這個指標,因爲我們跟ChatGPT對話的時候,就和人類的對話很相近,因此它達到了頭一個通用人工智能的特徵。

第二個特徵是,ChatGPT是開領域多任務,也就是說,在對話這個領域,問題跟領域無關,這是一個重大的突破。大家知道,人工智能經歷過第一代知識驅動、第二代數據驅動,都只能在限定領域裡完成單個任務,所以ChatGPT的出現變成一個開局,開始走向通用。

在通用人工智能最重要的兩個特徵上,達到人類水平,跟領域有關,所以我們可以說它是通用的。但是因爲它只是在對話或者說只是在語言處理這個領域裡達到這個目標,所以我們還不能把它稱作通用人工智能。因爲在別的智能領域是不是能通用,現在還說不清楚。

所以我覺得,這樣的估計是非常恰當的,我們只有在這樣的估計情況下才能討論下面的問題。

首先一個問題,ChatGPT爲什麼能夠達到現在的質量水平?甚至很多地方使大家感到非常驚奇,這主要由於人工智能經過六七十年的努力,實現了三個關鍵技術的突破:

第一個技術,基於詞嵌入的文本語意表示。第二個技術,是基於注意機制的轉換器。第三個技術,基於預測下一個詞的自監督學習。

所以我們應該說,ChatGPT是經過人工智能領域裡或者其它領域裡,大量的科學家和工程師經過六七十年共同努力的結果,因爲經過六七十年,這三個問題纔得到成果。這三個關鍵問題的突破,使得機器在處理文本上有了本質的變化。

過去我們在處理文本的時候,我們往往把它稱作處理數據,到現在爲止大家還是用的這個詞,但是這個詞在ChatGPT裡不成立,因爲ChatGPT是在我們找到了文本語義考試條件下再處理文本,所以它處理的不是文本的形式,不是把文本當成數據來處理,而是把文本當成知識來做。

所以ChatGPT的成功並不是歸根於三個要素,我覺得應該強調四個要素:知識、數據、算法和算力。

也就是說我們有三個關鍵技術突破,就使得我們能夠從大量的文本(數據)中獲取到知識點,因爲只有實現這個轉變,纔有現在的成績,不然我們還是停留在那個錯誤認識上。那麼這個突破,可能帶來不可阻擋的三件事情,頭一件事必然帶來科技的革命,會帶來人工智能本身的能力。

人工智能發展到ChatGPT以前,我們不能說它是一個科學,爲什麼?它沒有理論。

人工智能爲什麼理論建立不起來?非常重要的原因是在歷代人工智能做的知識驅動也好,第二代做的數據驅動也好,我們都是在限定領域裡完成單個任務,在單領域單任務裡不可能來建立一個通用理論。ChatGPT掃除了這個障礙,至少在自然語言處理上掃除了這個障礙,因爲它這個領域無關,一旦跟領域脫鉤了,纔有可能建立起來通用的理論。

所以現在去研究、去建立人工智能理論是有可能的,在ChatGPT沒出現以前這種可能性不存在,所以這對我們來講是一個激勵。

什麼是突破口?突破口就在ChatGPT,如果我們把ChatGPT內部的工作原理搞清楚,我們就能找到進入人工智能理論的鑰匙。

ChatGPT裡很多現象我們說不清楚,一方面它能夠生成一個非常出人意料的結果,它同時又會產生所謂幻覺(胡說八道),爲什麼會出現這個現象,這個根本不清楚。

所以頭一個必然會迎來一個科技的革命,首先這個革命會從AI本身開始。

第二個事情,大家討論的非常多,就是產業的變革,人工智能產業本身的產業變革。

人工智能產業的發展,跟信息科技產業發展是非常不一樣的。信息科技的發展,我們可以用四個字來形容:高速持續,可是人工智能技術產業的發展緩慢曲折,什麼原因?

一個最重要的原因是,信息科技從一開始理論就建立了起來,計算機的理論是1936年建立,通訊理論1948年建立,所以在理論指導下,它的技術、它的產業發展都非常順利,信息產業的所有硬件和軟件全是通用,市場非常之大,信息產業不跟領域結合,根本就不可能有這個產業。而人工智能都是跟領域緊密結合,只有算法和模型,而且這些算法方面都是領域限定、任務限制的,開發出來的所有人工智能的硬件和軟件全是專用,跟信息產業完全不同。

拿計算機來講,完全不跟應用結合,它生產出來的計算機什麼地方都沒有用,但是有了ChatGPT之後就告訴大家,人工智能有可能建立一個跟領域無關的模型。

只有算法和模型擺脫了領域的限制,將來生產出來硬件和軟件纔會是通用,或者一定範圍裡通用,纔會有一個很大的市場,這就是今後信息產業革命的一個方向。

第三個事情,人工智能治理。ChatGPT大家看正面比較多,其實它反面也是很成問題的,因爲我們用的方法是叫“預測”,這種模式的學習,必然帶來兩個大問題:

首先,它的結果不確定,受提示詞的影響極大,這就引起了ChatGPT輸出有三個不可避免的缺點。

第一個缺點,錯誤是必然的,所以我們說胡說八道是必然的。第二個缺點,輸出非常受輸入的影響、受提示詞的影響,我可以改變我的輸入,問同樣的問題,改變它的輸入就會得到一個完全不同的問題。第三個,它不知道自己錯了,也改不了。我舉個非常簡單例子,到現在爲止,我問ChatGPT“清華大學校歌的歌詞”,它自己編了一套,我一年以前就這麼問它,到現在還是這樣,我就告訴它不對,清華大學校歌應該是“西山蒼蒼東海茫茫”,我把這歌詞抄給它,它馬上回“對不起,我說錯了”,我退出來再進去,問它“清華大學校歌是什麼”,它又自己編了一套,就說明它不知道自己犯錯了,而且是我告訴它錯誤,它也改不過來。

這些情況就說明ChatGPT的輸出往往不會符合我們的要求,我們的道德要求、我們的倫理要求、我們政治的要求,所以這就是 ChatGPT出現以後,人工智能的治理是不可避免的,我是認爲三個趨勢一定是這樣的。

那麼我們怎麼辦?

我覺得我們主張要發展第三代人工智能,第三代人工智能實際上是包含了幾個內容,一個內容就是要建立可解釋、魯棒的人工智能理論。

二是發展安全、可信、可控、可靠、可擴展的人工智能技術。也就是說只有建立了這個理論之後,我們纔有可能得到一個安全的人工智能技術。換句話講,現在的人工智能技術是不安全的、不可靠和不可信的,特別是利用大數據的機器學習,它的結果一定是這樣的。我們必須建立人工智能的理論,這才能開發出安全、可靠、可信及可擴展的人工智能技術,從而推動產業創新應用和產業發展。

我相信,通過我們國家的規劃,通過產學研的結合,這個目標一定會達到的,謝謝大家。

來源:瑞萊智慧RealAI

版權聲明:轉載文章和圖片均來自公開網絡,推送文章除非無法確認,我們都會註明作者和來源。如果出處有誤或侵犯到原作者權益,請與我們聯繫刪除或授權事宜

往期精彩文章(單擊就可查看):

1.

2.

3.

4.

5.

6.

7.

8.

9.

10.

11.

12.

13. 辦

14.

15.

16.

17.

18.

19.

20.

21.

22.

23.

24.

25.