中科院院士張鈸:發展第三代人工智能,需要產學研共同努力
(原標題:中科院院士張鈸:發展第三代人工智能,需要產學研共同努力)
在12月23日舉辦的2023華爲雲AI院長峰會上,中國科學院院士、清華大學人工智能研究院名譽院長張鈸發表視頻致辭,對大模型的價值、面臨的治理問題以及未來的發展方向進行了分享。
中國科學院院士、清華大學人工智能研究院名譽院長張鈸發表視頻致辭
大模型向通用AI邁出一步
大語言模型能夠通過學習和理解人類的語言來進行對話,還能根據聊天的上下文進行互動,真正像人類一樣來聊天交流,甚至能完成撰寫新聞、郵件、視頻腳本、文案、翻譯、代碼等任務。對此,張鈸院士表示,與真人對話很接近,達到行爲主義所追求的目標,這是AI里程碑式的成就。
張鈸認爲,相較第一代AI的知識驅動模型、第二代AI的數據驅動模型,突破特定的領域、利用特定的模型、實現特定的任務三個特定,向通用AI(AGI)邁出了一步。
對AI的治理需要從模型和使用角度出發
大模型的出現,使傳統人工智能向生成式人工智能轉變,爲所有人工智能企業打開一扇新的大門,也將爲AI產業發展帶來新的機遇。
第一,促進AI科技革命。張鈸解釋,信息科學技術發展速度快是因爲其在發展初期就打下了堅實的理論基礎,但AI至今沒有理論,AI已有的模型和算法都是針對具體領域和具體任務,難以建立通用的理論。但與第一代和第二代AI不同,大模型突破了三個特定,使可解釋和魯棒的AI理論成爲可能,將會極大地推動AI科技的迅速發展。
第二,推動AI產業變革。受單領域和單任務的限制,AI的應用和產業化總是被限制於狹小的領域。但目前大模型已經從生成文本擴大到生成其他模態,可以使用通用的模型生成多樣性的人類水平的圖像、聲音、視頻和代碼等。大模型通過微調可以滿足不同領域和任務的需求,與知識庫和其他工具結合,可以極大地擴大AI產業與應用的發展空間,有可能使AI產業進入新的發展階段。
此外,大模型的發展也帶來了一些挑戰。第一,大模型目前僅在自然語言處理和編程等少數任務上做到了通用性,在諸如決策、博弈等領域能否實現通用性仍有待研究。
第二,大模型利用預測下一個詞的自監督學習方法學習文本和生產文本,與人類的文本學習和語言生產的原理完全不同。這使得其具有三個本質性的缺陷,一是輸出質量不一致,且不可控,存在犯大錯誤的可能性;二是受提示詞(輸入詞)影響很大,輸出魯棒性比較差;三是沒有自知之明,難以自我發現錯誤和糾正錯誤。
基於其缺陷,大模型生成不符合道德倫理、政治標準的內容比較常見,需要通過AI對齊來解決,這屬於對模型的治理問題。同時大模型輸出的正確內容也可能被誤用和濫用,因此需要對使用者進行治理。在AI發展過程中,必須處理好發展和治理之間的關係,以保證AI的健康發展。
發展第三代人工智能需要產學研共同努力
儘管眼下GPT只能以人機對話的形式呈現,存在種種侷限,但也向通用型人工智能的方向邁了一步。如何使AI走向通用的道路?張鈸指出,“必須發展第三代人工智能。”
張鈸認爲,發展第三代人工智能的任務包括,第一,建立可解釋和魯棒的 AI 理論。第二,發展安全可信、可控、可靠和可擴展的AI技術。第三,推動AI的創新應用和產業發展。
要實現這個任務,張鈸表示,需要把知識、數據、算法和算力充分利用起來,通過文本語義向量表示、多頭注意機制的轉換器、自監督學習這三個關鍵技術,實現了從過去只是把文本當成數據來處理,轉變爲對文本的內容及文本所包含知識的處理,這是關鍵性的一步。
張鈸指出,發展第三代人工智能,還需要產學研共同努力,把基礎研究、技術創新和產業化三者結合起來。