非共識問題成爲WAIC熱議焦點,大模型Scaling Law是否繼續有效?

上海世博中心人潮涌動,人們希望在7月4日~7月6日的2024世界人工智能暨人工智能全球治理高級別會議(下稱WAIC)上找到關於AI未來的線索,回答大模型將沿着什麼樣的路徑進化、當前商業落地方向是否有共識的問題。

Scaling Law(縮放定律)的“指引”下,此前大模型廠商朝着加大訓練數據、加大算力投入、堆積參數的道路前進,模型一代代“膨脹”。但GPT-5遲遲未能推出,又似乎預示着模型快速迭代受阻,Scaling Law遇到困難。

“我留意到各方的意見,我的觀點是,Scaling Law總體而言還是在一定程度發揮價值。但我不太希望對這個問題給出一個‘一錘定音’式的結論。”騰訊雲副總裁、騰訊雲智能負責人、優圖實驗室負責人吳運聲7月5日告訴第一財經記者。當前,關於Scaling Law是否繼續發揮作用的判斷可以粗略分爲兩派,一派謹慎,另一派相對積極。

Scaling Law還有效嗎?

OpenAI CEO薩姆·奧爾特曼是Scaling Law的支持者,此前他表示,GPT-5將比GPT-4聰明得多、GPT-6將比GPT5能力強得多,“我們還沒到達這個曲線的頂端”。但在近日一場訪談中,奧爾特曼也坦言,開發GPT-5還需要一些時間,相關技術仍處於早期階段,存在數據和算法方面的問題。GPT的更新換代變慢的同時,Scaling Law下迭代的大模型至今未解決幻覺等問題。

“ChatGPT出來後,大模型能力有明顯變化。(背後起作用的)Scaling Law是兩架馬車,一架是數據,一架是算力。包括谷歌和OpenAI在內的研究者發現,算力或模型參數量和數據量形成一定比例時,模型纔會有質的提升。”滑鐵盧大學計算機學院助理教授張弘揚在WAIC上表示,現在最大的問題是,數據大家用得差不多了,GPT-4基本已經把市面上能用的大部分數據都用了,於是出現“數據荒”問題。此外,一些大模型廠商需大量採購GPU以訓練模型,Scaling Law到達了算力和數據上的瓶頸。

此情況下,Scaling Law還能支撐大模型快速迭代嗎?吳運聲告訴記者,業內一派觀點認爲,Scalling Law到了一個(增長曲線)比較緩和的地方,繼續加大投入後不會像以前一樣(效果改善)那麼多,也有一派觀點認爲,Scaling Law還在持續高速發展。“最近我們在做多模態研究,多模態近一年多時間裡進展很快,我們加大數據和算力投入,模型還是呈現出能力的巨大提升,Scaling Law仍在一定程度上發揮價值。”他表示,不需對這個問題“一錘定音”,而要在不同場景、不同技術間做各種探索。

業界正在思考新的路徑,一種可能的方法是通過與世界的互動獲得數據,而非耗盡靜態數據。奧爾特曼近日表示,目前還不確定未來如何讓大模型變得越來越聰明,包括是否需要越來越多數據,未來需要找到新的模式來訓練模型,新的方式將不會類似“讀教科書”,或許會像“思考並做一些實驗”。北京大學計算機學院教授、多媒體信息處理全國重點實驗室主任黃鐵軍在WAIC上則談及實時感知互動,他表示,人與世界的互動過程並非機器一般被動接收信息,而是實時互動系統,現在模型是在收集大量靜態數據,而真正的智能系統則要實時感知,實時獲取世界的信息並同步處理。

張弘揚認爲,短期看,可以嘗試用模型自我進化、自我反思的方式進一步提升模型性能。更長遠看,Scaling Law仍有問題。對比人類,人類“吃”的能量少,卻能幹很多事,人類讀的書不多於大模型,能力卻勝於大模型。如何找到讓模型更智能的方式,這將是一個開放問題。

智能體商用問題待釐清

推動大模型前進的兩個“輪子”,一個是模型優化,一個是商業落地。記者瞭解到,關於什麼商業化路線有效,業內也未達成共識。關於WAIC上熱議的商業落地方向智能體,目前仍有一些問題待釐清。

百度創始人兼CEO李彥宏在WAIC演講中稱,智能體是百度看好的AI應用發展方向,未來醫療、金融、教育等領域會依照自身場景做出各種各樣的智能體。螞蟻集團也在WAIC上也介紹了聚焦專業垂直領域的專業智能體。

但記者瞭解到,業界對智能體的共識並未形成,李彥宏認爲智能體是“幾乎可以放之四海皆準的基於大模型的應用”,此前微軟聯合創始人比爾·蓋茨則在改變人與機器交互方式的層面談論智能體。吳運聲認爲,直到現在還沒有組織對智能體進行清晰界定,智能體是業界研究很多的一個領域,但目前智能體在很多嚴肅場景中,還需要其他輔助。

從已有的智能體平臺看,基於通用大模型能力設置有問答範圍的問答系統,是一種主要的智能體形態。國內百度、字節、騰訊旗下均有智能體平臺,此前記者嘗試在百度文心智能體和元寶App用自然語言描述創建個人智能體,發現創建很快,智能體像是聚焦某個具體領域的問答系統,例如1分鐘內通過語言描述創建出一個關於食材搭配的問答小助手。

但有企業智能體用戶告訴記者,在嚴苛的商業場景創建這種智能體並不簡單,需要接入知識庫“教會”智能體專業知識,這需要耗費更長時間,而且也要求企業有自己的知識庫,創建知識庫需要成本。該智能體用戶告訴記者,商業應用還涉及數據安全要求下的模型私有化部署,智能體並不都適用於部署在公有云上,這意味着智能體商用並不是“點點手指”那麼簡單,還需要跟智能體平臺協商合作,而目前一些智能體平臺仍依靠免費吸引企業用戶,收費模式未完全成型。此外,能力上,智能體依賴的通用大模型仍容易出現幻覺問題,這在商業場景中難以容忍。

吳運聲向第一財經等媒體表示,需要回到大語言模型層面來理解智能體。大語言模型輸入的語言具有不精確性但可描述廣泛範圍,智能體的本質還是希望基於最樸素的語言層面,例如向智能體提出用自然語言表達的需求後,不需設定精確的步驟,智能體就能直接解決問題。業界對智能體的研究很多,但仍需要逐步解決其中各種侷限性問題。