☰

非共識問題成爲WAIC熱議焦點，大模型Scaling Law是否繼續有效？

上海世博中心人潮涌動，人們希望在7月4日～7月6日的2024世界人工智能暨人工智能全球治理高級別會議（下稱WAIC）上找到關於AI未來的線索，回答大模型將沿着什麼樣的路徑進化、當前商業落地方向是否有共識的問題。

Scaling Law（縮放定律）的“指引”下，此前大模型廠商朝着加大訓練數據、加大算力投入、堆積參數的道路前進，模型一代代“膨脹”。但GPT-5遲遲未能推出，又似乎預示着模型快速迭代受阻，Scaling Law遇到困難。

“我留意到各方的意見，我的觀點是，Scaling Law總體而言還是在一定程度發揮價值。但我不太希望對這個問題給出一個‘一錘定音’式的結論。”騰訊雲副總裁、騰訊雲智能負責人、優圖實驗室負責人吳運聲7月5日告訴第一財經記者。當前，關於Scaling Law是否繼續發揮作用的判斷可以粗略分爲兩派，一派謹慎，另一派相對積極。

Scaling Law還有效嗎？

OpenAI CEO薩姆·奧爾特曼是Scaling Law的支持者，此前他表示，GPT-5將比GPT-4聰明得多、GPT-6將比GPT5能力強得多，“我們還沒到達這個曲線的頂端”。但在近日一場訪談中，奧爾特曼也坦言，開發GPT-5還需要一些時間，相關技術仍處於早期階段，存在數據和算法方面的問題。GPT的更新換代變慢的同時，Scaling Law下迭代的大模型至今未解決幻覺等問題。

“ChatGPT出來後，大模型能力有明顯變化。（背後起作用的）Scaling Law是兩架馬車，一架是數據，一架是算力。包括谷歌和OpenAI在內的研究者發現，算力或模型參數量和數據量形成一定比例時，模型纔會有質的提升。”滑鐵盧大學計算機學院助理教授張弘揚在WAIC上表示，現在最大的問題是，數據大家用得差不多了，GPT-4基本已經把市面上能用的大部分數據都用了，於是出現“數據荒”問題。此外，一些大模型廠商需大量採購GPU以訓練模型，Scaling Law到達了算力和數據上的瓶頸。

此情況下，Scaling Law還能支撐大模型快速迭代嗎？吳運聲告訴記者，業內一派觀點認爲，Scalling Law到了一個（增長曲線）比較緩和的地方，繼續加大投入後不會像以前一樣（效果改善）那麼多，也有一派觀點認爲，Scaling Law還在持續高速發展。“最近我們在做多模態研究，多模態近一年多時間裡進展很快，我們加大數據和算力投入，模型還是呈現出能力的巨大提升，Scaling Law仍在一定程度上發揮價值。”他表示，不需對這個問題“一錘定音”，而要在不同場景、不同技術間做各種探索。

業界正在思考新的路徑，一種可能的方法是通過與世界的互動獲得數據，而非耗盡靜態數據。奧爾特曼近日表示，目前還不確定未來如何讓大模型變得越來越聰明，包括是否需要越來越多數據，未來需要找到新的模式來訓練模型，新的方式將不會類似“讀教科書”，或許會像“思考並做一些實驗”。北京大學計算機學院教授、多媒體信息處理全國重點實驗室主任黃鐵軍在WAIC上則談及實時感知互動，他表示，人與世界的互動過程並非機器一般被動接收信息，而是實時互動系統，現在模型是在收集大量靜態數據，而真正的智能系統則要實時感知，實時獲取世界的信息並同步處理。

張弘揚認爲，短期看，可以嘗試用模型自我進化、自我反思的方式進一步提升模型性能。更長遠看，Scaling Law仍有問題。對比人類，人類“吃”的能量少，卻能幹很多事，人類讀的書不多於大模型，能力卻勝於大模型。如何找到讓模型更智能的方式，這將是一個開放問題。

智能體商用問題待釐清

推動大模型前進的兩個“輪子”，一個是模型優化，一個是商業落地。記者瞭解到，關於什麼商業化路線有效，業內也未達成共識。關於WAIC上熱議的商業落地方向智能體，目前仍有一些問題待釐清。

百度創始人兼CEO李彥宏在WAIC演講中稱，智能體是百度看好的AI應用發展方向，未來醫療、金融、教育等領域會依照自身場景做出各種各樣的智能體。螞蟻集團也在WAIC上也介紹了聚焦專業垂直領域的專業智能體。

但記者瞭解到，業界對智能體的共識並未形成，李彥宏認爲智能體是“幾乎可以放之四海皆準的基於大模型的應用”，此前微軟聯合創始人比爾·蓋茨則在改變人與機器交互方式的層面談論智能體。吳運聲認爲，直到現在還沒有組織對智能體進行清晰界定，智能體是業界研究很多的一個領域，但目前智能體在很多嚴肅場景中，還需要其他輔助。

從已有的智能體平臺看，基於通用大模型能力設置有問答範圍的問答系統，是一種主要的智能體形態。國內百度、字節、騰訊旗下均有智能體平臺，此前記者嘗試在百度文心智能體和元寶App用自然語言描述創建個人智能體，發現創建很快，智能體像是聚焦某個具體領域的問答系統，例如1分鐘內通過語言描述創建出一個關於食材搭配的問答小助手。

但有企業智能體用戶告訴記者，在嚴苛的商業場景創建這種智能體並不簡單，需要接入知識庫“教會”智能體專業知識，這需要耗費更長時間，而且也要求企業有自己的知識庫，創建知識庫需要成本。該智能體用戶告訴記者，商業應用還涉及數據安全要求下的模型私有化部署，智能體並不都適用於部署在公有云上，這意味着智能體商用並不是“點點手指”那麼簡單，還需要跟智能體平臺協商合作，而目前一些智能體平臺仍依靠免費吸引企業用戶，收費模式未完全成型。此外，能力上，智能體依賴的通用大模型仍容易出現幻覺問題，這在商業場景中難以容忍。

吳運聲向第一財經等媒體表示，需要回到大語言模型層面來理解智能體。大語言模型輸入的語言具有不精確性但可描述廣泛範圍，智能體的本質還是希望基於最樸素的語言層面，例如向智能體提出用自然語言表達的需求後，不需設定精確的步驟，智能體就能直接解決問題。業界對智能體的研究很多，但仍需要逐步解決其中各種侷限性問題。

非共識問題成爲WAIC熱議焦點，大模型Scaling Law是否繼續有效？

相關資訊