百度李彥宏的AI應用觀,技術平權下的衆樂樂

今年是AI大模型應用落地的元年。其中通用大模型比拼技術和規模,而垂類大模型則是拼場景和效率。半個月前各大美股科技巨頭公佈的財報中,已經證實了AI對現有業務實現了顯著的增收和提效,並且宣佈下一階段還會持續加大投入,AI助手成爲押注的重點,有望誕生“殺手級”的應用。在本週剛舉行的百度世界大會上,圍繞“應用來了”的主題,百度創始人李彥宏分享了百度在AI方面的探索、努力、工具和找到的路徑方法,發佈了多款跨領域創新成果,涵蓋了iRAG技術、無代碼應用以及智能體探索等多個前沿陣地;同時,也介紹了他人如何在百度平臺上創造出有價值成果,幫助更多人在AI時代找到自己的發展道路和方向。

對於這次百度世界大會,輿論層產生了兩種不同的看法。一種認爲百度無疑是中國人工智能的“扛旗者”,不僅在AI技術上保持着領先的規模和生態優勢,而且還在應用上深入佈局了內容創作、教育、電商、醫療、汽車、農業等各個行業領域,有代表性的軟件、硬件或者提供瞭解決方案,還打出了“我們迎來一個前所未有的只靠想法就能賺錢的時代”的口號。另一種則認爲,百度這次的發佈還是有些平淡,並沒有突破性的超級應用出現,比如類似Sora這樣的文生視頻多模態技術,或者本月初OpenAI推出的AI搜索,又或者具身智能體的高階自動駕駛、人形機器人,以及一些顛覆性的AI消費電子,沒有達到預期。但不管觀點如何,百度做人工智能的一個原則已經非常明確,那就是要做人人可觸可及,並且能給自己帶來價值的應用,AI時代每個人既是使用者,也是創作者和參與者,在技術平權下誕生的這些普惠性AI應用,可能遠比一個超級應用更有意義。正如李彥宏所提到的那個問題“過去一年整個行業都在焦慮,超級應用到底在哪裡?”在他看來,人工智能很像是一次新的工業革命,這意味着它不是三五年就結束,不是一兩年就出現超級應用,它更像是三五十年對於整個社會的方方面面一個非常徹底的重構。商業新研社認爲,萬衆期待的AI超級應用,當前還並不具備誕生的條件。一方面需要人工智能基礎設施的完善,這有賴於AI技術的迭代以及代表企業的持續投入,比如ChatGPT就讓生成式人工智能進入了新時代,纔有這兩年來的“智能涌現”,帶動全球科技大廠進入了新一輪投入。另一方面用戶對AI的認知和普及還未積累到一定規模,當前對人工智能技術和應用的探索,主要集中在行業人士或者高知人羣中,普通民衆對其瞭解仍然知之甚少,ChatGPT帶來了一場人工智能的認知洗禮,但這遠遠不夠,打破認知圈層、讓人人觸手可及纔是破局的關鍵。人工智能作爲第四次工業革命的核心技術,正在釋放科技革命和產業變革積蓄的巨大能量,但AI時代,做技術普惠下的衆樂樂,或許遠比獨樂樂更實在。1、從需求出發,百度揭開了AI應用的冰山一角客觀來說,此次百度世界大會,只能說是揭開了百度在各個領域佈局AI應用的面紗,雖談不上驚豔,但至少讓人看到了未來AI能做什麼。而百度做AI的邏輯,是從應用需求出發,確定需要的模型,通過對技術的研發和迭代,提升解決行業問題的能力,以及解決這個問題後,逐步深入挖掘背後的商業價值。李彥宏在會上首先分享了一個行業觀察。“過去24個月對於大模型行業而言,最大的變化是‘大模型基本上消除了幻覺’,回答問題的準確性大大的提升了。讓AI從一本正經的胡說八道變得可用,可被信賴。”在行業中,基於大語言模型的文生圖還有比較嚴重的幻覺,尤其是針對長城、東方明珠、金字塔、愛因斯坦、貝多芬等特定地點、物品和人物,常常會出現張冠李戴的幻覺問題,讓生成的圖片“一眼假”,極大地影響了AI的實用性。消除大模型的幻覺,提高其準確性和可控性,也是AI應用爆發的基礎。基於此,百度正式發佈了檢索增強文生圖技術(iRAG),通過將百度搜索的海量圖片資源與強大的基礎模型深度融合,生成各種超真實的圖像,極大地提高了AI生成圖片的可用性。與傳統文生圖工具相比,iRAG以其“無幻覺、超真實、無成本、立等可取”的獨特優勢,引領圖像生成技術邁向新高度。此外,在影視作品、漫畫作品、連續畫本、海報製作等應用場景中,iRAG都可以大幅降低創作成本。在解決行業應用痛點的同時,百度還想到了如何進一步降低行業門檻。百度無代碼工具“秒噠”的推出,成爲一款不需要寫代碼就能實現任意想法的軟件,門檻很低、人人可上手,涵蓋無代碼編程、多智能體協作以及文心大模型的多工具調用等特點,只需說說話,就能構建出各種應用。正如李彥宏所說,“百度不是要推出一個‘超級應用’,是要幫助更多人、更多企業打造出數百萬‘超級有用’的應用”。根據百度發佈的數據,截至2024年11月初,百度文心大模型的日均調用量已突破15億次,相比一年前首次披露的5000萬次,增長了近30倍。這一增長反映出中國大模型技術應用的快速成熟,AI是真需求。爲了更好的實現AI技術的落地,百度還發布了首款AI眼鏡,是全球首款搭載中文大模型的原生AI眼鏡,具備第一視角拍攝、邊走邊問、識物百科、視聽翻譯、智能備忘等功能。該眼鏡以文心大模型爲技術底座,在模型使用效果和效率上實現了顯著提升。2、智能體的全球同頻,百度的先手和決心如果從人類信息技術變革的不同歷史來看,其應用出現的樣貌都是不一樣的。比如在PC時期,是一個個的軟件和網站,Windows是最主流的操作系統;而在移動時期,是一個個的App和被關注的賬號,操作系統也變成了安卓和iOS的兩強相爭局面,軟件和硬件都迎來了繁榮期。那麼AI時代,其應用最主流的形態又是什麼?在此次百度世界大會上,李彥宏認爲,AI應用最主要的形態將會是智能體(Agent)。他表示,隨着大模型技術和能力的指數級躍遷,自然語言成爲了這個時代最重要的編程語言,我們每一個人都能動手創造一個屬於自己、也屬於他人的AI應用,或者智能體。就像PC時代的網站,移動時代的自媒體賬號,智能體可能會變成AI原生時代,內容、信息和服務的新載體。爲何如此堅定看好智能體?李彥宏解釋道,一方面,做智能體的門檻足夠低,在百度文心智能體平臺上,甚至可以看到11歲的小學生在創造智能體。另一方面,智能體的天花板足夠高,可以做出功能非常強大的應用,通過多個智能體的協作,可以解決更加複雜的問題。事實上,李彥宏的這一判斷,也得到了全球企業家和AI專家的認可。去年11月,比爾·蓋茨在其個人網站上撰文表示:“智能體不僅會改變我們與計算機的互動方式,還將顛覆軟件行業,帶來自圖形用戶界面誕生以來最大的計算革命。”他稱智能體將會像過去的Android、iOS和Windows一樣,成爲下一個平臺。扎克伯格也預測,未來智能體的數量可能會達到數十億,甚至超過全球人口總數。在Gartner最新發布的2025年十大戰略技術趨勢中,Gartner預測到2028年至少有15%的日常工作決策將由代理型AI自主做出,而2024年這一比例爲0%。同時,Gartner預測到2030年80%的人類將每天與智能機器人打交道,而這一比例目前還不到10%。最近,OpenAI也準備發佈一款能夠獨立執行任務的AI智能體,項目代號爲“操作員”(Operator)。OpenAI計劃在明年1月份將其作爲研究預覽版和開發者工具,首次向公衆亮相。基於百度文心大模型和百度生態的豐富應用場景,百度已經在智能體和產業應用兩大方向上跑出商業通路。目前,文心智能體平臺已吸引15萬家企業、80萬名開發者,每週都有上萬個新的智能體在百度文心智能體平臺上被創造出來。這些智能體通過百度新搜索這一最大的分發入口,日均分發量已超1000萬。2025年,百度也將爲智能體提供每天一個億的流量分發支持。對於百度而言,智能體的低門檻開發模式,爲小型應用的涌現和生態的構建提供了肥沃的土壤,不僅爲百度帶來了豐富的流量入口,更通過精準的信息服務增強了用戶的黏性和活躍度。而高天花板背後,隨着AI技術的持續演進,智能體將不斷突破自我,創造出更多的商業機會和成長空間,爲百度在AI時代的競爭中奠定堅實基礎。3、結語從滿足需求到創造需求,就像智能手機的硬件革命,將互聯網時代的核心用戶場景從PC轉移到了手機,掀起了多輪App應用開拓和迭代。而AI技術的升級,又迅速把我們拉入了智能時代,多模態生成、AI助手、智能硬件、機器人等“超能力”應用開始將社會的生產、生活逐漸形成新的綁定。我們一直希望C端AI“殺手級”應用能夠出現,但目前還需要繼續提升基座模型的能力,進一步解決“AI幻覺”等問題。這就像我們剛剛學會走路,卻被觀衆要求去打破百米跑的世界紀錄,這顯然不現實。因爲只有當基礎模型能力達到一定水平後,纔會產生應用層面的創新,並形成產業級場景應用。在當下這一階段,恰恰需要更多耐心資本真正投入硬科技領域,促進這一輪科技的發展和迭代,這就如當年的PC互聯網時代、移動互聯網時代都經歷過的那樣。