☰

AI Agent—人機交互新範式 | 投研報告

甬興證券近日發佈計算機行業點評：AI Agent—人機交互新範式。

以下爲研究報告摘要：

據智譜微信公衆號，公司發佈在自主智能體領域最新人機交互範式—

基於CogAgent以及AutoGLM-Web架構，可讓AI接受指令並自主操控手機的AI Agent，目標爲實現模仿人類的Plan-Do-Check-Act循環，形成自我反饋和自我提升，爲邁向AGI願景夯實基礎。

核心觀點

AI Agent底層原理：使用VLM與GUI交互，效果與效率雙升

據《Lightweight Neural App Control》（Huawei Noah’s Ark Lab等，2024.10）及《CogAgent:A Visual Language Model for GUI Agents》（WenyiHong等，2023.12），當前來看，智譜，華爲等行業領先廠商多應用VLM（視覺語言模型）執行人機交互程序。大語言模型雖擅長處理文字生成等任務，但在理解與交互GUIs（圖形交互界面）方面存在短板，同時大語言模型運算時間及調用成本都相對較高，基於GPT-4o的AIAgent單任務運行時間需約1-2分鐘，單任務平均運行成本高達1美元。相比之下，VLM模型直接感知視覺信號，閱讀及編程能力得到顯著強化。參數量方面，CogAgent的VLM爲18B，而華爲諾亞方舟研究院LiMAC模型所調用VLM僅約500M，小模型亦有效減少了算力需求，加快了運行效率，LiMAC模型將單任務執行速度提升至約3秒。國內外AI Agent密集發佈，端側AI趨勢明確

據澎湃新聞及IT之家，10/21，微軟公司宣佈推出一系列人工智能自動代理（Autonomous Agents），旨在幫助企業員工在銷售、客戶支持、財務等領域更好完成任務；10/23，Anthropic推出了升級版的Claude3.5Sonnet，其全新功能computer use，支持像人類一樣操作計算機，可以遵循用戶的命令在計算機屏幕上移動光標，點擊相關位置，並通過虛擬鍵盤輸入信息；10/23，榮耀MagicOS9.0升級“YOYO智能體”AI功能，可實現“一句話點外賣”等操作。

從發展階段看，AI已經順利完成賦能雲廠商等科技平臺公司的初級階段，正逐步實現向終端用戶滲透的關鍵躍遷。考慮到端側AI相對更貼近場景需求，我們認爲更多類似功能的智能體應用有望涌現，以打通客戶指令與終端執行之間“最後一公里”，有望帶動端側AI滲透率提升。

AI Agent或將掌握移動互聯新入口，流量分發格局有望重塑AI Agent智能體因具備較強交互性以及便利性，或可打通原先同個終端不同App之間的天然壁壘，我們認爲智能體的默認調用順序（類似於搜索引擎的競價排名）或將具備較高商業化價值。

投資建議

AI Agent趨勢明確，考慮到端側模型趨於輕量化，AI雲側算力需求預計仍可觀，建議關注AI算力相關公司，標的方面建議關注雲賽智聯、潤澤科技等。

風險提示

產業發展不及預期、政策推進力度不及預期、國產替代不及預期（甬興證券李行傑,夏明達）

免責聲明：本文內容與數據僅供參考，不構成投資建議，使用前請覈實。據此操作，風險自擔。

AI Agent—人機交互新範式 | 投研報告

相關資訊