AI Agent—人機交互新範式 | 投研報告

甬興證券近日發佈計算機行業點評:AI Agent—人機交互新範式。

以下爲研究報告摘要:

據智譜微信公衆號,公司發佈在自主智能體領域最新人機交互範式—

基於CogAgent以及AutoGLM-Web架構,可讓AI接受指令並自主操控手機的AI Agent,目標爲實現模仿人類的Plan-Do-Check-Act循環,形成自我反饋和自我提升,爲邁向AGI願景夯實基礎。

核心觀點

AI Agent底層原理:使用VLM與GUI交互,效果與效率雙升

據《Lightweight Neural App Control》(Huawei Noah’s Ark Lab等,2024.10)及《CogAgent:A Visual Language Model for GUI Agents》(WenyiHong等,2023.12),當前來看,智譜,華爲等行業領先廠商多應用VLM(視覺語言模型)執行人機交互程序。大語言模型雖擅長處理文字生成等任務,但在理解與交互GUIs(圖形交互界面)方面存在短板,同時大語言模型運算時間及調用成本都相對較高,基於GPT-4o的AIAgent單任務運行時間需約1-2分鐘,單任務平均運行成本高達1美元。相比之下,VLM模型直接感知視覺信號,閱讀及編程能力得到顯著強化。參數量方面,CogAgent的VLM爲18B,而華爲諾亞方舟研究院LiMAC模型所調用VLM僅約500M,小模型亦有效減少了算力需求,加快了運行效率,LiMAC模型將單任務執行速度提升至約3秒。國內外AI Agent密集發佈,端側AI趨勢明確

據澎湃新聞及IT之家,10/21,微軟公司宣佈推出一系列人工智能自動代理(Autonomous Agents),旨在幫助企業員工在銷售、客戶支持、財務等領域更好完成任務;10/23,Anthropic推出了升級版的Claude3.5Sonnet,其全新功能computer use,支持像人類一樣操作計算機,可以遵循用戶的命令在計算機屏幕上移動光標,點擊相關位置,並通過虛擬鍵盤輸入信息;10/23,榮耀MagicOS9.0升級“YOYO智能體”AI功能,可實現“一句話點外賣”等操作。

從發展階段看,AI已經順利完成賦能雲廠商等科技平臺公司的初級階段,正逐步實現向終端用戶滲透的關鍵躍遷。考慮到端側AI相對更貼近場景需求,我們認爲更多類似功能的智能體應用有望涌現,以打通客戶指令與終端執行之間“最後一公里”,有望帶動端側AI滲透率提升。

AI Agent或將掌握移動互聯新入口,流量分發格局有望重塑AI Agent智能體因具備較強交互性以及便利性,或可打通原先同個終端不同App之間的天然壁壘,我們認爲智能體的默認調用順序(類似於搜索引擎的競價排名)或將具備較高商業化價值。

投資建議

AI Agent趨勢明確,考慮到端側模型趨於輕量化,AI雲側算力需求預計仍可觀,建議關注AI算力相關公司,標的方面建議關注雲賽智聯、潤澤科技等。

風險提示

產業發展不及預期、政策推進力度不及預期、國產替代不及預期(甬興證券 李行傑,夏明達 )

免責聲明:本文內容與數據僅供參考,不構成投資建議,使用前請覈實。據此操作,風險自擔。