本週人工智能領域:代理服務震撼登場

代理來了——說的就是人工智能代理。

本週,Anthropic 發佈了其最新的人工智能模型,這是 Claude 3.5 Sonnet 的升級版,可以通過點擊和輸入與網絡和桌面應用程序進行交互——非常像一個人。它並不完美。但正如 Anthropic 所稱,帶有“計算機使用”功能的 3.5 Sonnet 可能會給工作場所帶來變革。

至少,這是宣傳的重點。

Anthropic 的新模型是否名符其實,還有待觀察。但其到來表明了 Anthropic 在新興的人工智能代理市場的雄心壯志,一些分析師認爲,到 2030 年,該市場價值可能接近 500 億美元。

Anthropic 並不是唯一一家投入資源開發人工智能代理的公司,廣義上講,人工智能代理可以自動完成以前必須手動執行的任務。微軟正在測試可以使用 Windows PC 預約等的代理,而亞馬遜正在探索可以主動購買的代理。

組織在生成式人工智能方面可能猶豫不決。但到目前爲止,他們對代理相當樂觀。本月《麻省理工科技評論洞察》的一份報告發現,49%的高管認爲代理和其他形式的高級人工智能助手將帶來效率提升或成本節約。

對於 Anthropic 及其競爭對手構建“智能代理”技術來說,這無疑是個好消息。

人工智能的構建或者運行,成本都不低。

比如說,據說 Anthropic 正在籌募數十億美元的風險投資,而 OpenAI 近期完成了一輪 65 億美元的融資。

但我想知道如今大多數智能代理是否真能達到被炒作的那種效果。

在一項旨在測試人工智能代理協助航空公司訂票任務能力的評估當中,新的 3.5 Sonnet 成功完成的任務還不到一半。

在另一項涉及產品退貨等任務的單獨測試裡,3.5 Sonnet 大約有三分之一的次數失敗。

再次強調,新的 3.5 Sonnet 並不完美,Anthropic 對此也欣然承認。

但很難想象一家公司能長期容忍這麼高的失敗率,從某種程度上講,僱一個秘書反倒更容易。

不過,企業還是表現出願意嘗試人工智能代理的意願,哪怕只是爲了跟上潮流。

根據創業加速器 Forum Ventures 的一項調查,48%的企業開始部署人工智能代理,另外還有三分之一的企業正在“積極探索”智能代理解決方案。

一旦這些早期採用者讓智能代理運行上一段時間,我們就能瞧瞧他們的感受了。

有關數據抓取的抗議:包括演員凱文·貝肯、小說家石黑一雄和音樂家羅伯特·史密斯在內的數千名創意人士簽署了一份請願書,反對未經授權將創意作品用於人工智能培訓。

Meta 測試面部識別技術:Meta 表示,它正在擴大面部識別測試,將其作爲一項反欺詐措施,以打擊名人詐騙廣告。

Perplexity 遭起訴:新聞集團旗下的道瓊斯和《紐約郵報》已起訴不斷髮展的人工智能初創公司 Perplexity,據報道該公司正在尋求融資,原因是出版商稱其爲“內容盜竊統治”。

OpenAI 的新聘人員: OpenAI 聘請了其首位首席經濟學家,即前美國商務部首席經濟學家亞倫·查特吉,以及新的首席合規官斯科特·斯考爾斯,他之前是優步的合規負責人。

ChatGPT 登錄 Windows 系統:在其他 OpenAI 新聞中,OpenAI 已開始 爲某些客戶羣體預覽 ChatGPT的專用 Windows 應用程序,ChatGPT 是其人工智能驅動的聊天機器人平臺。

xAI 的應用程序編程接口(API):埃隆·馬斯克的人工智能公司 xAI 已爲 Grok 推出了一個 API,Grok 是爲 X 上的多項功能提供支持的生成式人工智能模型。

米拉·穆拉蒂的新動態:據報道,前 OpenAI 首席技術官米拉·穆拉蒂正在爲一家新的人工智能初創公司籌集資金。據說該企業將專注於基於專有模型構建人工智能產品。

世界各地的軍隊對於在作戰區域部署人工智能,或者已經在部署的情況,表現出極大的興趣。毫無疑問,這是有爭議的事情,而且根據非營利組織 AI Now 研究所的一項新研究,這也是一種國家安全風險。

該研究發現,如今部署于軍事情報、監視和偵察方面的人工智能已構成危險,原因是其依賴個人數據,而這些數據可能被對手竊取並武器化。共同作者寫道,它還存在一些目前無法解決的漏洞,例如偏差和產生幻覺的傾向。

該研究並非反對軍事化的人工智能。但它指出,確保軍事人工智能系統的安全並限制其危害將需要創建與商業模型分離和隔離的人工智能。

本週在生成式人工智能視頻方面是非常忙碌的一週。不少於三家初創公司發佈了新的視頻模型,每個都有自己獨特的優勢:Haiper 的Haiper 2.0、Genmo 的Mochi 1和 Rhymes AI 的Allegro。

但真正吸引我注意的是 Runway 推出的一款新工具,叫Act-One。Act-One 生成“富有表現力”的角色表演,使用視頻和語音記錄作爲輸入來創建動畫。一名人類演員在鏡頭前表演,Act-One 將其轉化爲人工智能生成的角色,並保留演員的面部表情。

確實,Act-One 本身算不上一個模型,它更像是用於引導 Runway 的Gen-3 Alpha視頻模型的一種控制手段。

人工智能初創公司Suno因涉嫌未經許可在受版權保護的歌曲上訓練其音樂生成工具而被唱片公司起訴,它不希望再有法律上的麻煩。

至少,這是我從 Suno 最近宣佈的與內容 ID 公司 Audible Magic 的合作中得到的印象,一些讀者可能從YouTube 的早期就認識這家公司。Suno 表示,它將使用 Audible Magic 的技術來防止其 Covers 功能上傳受版權保護的音樂,該功能允許用戶創作任何歌曲或聲音的混音。

Suno 已經跟唱片公司的律師講了,它覺得用於訓練其人工智能的歌曲屬於美國的合理使用原則。