Google展示名為「Project Astra」的通用人工智慧數位助理 部分功能將率先用於Google服務

在Google I/O 2024開始前,Google曾預告類似Google Lens的應用功能,確定爲以「Project Astra」的發展項目,將能結合語音互動、影像識別、環境感知等方式,讓人工智慧即時描述、解釋以手機鏡頭拍攝畫面內容,甚至也能無縫移轉到具備攝影鏡頭功能的眼鏡上繼續使用。

「Project Astra」是由Google DeepMind團隊構思打造,並且以通用人工智慧數位助理形式爲目標,讓使用者能透過此服務提高工作效率、簡化做事流程,並且以此解決日常生活的疑難雜症。

不過,目前「Project Astra」仍處於相當早期發展階段,暫時尚未有具體成爲正式產品或服務計劃,但Google DeepMind團隊負責人Demis Hassabis表示「Project Astra」相關功能將會應用在手機或眼鏡類智慧穿戴裝置,甚至部分功能將會在今年內率先應用於Gemini等Google服務。

從此次Google I/O 2024實際展示來看,「Project Astra」將能透過手機鏡頭拍攝畫面,並且由人工智慧即時地持續描述畫面細節,例如描述擴音器可發出聲音,甚至指出其中可發出高音頻的擴音元件,或是描述以蠟筆爲題的創意疊詞、辨識程式編碼內容,甚至針對白板上畫的貓與紙箱聯想到「薛丁格的貓」等。

此外,從影片中使用者另外提到是否記得眼鏡位置,人工智慧即可快速回答眼鏡所在位置,代表其具備資訊記憶能力,同時也能隨着使用者從手機切換到使用具備鏡頭攝影功能的眼鏡,更代表「Project Astra」具備一定資料遷移特性,讓使用者能在不同裝置上持續使用。

而Demis Hassabis表示目前已經可以透過多模設計讓「Project Astra」的人工智慧處理諸多訊息,但要能讓迴應時間縮短至與一般對話相仿,其實是相當困難挑戰。

《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》