OpenAI新模型GPT-4o有語音助理 能唱歌還可打斷它說話
OpenAI推出更高性能、更高效AI技術模型GPT-4o。美聯社
OpenAI週一(13日)發表自家旗艦AI模型升級的新版本,不但速度更快、更便宜,還包含新的語音助理功能,讓它更容易使用,而且將免費開放給所有使用者。這是該公司擴大其聊天機器人ChatGPT應用的最新努力,此時正值Google和其他科技巨擘競相推動AI技術大突破。
新的AI模型名爲GPT-4o,是其已經問世一年多的GPT-4模型的最新版本。OpenAI技術長穆拉蒂(Mira Murati)表示,最新模型能夠更好地消化圖片、影音短片與文字,還能透過語音與人類即時互動。該公司說,人們與新的語音功能交談時,能夠隨時打斷它,這和當前市面上的語音助理不同,而且新模型能夠幾乎即時地回話。
OpenAI主管們直播展示了這款模型如何分析程式碼、在兩個說話者之間翻譯語言,或是如何指導用戶解決寫在一張紙上的基本代數問題,而且全部幾乎都是即時的。
OpenAI發表新產品的時間點,正值Google週二展開年度開發者大會的前一天,預料Google將在大會上宣佈自家的新產品。身爲AI先驅的Google一直與OpenAI及其資助者間合作伙伴微軟爭奪生成式AI的領導地位。微軟並未參與打造GPT-4o。
穆拉蒂說,她的團隊「不知道Google目前的行動」,而且這次活動的時機純屬巧合。她說,週一的更新將「改變人類與機器互動的方式」。
她表示,OpenAI將免費提供新模型給用戶使用, 「這是一種非常具體的方式,讓我們提升爲人人提供這些福利的使命。」
OpenAI執行長奧特曼把新產品比擬爲電影中常見的AI工具。他去年在一場演講中表示,他和其他主管是在2013年的電影《雲端情人》找到靈感,該電影是有關一個男人愛上語音助理的故事。奧特曼和其他OpenAI員工在週一的新品發表後,在社羣平臺X上貼文,引述了這部電影。
奧特曼週一在個人社羣平臺貼文:「原本的ChatGPT顯示語言介面的可能性,這個新版讓人內心感覺不同。」
OpenAI表示,新模型還可以透過語調或臉部表情來偵測人的情緒。它也能更迅速在不同的情緒語調中做轉換,例如從戲劇化的聲音轉換成用機器人聲調、再到唱歌。這項功能將在數週內提供給每月支付20美元費用的ChatGPT-Plus付費用戶使用。
此外,該公司也將向企業提供GPT-4o模型。穆拉蒂說,這款模型速度將是目前其最高級產品GPT-4 Turbo的兩倍,但費用只爲一半。該公司表示,GPT-4o中的「o」代表字根omni(完全、涵蓋全部的)。從週一開始,使用免費版本ChatGPT的用戶,將能使用GPT-4o中的圖像與視覺功能。
奧特曼說,公司的下一款AI模型將比GPT-4明顯更好。儘管外界普遍預期這款新AI模型將在2024年上半年亮相,但OpenAI試圖淡化這樣的預期。穆拉蒂表示,OpenAI可能會在2024年分享有關GPT-5的更新,但沒有表明具體時間。