☰

OpenAI新模型GPT-4o有語音助理能唱歌還可打斷它說話

OpenAI推出更高性能、更高效AI技術模型GPT-4o。美聯社

OpenAI週一（13日）發表自家旗艦AI模型升級的新版本，不但速度更快、更便宜，還包含新的語音助理功能，讓它更容易使用，而且將免費開放給所有使用者。這是該公司擴大其聊天機器人ChatGPT應用的最新努力，此時正值Google和其他科技巨擘競相推動AI技術大突破。

新的AI模型名爲GPT-4o，是其已經問世一年多的GPT-4模型的最新版本。OpenAI技術長穆拉蒂（Mira Murati）表示，最新模型能夠更好地消化圖片、影音短片與文字，還能透過語音與人類即時互動。該公司說，人們與新的語音功能交談時，能夠隨時打斷它，這和當前市面上的語音助理不同，而且新模型能夠幾乎即時地回話。

OpenAI主管們直播展示了這款模型如何分析程式碼、在兩個說話者之間翻譯語言，或是如何指導用戶解決寫在一張紙上的基本代數問題，而且全部幾乎都是即時的。

OpenAI發表新產品的時間點，正值Google週二展開年度開發者大會的前一天，預料Google將在大會上宣佈自家的新產品。身爲AI先驅的Google一直與OpenAI及其資助者間合作伙伴微軟爭奪生成式AI的領導地位。微軟並未參與打造GPT-4o。

穆拉蒂說，她的團隊「不知道Google目前的行動」，而且這次活動的時機純屬巧合。她說，週一的更新將「改變人類與機器互動的方式」。

她表示，OpenAI將免費提供新模型給用戶使用，「這是一種非常具體的方式，讓我們提升爲人人提供這些福利的使命。」

OpenAI執行長奧特曼把新產品比擬爲電影中常見的AI工具。他去年在一場演講中表示，他和其他主管是在2013年的電影《雲端情人》找到靈感，該電影是有關一個男人愛上語音助理的故事。奧特曼和其他OpenAI員工在週一的新品發表後，在社羣平臺X上貼文，引述了這部電影。

奧特曼週一在個人社羣平臺貼文：「原本的ChatGPT顯示語言介面的可能性，這個新版讓人內心感覺不同。」

OpenAI表示，新模型還可以透過語調或臉部表情來偵測人的情緒。它也能更迅速在不同的情緒語調中做轉換，例如從戲劇化的聲音轉換成用機器人聲調、再到唱歌。這項功能將在數週內提供給每月支付20美元費用的ChatGPT-Plus付費用戶使用。

此外，該公司也將向企業提供GPT-4o模型。穆拉蒂說，這款模型速度將是目前其最高級產品GPT-4 Turbo的兩倍，但費用只爲一半。該公司表示，GPT-4o中的「o」代表字根omni（完全、涵蓋全部的）。從週一開始，使用免費版本ChatGPT的用戶，將能使用GPT-4o中的圖像與視覺功能。

奧特曼說，公司的下一款AI模型將比GPT-4明顯更好。儘管外界普遍預期這款新AI模型將在2024年上半年亮相，但OpenAI試圖淡化這樣的預期。穆拉蒂表示，OpenAI可能會在2024年分享有關GPT-5的更新，但沒有表明具體時間。

OpenAI新模型GPT-4o有語音助理 能唱歌還可打斷它說話

相關資訊

OpenAI新模型GPT-4o有語音助理能唱歌還可打斷它說話