億萬富翁催生「有情緒 」的AI助理Moshi :擁法國口音
去年成立的人工智慧非盈利組織Kyutai,週三在巴黎展示了Moshi服務,實驗室的科學家說,他們的系統可以處理70種不同的情緒和風格,他們也示範了該助理,爲攀登珠穆朗瑪峰提供了建議,並以濃厚的法國口音背誦了詩歌。
Kyutai執行長Patrick Perez說:「我們相信,Moshi在改變我們與機器溝通,以及透過機器溝通的方式,有着巨大的潛力」。
儘管專家警告AI帶來的危險,但越來越多的新創企業和大型科技公司,包括Anthropic、Cohere和谷歌,他們競相推出與OpenAI的GPT-4相競爭的模型。
在今年5月,OpenAI爲ChatGPT Plus的使用者舉辦了一個語音助理髮表會,首次將強大的影像識別功能與快速的迴應結合起來。新產品原定幾周後上市,但公司推遲到秋季,並指出,最初的產品不會包含已展示的影片和螢幕共享功能。
OpenAI也因爲在AI功能中展示出一種聽起來像女演員Scarlett Johansson的聲音,招致了強烈反對。在女演員聘請律師之後,公司撤回了該聲音。
Kyutai的Perez說,他的實驗室將以開源技術形式公佈該助理的模型和研究成果,程式碼可以自由享用。他稱Moshi是「首款公佈的即時語音AI助理」。
Kyutai週三在聲明中說,這項新服務是一種「實驗性原型」。該實驗室的一名代表說,這種模型和研究將在未來幾周內推出,但沒有說明具體日期。
Kyutai在去年11月創立,公司獲得了3億歐元資金,其中包括來自Xavier Niel、另一位法國億萬富翁Rodolphe Saade、谷歌前執行長Eic Schmidt。執行長Perez也爲他的實驗室聘請了谷歌DeepMind和Meta的研究人員。
Kyutai首席科學官Herve Jegou在活動中簡短說明了安全性問題,他說,實驗室將使用索引(indexing)和水印工具來識別和跟蹤音訊。