一句話變影片 OpenAI再進化

微軟資助的AI新創公司OpenAI又有進軍「影片生成」的創舉,15日宣佈開發出新AI模型Sora,可根據文字提示生成長達一分鐘的短影片。圖/美聯社

推出生成式聊天機器人ChatGPT一戰成名後,微軟資助的AI新創公司OpenAI又有進軍「影片生成」的創舉,15日宣佈開發出新AI模型Sora,可根據文字提示生成長達一分鐘的短影片。

OpenAI透過部落格貼文聲明指出,Sora目前用於抓出系統潛在風險的紅隊演練(Red Teaming),協助辨識AI系統缺陷,也供視覺藝術家、設計師和電影製作人使用,以獲取他們對Sora模型的反饋。

聲明說:「Sora能生成複雜場景,有多重角色、特定類型動態畫面、精確詳盡的主題與背景。」Sora除了可以從文字提示生成影片外,還能夠將靜態圖像製成動畫。

Sora依擴散模型(diffusion model)運作的原理,與OpenAI現今最強大的圖像生成AI工具Dall-E 3很類似。

不過OpenAI也提到,Sora模型尚未完成,仍有幾項缺陷尚待克服,包括對文字提示的空間細節產生混淆、無法準確模擬複雜場景的物理現象、難以釐清因果關係、依循特定的運鏡軌跡也有困難。

舉例來說,Sora生成影片中的主角咬了一口餅乾,餅乾卻未見咬痕,或是跑步機上的人跑錯方向。

OpenAI執行長奧特曼(Sam Altman)在社羣平臺X上發文寫道,Sora模型初時只提供給「限量的創作者」。OpenAI同時授權一專家團隊,在將Sora導入該公司產品之前,負責評估該模型的安全性。

臉書母公司Meta、Alphabet旗下谷歌、Runway AI等,老早就開發文字轉影音的生成器。谷歌今年元月發表影片生成模型 Lumiere;Meta去年9月底推出AI圖像生成模型Emu,爲該社羣媒體巨頭首款生成式AI產品,可由文本提示編輯生成影像。

影片生成技術雖加快創作過程,但也引發AI 影響藝術家生計及散播假訊息的疑慮,特別今年適逢關鍵選舉年。OpenAI正另外開發工具,用以辨別影片是否由Sora模型生成。