☰

一句話變影片 OpenAI再進化

微軟資助的AI新創公司OpenAI又有進軍「影片生成」的創舉，15日宣佈開發出新AI模型Sora，可根據文字提示生成長達一分鐘的短影片。圖／美聯社

推出生成式聊天機器人ChatGPT一戰成名後，微軟資助的AI新創公司OpenAI又有進軍「影片生成」的創舉，15日宣佈開發出新AI模型Sora，可根據文字提示生成長達一分鐘的短影片。

OpenAI透過部落格貼文聲明指出，Sora目前用於抓出系統潛在風險的紅隊演練（Red Teaming），協助辨識AI系統缺陷，也供視覺藝術家、設計師和電影製作人使用，以獲取他們對Sora模型的反饋。

聲明說：「Sora能生成複雜場景，有多重角色、特定類型動態畫面、精確詳盡的主題與背景。」Sora除了可以從文字提示生成影片外，還能夠將靜態圖像製成動畫。

Sora依擴散模型（diffusion model）運作的原理，與OpenAI現今最強大的圖像生成AI工具Dall-E 3很類似。

不過OpenAI也提到，Sora模型尚未完成，仍有幾項缺陷尚待克服，包括對文字提示的空間細節產生混淆、無法準確模擬複雜場景的物理現象、難以釐清因果關係、依循特定的運鏡軌跡也有困難。

舉例來說，Sora生成影片中的主角咬了一口餅乾，餅乾卻未見咬痕，或是跑步機上的人跑錯方向。

OpenAI執行長奧特曼（Sam Altman）在社羣平臺X上發文寫道，Sora模型初時只提供給「限量的創作者」。OpenAI同時授權一專家團隊，在將Sora導入該公司產品之前，負責評估該模型的安全性。

臉書母公司Meta、Alphabet旗下谷歌、Runway AI等，老早就開發文字轉影音的生成器。谷歌今年元月發表影片生成模型 Lumiere；Meta去年9月底推出AI圖像生成模型Emu，爲該社羣媒體巨頭首款生成式AI產品，可由文本提示編輯生成影像。

影片生成技術雖加快創作過程，但也引發AI 影響藝術家生計及散播假訊息的疑慮，特別今年適逢關鍵選舉年。OpenAI正另外開發工具，用以辨別影片是否由Sora模型生成。

相關資訊