商湯將開放首個人物影片大模型Vimi 支援聊天、唱歌、舞動等互動場景

香港經濟日報4日報導,當前生成式AI技術急速發展,雖然讓照片中的人物動起來已非新鮮事,但商湯科技指出,目前市面上相關產品的實際應用仍存在挑戰,闢如人物動作、表情動作無法精準控制,效果不穩定,且時長有限,只能生成3至4秒短片等,無法滿足廣大短片創作者的需求。

爲解決以上痛點,商湯科技研發的人物影片生成大模型Vimi,可控制照片中人物上半身的自然肢體動作,並自動生成與人物相符的頭髮、服飾及背景變化。商湯科技表示,該模型也可生成合理的光影變化,讓人物動作和視覺效果更爲流暢自然。

而且,Vimi可穩定生成長達1分鐘的單鏡頭人物類短片,畫面效果亦不會隨着時間變化而降低品質或失真。針對喜愛自拍的用戶、創作者等需求,該模型還支援聊天、唱歌、舞動等多種娛樂互動場景。模型更獲頒WAIC展覽展示最高榮譽「鎮館之寶」殊榮,成本屆大會最具創新的展品。