智譜AI入局AI生成視頻 張鵬:積極在模型層面探索更高效的scaling方式

7月26日,智譜AI CEO張鵬在智譜Open Day上宣佈,AI生成視頻模型清影(Ying)正式上線智譜清言,生成6秒視頻只需要30秒的時間。即日起所有C端用戶,都能通過清影(Ying)體驗到AI文生視頻、圖生視頻能力。

“我們積極在模型層面探索更高效的scaling方式。”在智譜Open Day上,智譜AI CEO張鵬表示:“隨着算法、數據不斷迭代,相信Scaling Law將繼續發揮強有力作用。”他認爲,在生成式視頻模型的研發中,Scaling Law(規模定律)繼續在算法和數據兩方面發揮作用。

張鵬介紹,清影(Ying)底座的視頻生成模型是CogVideoX,它能將文本、時間、空間三個維度融合起來,參考了Sora的算法設計,它也是一個DiT架構(Diffusion Transformer,是一種結合了 Transformer 架構的擴散模型),通過優化,CogVideoX相比前代(CogVideo)推理速度提升了6倍。