智譜開源視頻生成模型CogVideoX

8月6日,智譜宣佈將與“清影”同源的視頻生成模型——CogVideoX開源。“清影”模型30秒可將任意文圖生成視頻。據介紹,CogVideoX開源模型包含多個不同尺寸大小的模型,目前智譜將開源CogVideoX-2B,它在FP-16精度下的推理僅需18GB顯存,微調則只需要40GB顯存,這意味着單張4090顯卡即可進行推理,而單張A6000顯卡即可完成微調。