商湯推出首個“可控”人物視頻生成大模型Vimi

北京商報訊(記者 馬換換)7月4日,商湯發佈首個"可控"人物視頻生成大模型Vimi,該模型主要面向C端用戶,支持聊天、唱歌、舞動等多種娛樂互動場景。

據瞭解,Vimi基於商湯日日新大模型的強大能力,僅通過一張任意風格的照片就能生成和目標動作一致的人物類視頻,並支持多種驅動方式,可通過已有人物視頻、動畫、聲音、文字等多種元素進行驅動。用戶只需上傳不同角度的高清人物圖片,即可自動生成數字分身和不同風格的寫真視頻。由Vimi生成的視頻人物不再只是呆板的五官運動,而是搭配手勢、肢體、頭髮等,形成更完整、統一的人物動作,讓創作者可基於生成的視頻素材進行剪輯和再創作。