又一陸版「Sora」!影像生成模型「可靈」開放邀測體驗

在可靈上輸入提示詞:「一隻戴眼鏡的小白兔坐在咖啡館的椅子上看報紙,桌上有一杯熱咖啡」。(圖/取自每經網)

大陸近期紛紛推出自行研發的影像生成模型,繼北京生數科技4月發表「Vidu」,大陸短影音應用程式「快手」近日也推出影像生成大模型「可靈」,據陸媒報導,目前在快手的剪輯應用程式「快影」開放邀測體驗。

據每經網8日報導,可靈爲快手AI團隊研發,具備諸多優勢,包括生成大幅度合理運動,模擬物理世界特性,具備強大概念組合能力和想像力,生成的影像分辨率高達1080p,時長高達2分鐘,且支持自由的寬高比。

可靈與Open AI今年2月發表的「Sora」採用相似的技術路線,結合多項自研技術創新,效果對標Sora。

報導指出,可靈使用的是與Sora一樣的Diffusion Transformer架構,該架構能巧妙融合時間與空間的資訊,對影片數據進行綜合分析和處理,無論是快速移動的物體、劇烈變化的場景,還是複雜的人物動作都能被精確捕捉,使生成的影片內容動態性十足,同時具有很高的物理世界真實感。

此前,大陸清華大學聯合北京生數科技有限公司4月發佈文字描述生成影片的人工智慧模型「Vidu」,同樣以Sora爲競爭標竿,目前Vidu能夠一鍵生成長達16秒、畫質1080P的高清影片內容。