☰

又一陸版「Sora」！影像生成模型「可靈」開放邀測體驗

在可靈上輸入提示詞：「一隻戴眼鏡的小白兔坐在咖啡館的椅子上看報紙，桌上有一杯熱咖啡」。（圖／取自每經網）

大陸近期紛紛推出自行研發的影像生成模型，繼北京生數科技4月發表「Vidu」，大陸短影音應用程式「快手」近日也推出影像生成大模型「可靈」，據陸媒報導，目前在快手的剪輯應用程式「快影」開放邀測體驗。

據每經網8日報導，可靈爲快手AI團隊研發，具備諸多優勢，包括生成大幅度合理運動，模擬物理世界特性，具備強大概念組合能力和想像力，生成的影像分辨率高達1080p，時長高達2分鐘，且支持自由的寬高比。

可靈與Open AI今年2月發表的「Sora」採用相似的技術路線，結合多項自研技術創新，效果對標Sora。

報導指出，可靈使用的是與Sora一樣的Diffusion Transformer架構，該架構能巧妙融合時間與空間的資訊，對影片數據進行綜合分析和處理，無論是快速移動的物體、劇烈變化的場景，還是複雜的人物動作都能被精確捕捉，使生成的影片內容動態性十足，同時具有很高的物理世界真實感。

此前，大陸清華大學聯合北京生數科技有限公司4月發佈文字描述生成影片的人工智慧模型「Vidu」，同樣以Sora爲競爭標竿，目前Vidu能夠一鍵生成長達16秒、畫質1080P的高清影片內容。

相關資訊