百度申請視頻生成專利,生成展示有目標對象的目標視頻

金融界 2024 年 11 月 28 日消息,國家知識產權局信息顯示,北京百度網訊科技有限公司申請一項名爲“視頻生成方法、裝置、電子設備及存儲介質”的專利,公開號 CN 119031204 A,申請日期爲 2024 年 9 月。

專利摘要顯示,本申請公開了視頻生成方法、裝置、電子設備及存儲介質,涉及人工智能技術領域,尤其涉及計算機視覺、深度學習、大模型等技術領域,可應用於 AIGC、數字人、智能電商等場景。具體實現方案爲:獲取展示有目標對象的參考圖像對應的參考人體信號及驅動視頻對應的驅動人體信號;對參考人體信號和驅動人體信號分別進行動態特徵提取,得到第一動態特徵和第二動態特徵;對參考圖像進行紋理特徵提取,得到第一紋理特徵;對第一動態特徵、第二動態特徵及第一紋理特徵進行交叉注意力計算,得到第二紋理特徵;對第二紋理特徵、第二動態特徵及噪聲進行拼接,得到第一拼接特徵;根據第一拼接特徵進行去噪處理,生成展示有目標對象的目標視頻。

本文源自:金融界

作者:情報員