視源股份申請二維人像視頻生成方法、裝置、計算機設備及介質專利,簡單快捷,成本低

金融界2024年6月25日消息,天眼查知識產權信息顯示,廣州視源電子科技股份有限公司申請一項名爲“二維人像視頻生成方法、裝置、計算機設備及介質“,公開號CN202211656724.2,申請日期爲2022年12月。

專利摘要顯示,本發明屬於虛擬數字人領域,公開了一種二維人像視頻生成方法、裝置、計算機設備及介質,包括:獲取用戶的模板視頻;根據模板視頻中的圖像,計算全臉表情係數;根據模板視頻中的圖像、音頻和全臉表情係數對第一圖像神經網絡模型和第一口型神經網絡模型進行訓練;獲取用戶的語音文件,並將語音文件輸入第二口型神經網絡模型中得到口型表情係數;根據全臉表情係數和口型表情係數得到二維人像;合成二維人像和語音文件,得到二維人像視頻。本發明將第一人臉渲染圖像和模板視頻中的圖像進行融合,這樣就保留了原始圖像中難以通過圖像生成方式生成的細節部分。本發明通過訓練從特徵到圖像映射的模型來實現二維人像視頻的可控生成,簡單快捷,成本低。

本文源自:金融界

作者:情報員