深圳市貝鉑智能科技申請智能語義理解及校準的生成式語音識別方法以及系統專利,使得最終生成的文本結果更加準確、完整
金融界2024年12月21日消息,國家知識產權局信息顯示,深圳市貝鉑智能科技有限公司申請一項名爲“智能語義理解及校準的生成式語音識別方法以及系統”的專利,公開號 CN 119152841 A,申請日期爲2024年11月。
專利摘要顯示,本發明提供了一種智能語義理解及校準的生成式語音識別方法以及系統,包括:對通話過程中的語音數據進行特徵提取,得到關鍵語音特徵;將關鍵語音特徵輸入到基於長短期記憶網絡的深度學習模型進行語義理解,得到初步語義結果;獲取所述通話過程的通話場景,在所述通話場景關聯的數據庫中,分析所述初步語義結果關聯的多維度語義,得到語義關聯矩陣;根據所述語義關聯矩陣對所述初步語義結果進行自適應校準,得到校準語義結果;基於生成對抗網絡,對所述校準語義結果進行文本生成處理,得到語音識別文本結果。在本發明中,使得最終生成的文本結果更加準確、完整。
本文源自:金融界
作者:情報員