趣丸科技開源語音大模型MaskGCT
10月24日,趣丸科技宣佈與香港中文大學(深圳)聯合研發的語音大模型“MaskGCT”正式在Amphion系統中開源,面向全球用戶開放使用。區別於傳統TTS模型,該模型採用掩碼生成模型與語音表徵解耦編碼的技術範式,在聲音克隆、跨語種合成、語音控制等任務中性能表現突出。據介紹,MaskGCT在三個TTS基準數據集上都達到了SOTA效果。
相關資訊
- ▣ 國產AI音樂生成效果幾何?實測趣丸科技天譜樂大模型
- ▣ AI早知道|商湯科技發佈東風泰語大模型;Meta計劃開源 AI 模型Llama3 405B
- ▣ 廣州海珠打造最盈利大模型產業集聚高地,趣丸科技等大模型企業入駐
- ▣ 全球科技早參丨OpenAI發佈語音模型Voice Engine
- ▣ AI早知道|國內首個端到端語音大模型Lingo;摩爾線程開源音頻理解大模型MooER摩耳
- ▣ 盈趣科技:暫無自主研發AI大模型,開發相關AI應用
- ▣ 天津大學“伏羲傳語”多語言大模型正式發佈並開源,應對大模型多語言能力不足
- ▣ xAI宣佈開源大語言模型Grok-1並開放下載
- ▣ AI早知道|B 站開源輕量級 AI 語言模型;阿里通義Qwen2成最強開源大模型
- ▣ 科大訊飛星火語音大模型“星火極速超擬人交互”8月底開放
- ▣ 聯發科 推繁中大型語言模型
- ▣ AI早知道|騰訊推全球首個語音指揮FPS AI ;摩爾線程開源音頻理解大模型
- ▣ OpenAI開發者大會派禮包:大幅降低模型成本,AI語音加持App,小模型“蹭”大模型性能
- ▣ 全球科技早參丨全球首個芯片設計開源大模型誕生
- ▣ 商湯科技發佈新版日日新·商量大語言模型
- ▣ 摩爾線程正式開源音頻理解大模型MooER
- ▣ 通義千問開源視覺語言模型Qwen2-VL
- ▣ 奇富科技智能語音模型升級,川渝方言識別準確率提升超35%
- 直播預告 | 開源Talk:大語言模型與視覺語言模型越獄行爲及防禦機制的回顧與展望
- ▣ OpenAI推出語音克隆AI模型
- ▣ 數智早參|OpenAI官宣推出新的大語言模型GPT-4o;騰訊混元文生圖大模型開源
- OpenAI推模擬真人語音技術
- ▣ 精準學首個語音端到端大模型公佈
- ▣ 協鑫能科:除算力資源租賃,還聚焦“數字能源大模型”等垂直場景大模型訓練和開發
- DNF男槍手模型男大槍激光炮音效改科技震撼響聲
- ▣ 生數科技完成“多模態大模型”備案
- ▣ 《半導體》聯發科推一把 全球首款繁中AI語言生成模型開源釋出
- ▣ 新鮮早科技丨英偉達發佈全球最強AI芯片;xAI 宣佈開源大語言模型 Grok-1;侯毅正式卸任盒馬CEO
- ▣ 科技早報|OpenAI發佈最新語音模型;商務部迴應美升級芯片出口管制措施