智譜首個開源端到端多模態模型上線
10月25日消息,華爾街見聞從智譜處獲悉,其上線了新模型GLM-4-Voice端到端情感語音模型。同時,GLM-4-Voice發佈即開源,這是智譜首個開源的端到端多模態模型。
據悉,GLM-4-Voice能夠理解情感,有情緒表達,可自助調節語速,支持多語言和方言,並且延時更低、可隨時打斷。
從今天開始,GLM-4-Voice會部署在清言app上。據瞭解,GLM-4-Voice模型之後將與清言的視頻通話能力合體。(華爾街見聞)
相關資訊
- ▣ 無問芯穹發佈首個端側全模態理解開源模型
- ▣ AI早知道|智譜AI推出首個免費多模態模型;OpenAI正式上線Sora
- ▣ AI早知道|國內首個端到端語音大模型Lingo;摩爾線程開源音頻理解大模型MooER摩耳
- ▣ 面壁智能開源業內首個端側大模型工具集 MobileCPM
- ▣ AI早知道|全球首個開源的多模態混合AI模型;智譜科技推出AI搜索工具
- ▣ 阿里雲通義開源首個多模態推理模型QVQ
- ▣ 精準學首個語音端到端大模型公佈
- ▣ 智譜開源清影CogVideoX模型
- ▣ Momenta智駕大模型,不僅僅是“端到端”
- ▣ 精準學:將公佈中國首個語音端到端大模型
- ▣ 小米汽車:自研全球首個可量產端到端大模型
- ▣ 智譜開源視頻生成模型CogVideoX
- ▣ 全球首個多模態世界模型Emu3來了!智源王仲遠:爲多模態大模型訓練範式指明新方向|鈦媒體AGI
- ▣ 阿里雲通義千問發佈業界首個開源多模態推理模型
- ▣ 手機上能跑的「GPT-4V」來啦!多圖、視頻理解首次上端!面壁小鋼炮開源史上最強端側多模態
- 智源發佈原生多模態世界模型Emu3
- 智源發佈原生多模態世界模型Emu3,無需擴散模型
- ▣ AI早知道|智源發佈多模態模型Emu3;阿里巴巴達摩院開源文檔處理模型
- ▣ 智源研究院驗證AGI新路線,發佈原生多模態世界模型
- ▣ 智己汽車發佈 IM AD 3.0 智駕,全球首批量產一段式端到端大模型
- 阿里雲通義開源首個多模態推理模型QVQ,視覺推理比肩OpenAI o1
- ▣ 何小鵬:端到端大模型會導致智駕的門檻提高
- ▣ AI大模型前瞻:多模態融合、上下文、雲端協同成趨勢|直擊2024GDC
- Waymo利用谷歌Gemini 開發端到端自動駕駛模型
- ▣ 階躍星辰推出國內首個千億參數端到端語音大模型“ Step-1o”
- ▣ 雷軍:小米智能駕駛搭載端到端大模型與視覺語言大模型,12月底開啓先鋒版推送
- ▣ 何小鵬:端到端+大模型可以真正實現智駕全球化
- ▣ 阿里雲通義開源首個多模態推理模型,OpenAI入局人形機器人 | 藍媒GPT
- ▣ 智譜AI與高通合作端側視覺大模型,OPPO收購大模型初創公司 | 藍媒GPT