☰

智譜首個開源端到端多模態模型上線

10月25日消息，華爾街見聞從智譜處獲悉，其上線了新模型GLM-4-Voice端到端情感語音模型。同時，GLM-4-Voice發佈即開源，這是智譜首個開源的端到端多模態模型。

據悉，GLM-4-Voice能夠理解情感，有情緒表達，可自助調節語速，支持多語言和方言，並且延時更低、可隨時打斷。

從今天開始，GLM-4-Voice會部署在清言app上。據瞭解，GLM-4-Voice模型之後將與清言的視頻通話能力合體。（華爾街見聞）

相關資訊

▣ 無問芯穹發佈首個端側全模態理解開源模型
▣ AI早知道｜智譜AI推出首個免費多模態模型；OpenAI正式上線Sora
▣ AI早知道｜國內首個端到端語音大模型Lingo；摩爾線程開源音頻理解大模型MooER摩耳
▣ 面壁智能開源業內首個端側大模型工具集 MobileCPM
▣ AI早知道｜全球首個開源的多模態混合AI模型；智譜科技推出AI搜索工具
▣ 阿里巴巴發佈新一代端到端多模態旗艦模型Qwen2.5-Omni
▣ AI早知道｜ChatGPT AI搜索免費開放；全球首個端側全模態理解開源AI模型
▣ 精準學首個語音端到端大模型公佈
▣ 阿里雲通義開源首個多模態推理模型QVQ
▣ 智己汽車端到端2.0智駕大模型即將上車
▣ AI早知道｜全球首個多模態配樂大模型；智譜正式發佈深度推理模型
▣ 斑馬智行發佈高通8397端側多模態大模型方案
▣ 智譜開源清影CogVideoX模型
▣ Momenta智駕大模型，不僅僅是“端到端”
▣ 百川智能開源全模態模型Omni-1.5上線，稱多項能力超越GPT-4o mini
▣ 精準學：將公佈中國首個語音端到端大模型
▣ 智譜發佈首個生成漢字的開源文生圖模型CogView4
▣ 阿里雲魔搭社區首發階躍星辰最新開源兩款多模態模型，已上架超4萬個開源模型
▣ 智譜發佈GLM-4.5開源模型：開源模型性能達SOTA水平
▣ 小米汽車：自研全球首個可量產端到端大模型
▣ AI早知道｜谷歌開源多模態模型Gemma-3；字節上線AI音效生成模型
▣ 智譜開源視頻生成模型CogVideoX
▣ 全球首個多模態世界模型Emu3來了！智源王仲遠：爲多模態大模型訓練範式指明新方向｜鈦媒體AGI
▣ 手機上能跑的「GPT-4V」來啦！多圖、視頻理解首次上端！面壁小鋼炮開源史上最強端側多模態
▣ 阿里雲通義千問發佈業界首個開源多模態推理模型
▣ 智譜發佈首個支持生成漢字的開源文生圖模型CogView4
▣ 階躍星辰首次開源Step系列多模態大模型
▣ 面壁智能開源8B參數的多模態模型MiniCPM-V 4.5
智源發佈原生多模態世界模型Emu3

DMCA | PRIVACY | s@bg3.co