☰

通義千問開源數學模型Qwen2-Math 測評得分超GPT-4o

《科創板日報》9日訊，阿里通義團隊開源新一代數學模型Qwen2-Math，包含1.5B、7B、72B三個參數的基礎模型和指令微調模型。Qwen2-Math基於通義千問開源大語言模型Qwen2研發，旗艦模型 Qwen2-Math-72B-Instruct在權威測評集MATH上的得分超越GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro、Llama-3.1-405B等，以84%的準確率處理了代數、幾何、計數與概率、數論等多種數學問題。（記者黃心怡）

相關資訊

▣ 阿里發佈Qwen2-Math：數學推理全球第一，超越GPT-4o和Claude-3.5
▣ 通義千問開源視覺語言模型Qwen2-VL
▣ 阿里發佈開源多模態模型Qwen2-VL，多項性能超越GPT-4o
▣ 阿里通義千問Qwen2大模型發佈並同步開源
▣ 通義千問升級旗艦模型Qwen-Max，性能接近GPT-4o
▣ 智源最新模型評測：百度文心大模型4.0登頂閉源榜超GPT-4o等
▣ 通義千問開源千億級參數模型
▣ 通義千問開源320億參數模型
▣ 阿里雲發佈通義千問2.5，開源通義千問1100億參數模型
▣ 通義千問發佈首個千億級參數開源模型
▣ 阿里雲正式發佈通義千問2.5，開源通義千問1100億參數模型
▣ Nvidia的新開源AI模型在基準測試中擊敗了GPT-4o
▣ 微軟開源最強小模型Phi-4，超GPT-4o、可商用
▣ 阿里通義千問開源首個MoE模型
▣ 數智早參｜快手可靈AI全面開放內測；Meta最強大模型超越GPT-4o
▣ 開源視覺大模型黑馬Molmo AI 來襲！超越GPT-4o 和 Claude 3.5
▣ AI早知道｜B 站開源輕量級 AI 語言模型；阿里通義Qwen2成最強開源大模型
▣ 剛剛，開源大模型的新王誕生了：超越GPT-4o，模型還能自動糾錯
▣ Anthropic大模型測評首超GPT-4
▣ 阿里雲通義開源過程獎勵PRM模型，7B尺寸比GPT-4o更能發現推理錯誤
▣ 阿里雲發佈開源模型Qwen2
▣ 通義千問開源模型下載量突破2000萬
▣ 阿里雲通義千問推出開源Qwen2.5-1M模型
▣ 百川智能開源全模態模型Omni-1.5上線，稱多項能力超越GPT-4o mini
▣ 黃仁勳評價DeepSeek和通義千問：都是世界頂尖開源大模型
▣ 賽道Hyper | 阿里開源通義千問3向量模型
▣ 阿里巴巴開源新一代通義千問模型Qwen3
▣ 阿里開源通義千問AI編程大模型Qwen3-Coder
▣ 通義千問開源Qwen2.5開源模型，累計下載量突破4000萬

DMCA | PRIVACY | s@bg3.co