阿里雲發佈開源模型Qwen2
北京商報訊(記者 魏蔚)6月7日,阿里雲發佈開源模型Qwen2-72B。通義千問團隊披露,Qwen2系列包含5個尺寸的預訓練和指令微調模型,Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B,其中Qwen2-57B-A14B爲混合專家模型(MoE)。Qwen2所有尺寸模型都使用了GQA(分組查詢注意力)機制。在中英文之外,模型訓練數據中增加了27種語言相關的高質量數據。Qwen2還增大了上下文長度支持,Qwen2-72B-Instruct能夠完美處理128k上下文長度內的信息抽取任務。
相關資訊
- ▣ AI早知道|阿里雲發佈全球最強開源模型Qwen2;快手發佈可靈大模型
- ▣ 阿里通義千問Qwen2大模型發佈並同步開源
- ▣ 阿里發佈開源多模態模型Qwen2-VL,多項性能超越GPT-4o
- ▣ AI早知道|B 站開源輕量級 AI 語言模型;阿里通義Qwen2成最強開源大模型
- ▣ 阿里雲通義千問發佈業界首個開源多模態推理模型
- ▣ 阿里雲開源視頻基礎模型
- ▣ 阿里國際發佈最新開源多模態模型Ovis
- ▣ 阿里雲發佈通義千問2.5,開源通義千問1100億參數模型
- ▣ 阿里雲通義開源視覺模型Qwen2.5-VL
- ▣ AI早知道|阿里雲開源視頻生成大模型萬相2.1;DeepSeek發佈DeepGEMM
- ▣ AI早知道|阿里通義將發佈視頻大模型;元象發佈MoE開源大模型
- ▣ 阿里宣佈開源推理模型和視頻生成模型
- ▣ 通義千問開源視覺語言模型Qwen2-VL
- ▣ 阿里雲正式發佈通義千問2.5,開源通義千問1100億參數模型
- ▣ 阿里發佈並開源推理模型通義千問QwQ-32B
- ▣ 阿里雲通義開源首個多模態推理模型QVQ
- ▣ 科技早報 | DeepSeek據悉力求提前發佈R2模型;阿里雲視頻生成大模型萬相2.1開源
- ▣ 阿里雲通義千問推出開源Qwen2.5-1M模型
- ▣ 阿里雲通義開源視覺理解模型Qwen2.5-VL
- ▣ AI行業觀察:DeepSeek開源模型破圈;阿里雲加速生態佈局
- ▣ AI早知道|智源發佈多模態模型Emu3;阿里巴巴達摩院開源文檔處理模型
- ▣ 數智早參|蘋果推出開源大模型OpenELM;阿里雲宣佈EMO模型上線通義APP
- ▣ 阿里雲魔搭社區首發階躍星辰最新開源兩款多模態模型,已上架超4萬個開源模型
- ▣ AI早知道|騰訊發佈最大規模開源MoE模型;阿里巴巴達摩院發佈八觀氣象大模型
- ▣ 阿里雲開源從模型到工具的AI全棧技術
- ▣ 幻方量化旗下DeepSeek發佈開源模型,超越阿里Qwen、Meta Llama
- ▣ 阿里雲通義千問旗艦版模型Qwen2.5-Max發佈
- ▣ 阿里雲發佈通義千問旗艦版模型Qwen2.5-Max
- ▣ AI早知道|阿里雲發佈音頻模型;OpenAI發佈新技術PVG