稀宇科技推出萬億MoE模型abab 6.5

4月17日,稀宇科技MiniMax正式推出abab 6.5系列模型。abab 6.5系列包含兩個模型:abab 6.5和abab 6.5s。據介紹,abab 6.5包含萬億參數,支持200k tokens的上下文長度;abab 6.5s跟abab 6.5使用了同樣的訓練技術和數據,但是更高效,支持200k tokens的上下文長度,可以1秒內處理近3萬字的文本。在各類核心能力測試中,abab 6.5開始接近GPT-4、Claude-3、Gemini-1.5等大語言模型。