MiniMax 开源全球首个「大规模混合架构」推理模型
MiniMax(稀宇科技)开源旗下大规模混合架构推理模型「MiniMax-M1」,号称「世界上第一个开源的大规模混合架构的推理模型」。模型信息方面,MiniMax-M1 参数大小为 456B,单 token 激活参数为 45.9B。其中最亮眼的是,M1 原生支持 100 万上下文的输入,跟闭源模型里面的 Google Gemini 2.5 Pro 一致,是 DeepSeek R1 的 8 倍。M1 采用 MoE 与「闪电注意力机制」双结合架构,从而在计算长的上下文输入以及深度推理的时候显著高效。测试结果上,M1 在软件工程、长上下文与工具使用等面向生产力的复杂场景中具备显著优势。地址

艾智迹 AGIDT
