MiniMax(稀宇科技)开源旗下大规模混合架构推理模型「MiniMax-M1」,号称「世界上第一个开源的大规模混合架构的推理模型」。模型信息方面,MiniMax-M1 参数大小为 456B,单 token 激活参数为 45.9B。其中最亮眼的是,M1 原生支持 100 万上下文的输入,跟闭源模型里面的 Google Gemini 2.5 Pro 一致,是 DeepSeek R1 的 8 倍。M1 采用 MoE 与「闪电注意力机制」双结合架构,从而在计算长的上下文输入以及深度推理的时候显著高效。测试结果上,M1 在软件工程、长上下文与工具使用等面向生产力的复杂场景中具备显著优势。地址
MiniMax 开源全球首个「大规模混合架构」推理模型
文章名称:《MiniMax 开源全球首个「大规模混合架构」推理模型》
文章链接:https://www.agidt.com/index.php/2025/06/19/minimax-%e5%bc%80%e6%ba%90%e5%85%a8%e7%90%83%e9%a6%96%e4%b8%aa%e3%80%8c%e5%a4%a7%e8%a7%84%e6%a8%a1%e6%b7%b7%e5%90%88%e6%9e%b6%e6%9e%84%e3%80%8d%e6%8e%a8%e7%90%86%e6%a8%a1%e5%9e%8b/
本站资源仅供个人学习交流,请于下载后24小时内删除,不允许用于商业用途,否则法律问题自行承担。
最新评论
您好,这是一条评论。若需要审核、编辑或删除评论,请访问仪表盘的评论界面。评论者头像来自 Gravatar。