我们已开源 MiniMax M3

2026-06-16 0

我们在上周五开源了 MiniMax M3 模型权重，同步发布了 MSA（MiniMax Sparse Attention）技术论文。MSA 的架构设计让 M3 在长上下文下的计算成本大幅降低，论文中完整披露了架构与工程实现细节

。

M3 是 MiniMax 的原生多模态旗舰模型，总参数 428B，激活参数 23B。

M3 是第一个从 Step 0 开始做多模态混合训练的开源模型。

训练阶段，我们使用了大量文本、图像和其他模态交错排列的数据，让不同模态的语义空间从预训练阶段就深度融合。这种设计使模型在预训练阶段就建立起统一的跨模态语义空间，也为后续多模态理解、生成和复杂任务融合提供了底层基础。

发布两周以来，M3 在 Artificial Analysis 综合智能指数排行榜上取得了全球开源模型的最高排名，也收到了来自开发者、研究者和行业用户的大量实测反馈。

Vercel CEO Guillermo Rauch 给予 M3 积极评价

YC Founder Jinjing Liang 分享 M3 实测体验

Happycapy Co-founder Victoria Wu 实测评价

Artificial Analysis 综合智能指数开源模型第一

GDPval-AA 排行榜开源模型第一

Code Arena WebDev 榜单

跻身帕累托最优模型序列，提供最高性价比

Vals.AI 榜单国产模型第一名

在金融与 Coding 任务上表现亮眼

（上下滑动浏览）

针对访问量激增带来的体验问题，我们在持续优化，

目前 M3 的输出速度已从上线时的约 30
TPS
提升至约 80 TPS，接下来
还会
继续提速 30-40%，
模型响应将更加流畅
。

Token Plan 后台也上线了调用量看板，用户可以直观查看当前用量及剩余额度，方便大家合理规划用量与成本。

我们听到了大家对模型的期待。在反馈中，最集中的诉求就是模型服务的稳定性、真实负载下持续可用、以及以合理成本规模化部署的可行性——

随着大模型被广泛应用于生产级任务，许多企业与个人的工作流被 Agent 接管，AI 渗透率快速提升。同时其中有大量的长程复杂任务，有的任务 Agent 能够连续运行数小时甚至数天，Token 消耗随之急剧增长。相应地，越来越多团队开始在模型能力、使用成本与稳定性之间权衡，力求找到最契合自身业务场景的平衡点。

M3 模型在研发初期便确立了方向：

在确保模型能力在复杂推理、长文本、多模态等场景中足够智能的前提下，真正实现对开发者、用户和企业客户的普惠。

在后续的模型迭代中，我们将持续坚守这一初心，更加开放、加速进步。

开源地址：

Github:

github.com/MiniMax-AI/MiniMax-M3

Hugging Face:

huggingface.co/MiniMaxAI/MiniMax-M3

MSA 论文：

arxiv.org/abs/2606.13392

Intelligence with Everyone.

喜欢(0)

腾讯投了林俊旸1.4亿！前千问负责人创业：估值135亿

把 18 亿颗星星画在一张图上:能还原我们拍到的银河吗？