MiniMax M2.7 自进化智能体模型

当Anthropic将Claude Mythos锁在门后时，上海的一家实验室却做了相反的事。MiniMax今天开源了M2.7的权重——而这个模型带来了一项能力，它从根本上改变了我们对AI开发的思考方式。

M2.7，据MiniMax称，是业界首个"自进化"智能体模型。这个主张需要仔细拆解，因为它听起来既更谦逊又更重要。

1、"自进化"实际意味着什么

首先驱散科幻版本。M2.7并没有从零开始编写自己的架构或设计自己的奖励函数。那种级别的递归自我改进仍然是理论性的。

M2.7在其训练周期中所做的事情确实是新颖的。MiniMax在训练过程本身周围构建了一个自主智能体工具，而M2.7——以早期形式——作为该工具内的智能体运行。通过100多轮自主优化，模型承担了人类研究人员通常手动处理的大部分常规ML工程工作：

监控训练管道，并在故障发生时自主解决
构建和精炼自己的技能——存储在外部记忆支架中的工具和工作流规则
自我优化其推理支架——调整其自己的采样参数和工作流指南以改善任务性能，无需梯度更新

报告的结果：比基线提高30%的性能，在训练循环中直接人工干预比以往任何MiniMax模型都少。MiniMax估计模型在其自身开发期间处理了30-50%的常规ML工程任务。

这不是AGI。但它是AI系统能够参与自身改进循环的有意义一步——它打开了一条直接路径来压缩模型代之间的时间和计算成本。

2、架构和规格

M2.7基于 稀疏专家混合（MoE）架构构建，使其效率远超参数数量所暗示的：

总参数：2300亿
每token活跃参数：100亿（推理时仅激活约4.3%的总参数）
专家：256个本地专家，每token激活8个
层数：62
上下文长度：204,800个token

该架构使用多头因果自注意力与旋转位置嵌入（RoPE）和Query-Key RMSNorm——长上下文推理的稳定标准选择。稀疏激活模式使推理成本与理论大小的一小部分模型竞争。

3、基准性能

MiniMax将M2.7定位为软件工程和智能体工作流的前沿级模型：

基准测试	M2.7得分	背景
SWE-Pro	56.22%	接近GPT-5.3-Codex水平
Terminal Bench 2	57.0%	自主终端任务完成
VIBE-Pro	55.6%	仓库级代码生成
MLE Bench Lite	66.6%平均奖牌率	ML工程自动化
GDPval-AA	1495 ELO	发布时开源权重模型中最高

SWE-Pro和Terminal Bench 2得分将M2.7置于与Claude Mythos在软件工程任务上相同的竞争层级——这使得开源权重发布更加重要。相当的能力，公开访问。

4、开源星号

这里的框架需要精确。MiniMax称M2.7为"开源"，权重确实在Hugging Face上公开可用。但许可证带有有意义的限制：商业使用需要MiniMax的事先书面授权。

这使M2.7与其他使用限制性许可证的"开源权重"发布处于相同的有争议类别——既不是OSI定义中的完全开源，也不是完全封闭。对于个人研究人员、学者和构建非商业应用的开发者，M2.7是真正可访问和免费的。对于希望在其上构建产品的公司，商业限制创建了一个合规层，有效地使MiniMax成为生产部署的守门人。

这一区别很重要。HN和其他地方的社区已经标记了许可证差距。你是否认为M2.7"真正开放"取决于你的用例。

5、重要的对比

本周两个最大的AI模型故事形成了一对醒目的对比。Anthropic构建了Claude Mythos，认为它太危险，并将访问限制在50个精英组织。MiniMax构建了M2.7——一个在软件工程基准上表现相当的模型——并发布了权重。

这一对比说明了关于前沿AI应如何分发的分歧哲学。限制的理由：某些能力太危险，无限制访问会创造生存风险。开放的理由：限制强大模型会不对称地集中能力，使大多数组织防御性失明，而精英机构获得进攻性优势。

M2.7的自进化训练方法使这一对比更加尖锐。如果模型能够越来越多地参与自身开发，能够运行这些管道的实验室与不能运行的实验室之间的能力差距将随时间压缩——但前提是产生的模型是可访问的。被锁定的自我改进模型会加速能力集中。开源权重发布，即使不完美，更广泛地分发该方法的益处。

6、MMX-CLI：实用智能体集成

值得注意的是，与M2.7权重发布一起，MiniMax在4月9-10日发布了MMX-CLI工具。这个命令行界面让AI智能体原生访问MiniMax的完整生成堆栈——文本、图像、视频、语音、音乐、视觉和搜索——直接从终端或在智能体环境如Cursor和OpenCode中。

对于开发者，这是实用的入口。你不需要为每个模态建立单独的API集成。MMX-CLI将能力表面整合为智能体工作流可以直接调用的单一界面。这是将MiniMax定位为多模态智能体基础设施层而非仅仅是模型提供商的有意义一步。

NVIDIA、TogetherAI、Fireworks和Ollama都在开源权重发布的第一天集成了M2.7——表明该模型在推理生态系统中落地良好。

7、对构建者意味着什么

三个实际影响：

如果你是研究人员或独立开发者： M2.7值得认真评估。SWE-Pro和Terminal Bench 2得分表明它是智能体编码工作流的真正顶级模型，权重今天可通过Hugging Face和Ollama访问。

如果你正在构建产品： 在将M2.7作为基础提交之前，与MiniMax澄清商业授权路径。许可证为生产部署创造了你需要在技术债务之上构建之前解决的不确定性。

如果你关心AI开发方法： 注意自进化训练主张。让模型参与自动化自身训练管道的能力不是营销角度——它是AI系统工程结构如何构建的真正转变。掌握这一反馈循环的实验室将显著压缩模型代之间的时间。

8、个人看法

自进化的框架将吸引怀疑，其中一些是合理的。"自我改进AI"是一个被足够滥用的短语，以至于它读起来像营销，除非被证明否则。MiniMax的版本对范围是诚实的：不是模型重写自己的权重，而是模型作为其自身训练基础设施内的智能体运行。

那个限定版本仍然有趣。如果模型能够可靠地自动化培训自身所涉及的30-50%的常规工作，每代的人工劳动成本显著下降。在几个模型迭代中递归应用，那是复合的。

开源权重发布，即使有商业限制，也是正确的决定。更多开发者能够访问前沿级模型推动更多实验、更多反馈，以及对基准测试反映真实世界能力的更多压力。这对生态系统有好处。

与Mythos的锁定相比很难忽视。两个模型。相当的软件工程能力。一个对50个组织可访问。一个在Hugging Face上。分发哲学的分歧是与模型本身同样重要的故事。

原文链接：MiniMax M2.7 自进化智能体模型 - 汇智网

展开阅读全文

更新时间：2026-06-26

标签：科技模型智能权重能力工作流软件工程递归基准开发者参数

1 2 3 4 5

MiniMax M2.7 自进化智能体模型

1、"自进化"实际意味着什么

2、架构和规格

3、基准性能

4、开源星号

5、重要的对比

6、MMX-CLI：实用智能体集成

7、对构建者意味着什么

8、个人看法

坐拥巨额财富却一度重度抑郁！归来教物理的张朝阳，到底图什么？

霍尔木兹海峡被封后，越南选边站队了，新总理当场立下“军令状”

陈丽华辞世：巨额遗产分配合理，“唐僧”迟重瑞可按理想方式养老

曝王石被抓，爆料者透露原因，田朴珺急眼了，王石回应：交给法律

A股：尾盘的突然爆拉，是主力出货还是洗盘？炒股必看！

四川开往东北三省三趟绿皮火车：K998，K546，K386

中国再次撞大运！石油危机席卷全球，这一次，时代的答案是新能源

郑恺晒女儿全英文对话 5岁口语惊艳全网！沉浸式家庭教育才是顶配

想明白了！马筱梅携子回京，汪小菲态度大变，张兰只说了1句话

她21岁拍三级片，30岁被出轨，38岁嫁郑伊健，50岁活成人生赢家

身家亿万亲爹吸血多年，现37岁无人问津的释小龙，到底做错了啥

陈坤儿子陈尊佑：我妈不是保姆，也不是周迅，真相15年前就公布了

宋喆现状：隐居县城，双眼无神生活落魄，前妻杨慧早已经过新生活

三分3中3吹起反攻号角！后场老将是森林狼战胜火箭的关键人物？

实力远大于名气的五大NBA现役球员

中国又一技术震惊世界！国外希望能和中国合作，这项黑科技

西班牙首相桑切斯访华参观小米科技园雷军亲自接待现

智能周报｜瞄准1%用户赚钱，Anthropic收入超越OpenAI

38 岁麦基驰援首钢，护框能力引期待，高薪签约恐挤本土空

当AI看穿银行系统漏洞：Anthropic最强模型让英国监管者

2026常州市人工智能终端潮品发布会举行

截至2026年04月13日“AI”最热话题：具身智能突破与金融

上海一家科技公司获得数亿元融资，累计融资额近20亿元！

外贸培训企业说｜青岛天智鹰科技：深耕无人机产业培训助

黑芝麻智能单记章：今年出货将超千万颗！华山A2000家族可