ClawHub产线落地技能的识别指南
2026-06-07 3345072
2026-06-07 0
M3是唯一能复现ICLR 2025 Outstanding Paper的开源模型:需构建≤98.7万tokens的Markdown输入包,启用多模态与长程推理,按序解析图表、生成PyTorch代码、复现训练策略并校验数值,通过commit监控与四类干预信号确保全流程精准对齐。

你需要让AI模型在无人干预下,完整复现一篇ICLR 2025 Outstanding Paper Award获奖论文——它包含多页公式推导、6张带标注的实验曲线图、3个核心算法伪代码、原始数据集链接和12页附录实验日志。M3是目前唯一能同时处理这三类输入的开源模型:超长文本上下文(需塞入整篇论文+代码+日志)、原生多模态(必须准确识别图中坐标轴标签与曲线趋势)、前沿Coding能力(自动生成可运行PyTorch训练脚本并调参)。
下载ICLR 2025获奖论文PDF原文,用MiniMax最新推荐的PDF-OCR-MultiModal工具批量提取全部文字+图像,生成一个含127页文本、23张高分辨率图表PNG、4个LaTeX公式块的ZIP包。
将论文PDF、提取出的PNG图表、附录中的CSV实验日志、作者公开的GitHub仓库README.md合并为单个Markdown文件,总长度控制在【98.7万tokens以内】——超过此阈值将触发M3的自动截断机制,导致后半段公式无法被引用。
打开MiniMax Code Web界面,点击“新建Agent任务”,粘贴该Markdown全文,勾选“启用多模态解析”和“开启长程推理会话”两个开关。
在提示词首行写明:“请严格按以下顺序执行:①解析图2a中横轴单位与纵轴物理量;②复现Algorithm 1伪代码为可运行PyTorch模块;③用图3b所示学习率衰减策略训练模型;④输出与原论文Table 4完全一致的三组数值。”
方法一:使用API调用方式
在curl命令中加入--header "x-minimax-long-context: true",否则默认上下文窗口仅启用32K模式,图表识别会失效。
方法二:通过Token Plan控制台提交
上传ZIP包后,在“验证锚点”栏手动填入论文中Figure 4的峰值坐标值(0.82, 0.94),M3会在每轮生成后自动比对,偏离超±0.03即回退重试。
第一步:观察commit频率——若连续45分钟无新commit产生,说明M3陷入局部最优循环,此时必须人工中断并重置“当前任务状态”。
第二步:检查图表生成质量——当M3输出的Figure 5曲线出现锯齿状非平滑波动(原论文为光滑指数衰减),立即在对话框输入“请重新生成Figure 5,禁用torch.compile,改用torch.jit.script封装”,这是已知FP8精度损失导致的绘图异常。
第三步:核验数值结果——M3输出的Table 4第三列数值若为0.731 ± 0.012而非原文0.731 ± 0.008,说明随机种子未对齐,需补发指令:“set torch.manual_seed(42) and numpy.random.seed(42) before data loading”。
第四步:等待最终输出——当界面显示“✅ All 18 commits completed”且生成23张图表命名格式为fig2a_reproduce.png、table4_validation.json时,复现流程终止。