0.6B VLM重塑AI修图推理流程:支持手机端侧部署 vivo+浙大出品
2026-06-16 3357450
2026-06-10 0
用Hermes Agent, OpenClaw或者Claude Code等写代码的Agent朋友,最近应该都感觉到了——AI编程套餐这半年洗牌洗得飞快。腾讯云把Coding Plan全线下架换成了Token Plan,MiniMax从按次改成按Token池惹来一堆投诉,字节又搞了个"业界首个Agent套餐包"。
作为每天开Hermes干活的人,这几个平台我都摸过一遍,今天不讲虚的,直接算账。
先说结论:目前适配Agent用户比较到位的,是字节方舟的Agent Plan。 不是我偏心,往下看数据。
先把各家按请求次数算钱的套餐摊开看。统一折算成"每100次有效请求"的成本,同时标注了每家的可用模型——模型多寡直接影响你实际能干什么活。
| 平台套餐 | 月费 | 月可用量 | 每100次成本 | 可用模型 | 特别限制 |
|---|---|---|---|---|---|
| 字节 Agent Small | ¥40 | 20,000 AFP | ¥0.20 | Doubao-Seed全系 + GLM-5.1 + Kimi-K2.6,含Seeddance/Seedream多模态 | 公测每日限量 |
| 字节 Agent Medium | ¥200 | 100,000 AFP | ¥0.20 | 同上 | 公测每日限量 |
| 字节 Coding Lite | ¥40 | 18,000次 | ¥0.22 | Doubao-Seed-2.0-Code + DeepSeek-V4 + GLM-5.1 + Kimi-K2.6 + MiniMax-M2.7,Auto智能调度 | 额度仅限编程工具 |
| 字节 Coding Pro | ¥200 | 90,000次 | ¥0.22 | 同上 | 额度仅限编程工具 |
| 阿里 Coding Lite | ¥40 | 18,000次 | ¥0.22 | Qwen3.5-Plus、Qwen3-Max、Qwen3-Coder-Plus、Kimi-K2.5、GLM-5、MiniMax-M2.5 | ️ 已停售 |
| 阿里 Coding Pro | ¥200 | 90,000次 | ¥0.22 | 同上,共7款模型 | ️ 每日限量抢购 |
| 智谱 GLM Lite | ¥49 | ~6,000次等效 | ¥0.82 | 仅GLM-4.7/4.6 | 纯自研,无三方模型 |
| 智谱 GLM Pro | ¥149 | ~30,000次等效 | ¥0.50 | GLM-5 + GLM-4.7/4.6,GLM-5为355B MoE旗舰 | 高峰期×3倍消耗 |
| 智谱 GLM Max | ¥469 | ~120,000次等效 | ¥0.39 | GLM-5 + GLM-4.7/4.6全系 | 高峰期×3倍消耗 |
注:AFP 是火山引擎 Agent Plan 专门创造的计量单位,全称是Agent Fuel Points(Agent 燃料值),本质上就是一种 Credits(积分)
从模型维度看,差异比较明显:
另一类是MiniMax和腾讯云的Token池模式——固定的Token池子用完即停,不限请求次数。适合长上下文场景。
| 平台套餐 | 月费 | 月Token额度 | 每百万Token成本 | 可用模型 | 使用限制 |
|---|---|---|---|---|---|
| MiniMax Plus | ¥49 | ~6亿 | ¥0.082 | M3(旗舰) + M2.7/M2.5 + 图像/语音(Speech 2.8)/音乐/视频(Hailuo 2.3)全系,原生多模态 | 工作日15:00-17:30动态限流 |
| MiniMax Max | ¥119 | ~18亿 | ¥0.066 | 同上,全部模型可用 | 工作日15:00-17:30动态限流 |
| MiniMax Ultra | ¥469 | ~55亿 | ¥0.085 | 同上,全模态全模型 | 工作日15:00-17:30动态限流 |
| 腾讯云 Hy Lite | ¥28 | 3,500万 | ¥0.80 | 仅混元Hy3 preview一款 | 模型单一 |
| 腾讯云 Hy Pro | ¥238 | 3.2亿 | ¥0.74 | 仅混元Hy3 preview一款 | 模型单一 |
| 腾讯云 通用 Lite | ¥39 | 3,500万 | ¥1.11 | 混元Hy3 + GLM-5 + MiniMax-M2.5 + Kimi-K2.5等多款 | Token额度偏少 |
| 腾讯云 通用 Pro | ¥299 | 3.2亿 | ¥0.93 | 同上,支持多模型自由切换 | Token额度偏少 |
模型维度的几个关键发现:
对于Agent用户来说,模型多样性不只是"选择多"的问题,而是直接影响工作流效率:
场景A:日常开发,偶尔用Hermes写脚本、查文档
推荐:字节 Agent Small(¥40/月,¥0.20/100 AFP) 备选:字节 Coding Lite(¥40/月,首月¥9.9体验)
理由:同价位下Agent Plan模型更丰富(Seed全系+GLM-5.1+Kimi-K2.6),自带联网搜索和Auto智能调度。备选Coding Lite多了DeepSeek-V4和MiniMax-M2.7,但少了多模态模型 。
场景B:高强度Agent工作流,同时跑2-3个任务
推荐:字节 Agent Medium(¥200/月,¥0.20/100 AFP) 备选:MiniMax Token Max(¥119/月,¥0.066/百万token)
理由:Agent Medium有100,000 AFP月额度,5小时限额10,000 AFP对多Agent并发足够,模型涵盖Seed全系+三方模型。MiniMax月费更低、单位成本也低,M3全模态+1M上下文在长对话和图片理解场景有额外优势 。
场景C:超大代码库、多轮长对话
推荐:MiniMax Token Max(¥119/月)
理由:1M上下文 + ¥0.066/百万token的性价比,长文档处理不会被截断。全模态模型覆盖图像/语音/视频,同一个token池无需切换。注意工作日15:00-17:30有动态限流 。
场景D:团队多人使用Hermes
推荐:阿里云Token Plan团队版 标准坐席(¥198/人/月)
理由:Credits统一管理,RAM子账号独立配额,数据安全承诺不用于训练。支持千问、GLM、MiniMax、DeepSeek等多款模型的团队调度 。服务地域目前仅限华北2(北京)。
场景E:预算极有限,先试试水
推荐:腾讯云Hy Token Lite(¥28/月) 备选:字节Coding Lite首月(¥9.9,体验一个月)
理由:腾讯云入门价确实低,但仅混元Hy3 preview一款模型——试水够用,长期用模型单一会有局限 。
如果你对订阅制感到疲惫,或者对网络隐私有要求,还有一个方案——通过仙踪·爱马仕助手(Hermes Assistant)在Mac上部署本地模型。
它内置了oMLX引擎,适配Apple芯片(M系列),可以在你的Mac上直接跑大模型。8个预置模型中,Qwen3.6-35B(256K上下文)做编码、Gemma4 26B做逻辑推理,Gemma4 12B做日常图文处理, 日常办公和轻量开发的token需求基本能覆盖。
优势是零网络延迟、数据不出本地、没有月费账单。缺点是需要占用本地算力和存储空间。
对于不想被各种套餐规则折腾的朋友,这是一个值得了解的Plan C。
一句话总结:Hermes/OpenClaw用户优先看字节Agent Plan(¥40/月起,¥0.20/100 AFP,模型丰富+Auto调度),长上下文重度场景考虑MiniMax Token Max(¥119/月,¥0.066/百万token,全模态覆盖),想彻底摆脱月费的探索本地模型部署。
数据来源:各平台官方定价页面及公开信息,截至2026年6月。价格可能随时变动。
