Fenno + CC Switch:一个 API Key 搞定 Claude Codex 等全套 AI 编程工具
2026-06-18 3359768
2026-06-18 0
未来有点糊
2026-06-17 · 【创造现场】· #AI工具地图
上周做了个AI物种鉴定,结果没人理我。
后来想了想,可能有点太不食人间烟火了。
什么"AI星球""松鼠收藏夹"……这些词儿,我自己写得挺爽,但估计大多数人看完就一个字:啥?
直到前几天,一个同事突然问我:
"我想做张海报,用DeepSeek行吗?"
我愣了一下,说:"DeepSeek没有多模态,它连图都生不出来,怎么做海报?"
同事也愣了:"啊?那我用豆包?"
我说:"豆包可以生图,但如果你海报上字特别多,它很容易糊,字一多就乱码。"
同事懵了:"那到底用啥啊?"
那一刻我突然意识到——这才是真问题。
大家不是不想用AI,是根本不知道做这件事该用哪个AI。
就像你明明想炒个番茄炒蛋,结果进了五金店,手里攥着把扳手。
就拿"做海报"来说,这里面门道多了:
| 你想做啥 | 该用谁 | 不该用谁 | 为啥 |
|---|---|---|---|
| 文字超多的海报 | |||
| Kimi(生成HTML) | |||
| 豆包/可灵 | |||
| 多模态模型字一多就糊,HTML海报文字是矢量,放大也不糊 | |||
| 精美插画海报 | |||
| 即梦、Midjourney | |||
| DeepSeek | |||
| 它们没有图模型,根本出不来图 | |||
| 带产品图的海报 | |||
| 可灵、Liblib | |||
| 纯文本模型 | |||
| 需要理解产品图+排版 | |||
| 先写文案再出图 | |||
| DeepSeek写文案 → 即梦出图 | |||
| 一个工具硬扛 | |||
| 专业的事分给专业的工具 | |||
你看,做海报这一个事儿,就分了4种情况,对应4种工具组合。
这还只是"做海报"。那做视频呢?写文案呢?整理会议纪要呢?
每个场景,工具选择都不一样。
但问题是:以前从来没有人系统地告诉你,做这件事到底该用谁。
这里有一个特别大的信息差。
现在网上有很多给AI打分的,比如国外有个LMSYS Arena,国内有各种大模型排行榜。但你看完会发现——它们评的根本不是一回事。
| 评的是什么 | 举个例子 | 对你有用吗 |
|---|---|---|
| 模型评测 | ||
| "GPT-5.5在数学考试里得了90分" | ||
| 没用 | ||
| 技术评测 | ||
| "这个Agent调用工具的成功率是87%" | ||
| 没用 | ||
| 产品目录 | ||
| "这是一个AI海报工具,免费,好用" | ||
| ️ 半有用 | ||
| 你真正需要的 | ||
| "做带文字的海报,这5个工具我实测了10次,这个最靠谱" | ||
| 这才是你要的 |
模型是发动机,Agent是整车。
现在所有评测都在测"发动机马力多大",但没人告诉你"这辆车开起来舒不舒服、费不费油、后备箱够不够大"。
你买车的时候,你会关心发动机压缩比吗?你不会。你关心的是坐进去舒不舒服、开起来顺不顺、保养贵不贵。
AI工具也是一样。
现在的技术评测报告里全是这些词:
"该模型在SWE-Bench Verified上达到87.6%的pass rate,在OSWorld-Verified桌面操作任务中成功率72.5%,幻觉率低于2%……"
你看得懂吗?我看都费劲。
而且这些评测测的是:写代码能不能跑通、操作电脑能不能点对人、回答问题会不会胡说。
**它们不测的是:**做海报字会不会乱码、生成视频人物会不会闪、小白能不能5分钟上手、免费额度够不够用一天。
也就是说,现在所有权威评测,评的都是"发动机",没人评"开车体验"。
简单来说,这张地图就做一件事:
你不需要懂什么叫"大模型""多模态""Transformer",你只需要告诉我"我要做海报",我告诉你"用谁最靠谱"。
我们不看参数,不看论文,不聊技术名词。我们就做一件事:用。
按你的生活场景分类,而不是按技术分类。
不讲什么"大模型""多模态"这些黑话。我们就问一个事儿:
你现在要干啥?
然后告诉你:这件事,用谁最靠谱、最便宜、最不容易翻车。
目前地图覆盖了7大生活场景·91种细分用途:
| 场景 | 你可能遇到的事 | 地图帮你解决 |
|---|---|---|
| 学习求知 | ||
| 读论文、查资料、学新东西 | ||
| 哪个AI读长文档最准?哪个不会胡说? | ||
| 工作提效 | ||
| 写周报、做PPT、整理会议纪要 | ||
| 哪个能一键生成?哪个格式最规范? | ||
| 娱乐创作 | ||
| 做海报、剪视频、写小说 | ||
| 做海报用谁?剪视频用谁?写小说用谁? | ||
| 消费购物 | ||
| 买电脑、选课、看病挂号 | ||
| 哪个AI比价最准?哪个不会推荐广告? | ||
| 健康生活 | ||
| 看体检报告、制定健身计划 | ||
| 哪个医学知识靠谱?哪个不会瞎开药方? | ||
| 社交沟通 | ||
| 写朋友圈、回邮件、准备礼物 | ||
| 哪个语气最自然?哪个最懂人情世故? | ||
| 赚钱副业 | ||
| 做副业、开网店、接私活 | ||
| 哪个能帮你写带货文案?哪个能自动做客服? | ||
每个场景下面,再细分到具体用途。
比如"娱乐创作→作图→带文字海报",我们会直接告诉你:
首推:即梦(文字准、排版好、免费额度够用)
备选:可灵(功能多,但上手稍慢)
进阶:Midjourney(英文场景最强,中文文字易乱码)
野路子:Kimi生成HTML海报(文字超多时的秘密武器)
不是让你研究AI,是让你直接上手用。
地图是"导航",实测榜是"评测"。
为什么需要实测榜?
因为同一个任务,不同的AI工具,表现差距很大。
我们同一个任务,用不同的AI工具,各做10次。
比如"做一张带文字的海报":
可灵做10次,成功9次,文字准确率90%
即梦做10次,成功10次,文字准确率95%
豆包做10次,成功8次,文字一多就糊
Midjourney做10次,成功10次,但中文全乱码
这就是实测。
不是看官网介绍写的"支持中文",是真的拿中文去测,看字对不对。
我们评的是消费者看得懂的维度:
| 维度 | 什么意思 | 怎么测 |
|---|---|---|
| 功能完成度 | ||
| 它说能做的,实际能做到吗? | ||
| 做10次,成功几次 | ||
| 易用性 | ||
| 小白能不能5分钟上手? | ||
| 找完全不懂AI的人,计时 | ||
| 性价比 | ||
| 免费额度够不够用? | ||
| 测一天能做几张/几个 | ||
| 稳定性 | ||
| 会不会经常崩溃、出错? | ||
| 连续用7天,记录故障 | ||
| 文字/画面质量 | ||
| 出来的东西能直接用吗? | ||
| 人眼看,能不能直接发出去 | ||
没有一个词是你看不懂的。
这件事我会持续做下去,目前有几个方向:
每周测一个细分用途,比如:
第1周:带文字海报哪家强?
第2周:30秒口播视频哪家强?
第3周:营销文案哪家强?
同一个任务,不同工具,各做10次,记录数据。
最终形成一个**"按场景排名的AI工具榜单"——不是看参数,是实打实用出来的排名**。
地图是"工具推荐",课程是"底层认知"。
我们会讲清楚:
AI到底能帮你干啥?不能帮你干啥?
为什么有的AI会胡说?怎么识别?
怎么让AI真正听你的话?
未来AI会怎么改变你的工作?
不是教你成为AI工程师,是教你成为AI时代会"选工具、用工具、不被工具骗"的聪明人。
AI能做的事越来越多,那人还能做什么?什么能力是AI不具备的?
"AI时代人的算法"是一个长期探索项目,我们会邀请各界专家嘉宾,一起探讨AI时代人的能力本质——判断、价值、创造、关系、意义……这些AI永远替代不了的东西。
地图告诉你"用AI做什么",AI时代人的算法告诉你"做人该做什么"。
AI工具每周都在变,今天的推荐可能下周就过时了。
所以地图会持续更新,哪个工具更新了、哪个免费额度变了、哪个突然不好用了——都会及时标注。
上次那个AI物种鉴定,我确实写得有点"飘"了。
但这件事本身我是认的——AI时代,人确实需要重新认识自己。
只是我觉得,认识自己的前提,是先活下来。
先知道做海报用谁、写文案用谁、做视频用谁——先把AI用起来,再谈"我是谁"。
所以,这张AI工具地图+实测榜,就是一个让你先"活下来"的指南针。
如果你也经常遇到"想做件事,不知道用哪个AI"的困惑,欢迎来地图里逛逛。
我们不谈大道理,就解决具体问题。
扫码进入AI工具地图
或点击原文链接/复制以下网址到浏览器
mind.huhuclub.com

项目开源,可以到Github上查看
喜欢请帮我点个星星哦。
github.com/FutureFuzzy…
这篇文章来自【创造现场】
记录者:未来有点糊

思维实验场公众号

OPC圈北京社群
mind.huhuclub.com
思维实验场官网
因为未来,本来就有点糊。
思维实验场 · Mind Arena
未来有点糊 · FutureFuzzy