: 首页; 看点啥; 插画图片

首页经济看点我做了个AI工具地图:专治不知道用哪个AI

我做了个AI工具地图:专治不知道用哪个AI

2026-06-18 0

未来有点糊

2026-06-17 · 【创造现场】· #AI工具地图

上周做了个AI物种鉴定，结果没人理我。

后来想了想，可能有点太不食人间烟火了。

什么"AI星球""松鼠收藏夹"……这些词儿，我自己写得挺爽，但估计大多数人看完就一个字：啥？

直到前几天，一个同事突然问我：

"我想做张海报，用DeepSeek行吗？"

我愣了一下，说："DeepSeek没有多模态，它连图都生不出来，怎么做海报？"

同事也愣了："啊？那我用豆包？"

我说："豆包可以生图，但如果你海报上字特别多，它很容易糊，字一多就乱码。"

同事懵了："那到底用啥啊？"

那一刻我突然意识到——这才是真问题。

大家不是不想用AI，是根本不知道做这件事该用哪个AI。

就像你明明想炒个番茄炒蛋，结果进了五金店，手里攥着把扳手。

一、做海报这件小事，藏着大问题

就拿"做海报"来说，这里面门道多了：

你想做啥	该用谁	不该用谁	为啥
文字超多的海报
Kimi（生成HTML）

豆包/可灵

多模态模型字一多就糊，HTML海报文字是矢量，放大也不糊

精美插画海报
即梦、Midjourney

DeepSeek

它们没有图模型，根本出不来图

带产品图的海报
可灵、Liblib

纯文本模型

需要理解产品图+排版

先写文案再出图
DeepSeek写文案 → 即梦出图

一个工具硬扛

专业的事分给专业的工具

你看，做海报这一个事儿，就分了4种情况，对应4种工具组合。

这还只是"做海报"。那做视频呢？写文案呢？整理会议纪要呢？

每个场景，工具选择都不一样。

但问题是：以前从来没有人系统地告诉你，做这件事到底该用谁。

二、为什么没人告诉你"做海报用谁"？

这里有一个特别大的信息差。

第一，大家分不清"模型"和"Agent"

现在网上有很多给AI打分的，比如国外有个LMSYS Arena，国内有各种大模型排行榜。但你看完会发现——它们评的根本不是一回事。

评的是什么	举个例子	对你有用吗
模型评测
"GPT-5.5在数学考试里得了90分"
没用
技术评测
"这个Agent调用工具的成功率是87%"
没用
产品目录
"这是一个AI海报工具，免费，好用"
️ 半有用
你真正需要的
"做带文字的海报，这5个工具我实测了10次，这个最靠谱"
这才是你要的

模型是发动机，Agent是整车。

现在所有评测都在测"发动机马力多大"，但没人告诉你"这辆车开起来舒不舒服、费不费油、后备箱够不够大"。

你买车的时候，你会关心发动机压缩比吗？你不会。你关心的是坐进去舒不舒服、开起来顺不顺、保养贵不贵。

AI工具也是一样。

第二，技术评测的名词，对用户就是天书

现在的技术评测报告里全是这些词：

"该模型在SWE-Bench Verified上达到87.6%的pass rate，在OSWorld-Verified桌面操作任务中成功率72.5%，幻觉率低于2%……"

你看得懂吗？我看都费劲。

而且这些评测测的是：写代码能不能跑通、操作电脑能不能点对人、回答问题会不会胡说。

**它们不测的是：**做海报字会不会乱码、生成视频人物会不会闪、小白能不能5分钟上手、免费额度够不够用一天。

也就是说，现在所有权威评测，评的都是"发动机"，没人评"开车体验"。

三、所以我做了一个AI工具地图

简单来说，这张地图就做一件事：

你不需要懂什么叫"大模型""多模态""Transformer"，你只需要告诉我"我要做海报"，我告诉你"用谁最靠谱"。

我们不看参数，不看论文，不聊技术名词。我们就做一件事：用。

地图怎么设计的？

按你的生活场景分类，而不是按技术分类。

不讲什么"大模型""多模态"这些黑话。我们就问一个事儿：

你现在要干啥？

然后告诉你：这件事，用谁最靠谱、最便宜、最不容易翻车。

目前地图覆盖了7大生活场景·91种细分用途：

场景	你可能遇到的事	地图帮你解决
学习求知
读论文、查资料、学新东西

哪个AI读长文档最准？哪个不会胡说？

工作提效
写周报、做PPT、整理会议纪要

哪个能一键生成？哪个格式最规范？

娱乐创作
做海报、剪视频、写小说

做海报用谁？剪视频用谁？写小说用谁？

消费购物
买电脑、选课、看病挂号

哪个AI比价最准？哪个不会推荐广告？

健康生活
看体检报告、制定健身计划

哪个医学知识靠谱？哪个不会瞎开药方？

社交沟通
写朋友圈、回邮件、准备礼物

哪个语气最自然？哪个最懂人情世故？

赚钱副业
做副业、开网店、接私活

哪个能帮你写带货文案？哪个能自动做客服？

每个场景下面，再细分到具体用途。

比如"娱乐创作→作图→带文字海报"，我们会直接告诉你：

首推：即梦（文字准、排版好、免费额度够用）
备选：可灵（功能多，但上手稍慢）
进阶：Midjourney（英文场景最强，中文文字易乱码）
野路子：Kimi生成HTML海报（文字超多时的秘密武器）

不是让你研究AI，是让你直接上手用。

四、地图后台还需要有个AI工具实测榜（待开发）

地图是"导航"，实测榜是"评测"。

为什么需要实测榜？

因为同一个任务，不同的AI工具，表现差距很大。

我们同一个任务，用不同的AI工具，各做10次。

比如"做一张带文字的海报"：

可灵做10次，成功9次，文字准确率90%
即梦做10次，成功10次，文字准确率95%
豆包做10次，成功8次，文字一多就糊
Midjourney做10次，成功10次，但中文全乱码

这就是实测。

不是看官网介绍写的"支持中文"，是真的拿中文去测，看字对不对。

实测榜评什么？

我们评的是消费者看得懂的维度：

维度	什么意思	怎么测
功能完成度
它说能做的，实际能做到吗？

做10次，成功几次

易用性
小白能不能5分钟上手？

找完全不懂AI的人，计时

性价比
免费额度够不够用？

测一天能做几张/几个

稳定性
会不会经常崩溃、出错？

连续用7天，记录故障

文字/画面质量
出来的东西能直接用吗？

人眼看，能不能直接发出去

没有一个词是你看不懂的。

五、后面还有啥？

这件事我会持续做下去，目前有几个方向：

1. AI工具实测榜（持续评测）

每周测一个细分用途，比如：

第1周：带文字海报哪家强？
第2周：30秒口播视频哪家强？
第3周：营销文案哪家强？

同一个任务，不同工具，各做10次，记录数据。

最终形成一个**"按场景排名的AI工具榜单"——不是看参数，是实打实用出来的排名**。

2. AI时代生存指南（课程）

地图是"工具推荐"，课程是"底层认知"。

我们会讲清楚：

AI到底能帮你干啥？不能帮你干啥？
为什么有的AI会胡说？怎么识别？
怎么让AI真正听你的话？
未来AI会怎么改变你的工作？

不是教你成为AI工程师，是教你成为AI时代会"选工具、用工具、不被工具骗"的聪明人。

3. AI时代人的算法（课程）

AI能做的事越来越多，那人还能做什么？什么能力是AI不具备的？

"AI时代人的算法"是一个长期探索项目，我们会邀请各界专家嘉宾，一起探讨AI时代人的能力本质——判断、价值、创造、关系、意义……这些AI永远替代不了的东西。

地图告诉你"用AI做什么"，AI时代人的算法告诉你"做人该做什么"。

4. 持续更新的地图

AI工具每周都在变，今天的推荐可能下周就过时了。

所以地图会持续更新，哪个工具更新了、哪个免费额度变了、哪个突然不好用了——都会及时标注。

六、写在最后

上次那个AI物种鉴定，我确实写得有点"飘"了。

但这件事本身我是认的——AI时代，人确实需要重新认识自己。

只是我觉得，认识自己的前提，是先活下来。

先知道做海报用谁、写文案用谁、做视频用谁——先把AI用起来，再谈"我是谁"。

所以，这张AI工具地图+实测榜，就是一个让你先"活下来"的指南针。

如果你也经常遇到"想做件事，不知道用哪个AI"的困惑，欢迎来地图里逛逛。

我们不谈大道理，就解决具体问题。

扫码进入AI工具地图

或点击原文链接/复制以下网址到浏览器

mind.huhuclub.com

项目开源，可以到Github上查看

喜欢请帮我点个星星哦。

github.com/FutureFuzzy…

这篇文章来自【创造现场】

记录者：未来有点糊

思维实验场公众号

OPC圈北京社群

mind.huhuclub.com

思维实验场官网

因为未来，本来就有点糊。

思维实验场 · Mind Arena

未来有点糊 · FutureFuzzy

喜欢(0)

【翻译】一台电脑、五个领域、六位获奖者：Claude Code 黑客松让 Opus 4.7 玩出了什么新花样

我用状态机管了一个50 章的长篇项目 AI只是其中一环