: 首页; 看点啥; 插画图片

首页经济看点 AI Coding 0-工程化视角理解AI Coding与LLM应用的上下文演化

AI Coding 0-工程化视角理解AI Coding与LLM应用的上下文演化

2026-06-12 0

AI Coding与LLM应用演进方向

这个系列会讲一些AI应用的事情，计划从演进方向到工程化应用，从问题到解决问题。本篇会先讲述AI的问题与现在的主流方案。

【AI Coding】0-工程化视角理解AI Coding与LLM应用的上下文演化

AI应用的问题

AI应用在这里指的是AI Coding与LLM应用，在这几年的发展中，AI的应用一直有这不少的问题。下面就上下文的演化进行说明。

AI Coding的问题

从rules到skills、cowork再到harness。 ● 静默执行错误 AI在生成代码时，会根据上下文"脑补"一些不存在的信息。比如你给它一个API文档，它可能会"幻觉"出文档里根本没有的字段，然后基于这个幻觉继续编写调用代码。这种情况下，代码看似正常跑通了，但实际逻辑完全跑偏。静默执行错误认知行为，比如上下文幻觉，比如复杂上下文的信息丢失：复杂任务的细节丢失，比如spec-kit生成的难以用来生成代码的产品白皮书和技术白皮书。

● 上下文信息丢失现在AI Coding有一个头疼的上下文丢失现象，复杂项目做到后期，前面写过的设计决策、架构约定、业务规则"人间蒸发"。也就是 Context Rot（上下文衰减），随着上下文窗口中的token增加，模型准确调用信息的能力会下降。

● 需求传递损耗产品文档写得很好，但AI生成的代码完全不对味。或者分析的计划很好，但是执行计划的时候错漏百出。比如Spec-Kit，从产品白皮书→技术方案→代码，这条信息传递链上存在巨大的语义损耗。

LLM应用的问题

从Simple RAG到Multi Agent，从Prompt Engine到Context Program。 RAG我们需要大量的召回，维护知识库。 Multi Agent我们需要复杂的记忆架构、角色拆分来应对逐步爆炸切各Agent之间不一定同步的上下文。

主流方案：上下文工程的演进路径

这些问题，无一不在诉说着我们需要对上下文进行更高效的管理。随着 AI 能力的提升，我们在用越来越少的上下文工程，做到越来越高效的事情。

这背后有一条清晰的工程化演进脉络： 从"对话内堆上下文"→ 到"系统侧编排上下文"。

工程化视角：为什么上下文管理是核心命题？

从工程化的视角来看，AI Coding 与 LLM 应用的所有问题，本质上都可以归结为一件事：

早期的解法很直白：信息不够？塞进去。效果不好？再塞。

Prompt 里堆满了规则、示例、API 文档节选，上下文窗口越用越长，模型却越来越"迷糊"——这就是典型的上下文膨胀陷阱。

真正稀缺的不是上下文长度，而是有效 Context 的组织能力。 LLM 能力越强，我们越敢于做"减法"。

Modern Context Engineering：四象限方法论

现代上下文工程的核心，可以用四个维度来描述：

策略	含义	典型手段
Offload（外置）	将信息存到外部，不占窗口	向量库、知识图谱、外部记忆系统
Retrieve（精召）	按需精准检索，而非全量注入	grep、LSP、语义搜索、结构化查询
Reduce（压缩）	对已有上下文进行智能摘要与裁剪	滑动窗口、摘要链、Token 预算管理
Isolate（隔离）	任务级别的上下文隔离，避免污染	Skills、子 Agent、独立会话

正如 Claude Code 用 grep 替代全量向量检索—— 正确的工具 + 精简上下文，远胜于冗长提示词堆砌。

当 LLM 不再被噪声淹没，静默执行错误、需求传递损耗等顽疾自然消解。这正是"用更少上下文工程实现更高效能"的底层逻辑。

Skills 与 Cowork：让上下文越来越纯粹

近几个月火爆的 Skills 与 Cowork 模式，正在让上下文越来越少、越来越纯粹。因为不再需要 LLM 使用大量的上下文去推理，去分析在长对话后可能出现幻觉的问题，而是将任务直接派发给一个预置了专项能力和极简上下文的 Skill。

● Skills（技能）：可以理解为一个个"即插即用"的微服务

每个 Skill 都高度专业化（例如 ReactComponentSkill、SQLQuerySkill），其内部已经固化了执行特定任务所需的最核心指令和工具。当 LLM 接到一个复杂请求时，它不再需要翻阅大量的 API 文档和历史对话来"学习"，它只需要做一个简单的路由决策："这个任务应该调用哪个 Skill？"

● Cowork（协同）：这是 Skills 模式的自然延伸

当一个任务需要多个 Skills 协同时，一个轻量的"协调者"（Orchestrator）会出场。它的上下文极其纯粹：只包含任务目标、可用的 Skills 列表以及它们之间的输入输出约定。它不关心每个 Skill 内部是如何实现的，只负责按照工作流将它们串联起来。

这就好比一个项目经理，他不需要懂得如何敲代码或画设计图，但他清楚地知道：应该先让设计师出稿，再让工程师开发，最后让测试验收。

● ClawBot：协同的更高形态——容错与接替

如果说 Cowork 是让多个 Skills 像团队一样"各司其职"，那么 ClawBot 则是让这个团队具备了**"主动补位"**的能力。

它的核心思想是动态故障检测与任务重新路由：

某个 Skill 执行失败？自动切换备用路径；
某段上下文检索结果置信度低？主动触发二次召回；
多个 Skill 输出结果有冲突？由 Validator 层进行裁决。

ClawBot 的本质，是将传统 Agentic Loop 中"人工兜底"的部分，自动化地内建进了系统架构。

模式对比：一张表看清上下文演化脉络

模式	核心逻辑	上下文特征	核心痛点解决
Simple RAG	向量匹配 Top-K	碎片化、易丢失逻辑	补充外部静态知识
Multi-Agent	角色分工 + 状态机	冗余度高、同步难	处理跨模块复杂任务
Skills/Cowork	工具化 + 状态共享	精简、确定性高	消除推理幻觉，提升执行力
ClawBot	Agentic Search（grep/LSP）	按需加载、自验证	解决大规模工程的检索精度

AI Coding 的设计趋势：系统侧编排取代对话内堆砌

很多"需要塞进上下文让模型现场推理的东西"，被前置固化为可复用的能力 / 工具 / 流程，从而让在线上下文更短、更稳定，执行速度和输出一致性更好。

这不是"上下文工程变少了"，而是从对话内上下文迁移到了系统侧上下文编排（检索、记忆、路由、工具协调），仍然属于上下文工程的范畴。只不过，战场从 Prompt 窗口里，转移到了系统架构层。

用一句话总结这个趋势：

公司的 Aone Copilot 就很有潜力，是集成 Skills、Rules、McpServers 等配置的很好的平台。它正在做的事，恰好是这套方法论的工程落地——把上下文的组织能力，沉淀进平台，而非每次都由开发者手工拼接。

小结

本篇从工程化视角出发，梳理了 AI Coding 与 LLM 应用在上下文演化这条主线上的核心问题与主流方案：

问题侧：

静默执行错误（上下文幻觉）
Context Rot（上下文衰减）
需求传递损耗（语义损耗）

方案侧：

Simple RAG → Multi-Agent → Skills/Cowork → ClawBot ↓ ↓ ↓ ↓ 全量召回角色分工工具路由自主容错（堆信息）（堆角色）（减上下文）（自愈系统）

趋势侧： 上下文工程的重心，从"对话内塞信息"转向"系统侧精准编排"。越来越少的上下文，越来越高的执行确定性。

下一篇，我们将进入具体的工程化实践： 如何在真实项目中设计一套可落地的 Skills 体系？ 从 Skill 的定义、注册、路由，到多 Skill 协同的编排设计，以及踩过的那些真实的坑。

喜欢(0)

太空算力星途：在技术攻关与场景拓展中寻求落地节奏

贝索斯驳斥AI抢饭碗论：未来十年将迎多个黄金时代