比亚迪:“人形机器人代号尧舜禹”等说法均不属实
2026-06-08 3346491
2026-06-08 0
窄播AI 2026-06-07 23:48 江苏
以下文章来源于:窄播AI
窄播AI去喧嚣,见价值。

一场系统级的竞争。


实现Coding Agent向通用场景的泛化是系统级竞争。
作者 | 李威(北京)
这是《窄播Weekly》的第93期,本周我们关注的商业动态是:大厂Agent产品消息频传,新的竞争趋势正在显现。
对于AI领域而言,本周是重量级消息不断爆出的一周。从黄仁勋重新定义AI PC,到微软Build 2026喊出「Agent优先」,OpenAI宣布合并ChatGPT和Codex,再到微信Agent进展曝光、千问开始接入第三方Skill、豆包回应付费传闻、美团财报会上强调服务AI Agent正变得越来越重要。
此前有人在问曾经爆火的OpenClaw怎么没人提了?本周传出的这些消息用实际行动回答了这个问题——大家不再提OpenClaw,是因为Coding Agent成为一种执行任务的通用方案,并与Chatbot走向融合,同时与之相匹配的Skill和Agent生态也开始建设,新的付费探索也正在进行中。
大厂在将OpenClaw带来的启发转化为真实的业务进展。这个过程中,OpenClaw以及我们现在看到的产品,可能都不会是AI产品的最终形态。就像腾讯首席AI科学家姚顺雨在2026腾讯云AI产业应用大会上所说,一场长周期的变革才刚刚开始,真正的产品形态、商业机会和使用方式,都还远没有被充分发明出来。
我们能确定的是,Agent正在成为大厂AI的核心战场,而这场竞争的形态,正在沿着四条主线不断演变:谁能拓展更多生产力场景的用户;谁能更深度打通内部产品;谁能建立起足够丰富的Skill、Agent生态;谁能积累足够的上下文。

「同事」成为Agent的竞争焦点
「同事」是当下描述Agent时最常被提及的词汇。微软的Scout被设计成「像同事一样」工作;扣子3.0强调让人和AI团队一起协作;OpenAI推出的Agent插件则被形容为「已办完入职、懂全套流程的新同事」。
这些表述意味着,生产力场景已经成为大厂Agent的竞争焦点。
微软推出的Scout,是基于OpenClaw框架打造的Agent,常驻Microsoft 365,可在Teams中运行,能与Outlook、OneDrive等办公应用协同,浏览邮件、日历、工作消息,自动处理会议冲突、起草回复、推进任务。同时,微软还推出了Agent 365,为企业统一管理Agent的身份、权限、策略和风险。
OpenAI则把发布会的主题直接定为「Intelligence at Work」。在这场发布会上,OpenAI为Codex进行了三项核心升级:推出可定制能力的Agent插件;将局部批注修改能力从代码和网页,拓展到文档、表格和PPT上;通过生成网站来进行产出汇报的能力。
同时,豆包在针对付费功能的回应中提到,针对专业人群的生产力需求,豆包计划推出豆包专业版,将包含软件开发、数据分析、专业设计、流程自动化、金融分析、科学研究等专业服务。

这些产品动作意味着,生产力场景——而不仅仅是传统意义上的企业场景的巨大价值,已经得到了真金白银的验证。
OpenAI发布的数据显示,今年2月以来,Codex的周活增长了6倍,达到500万,其中知识工作者的增速是开发者的3倍。Anthropic第二季度的收入预计将增长逾一倍,达到109亿美元,并可能实现5.59亿美元的营业利润,其收入大多来自企业和初创公司。

内部产品的整合与连接在不断深化
产品的更新与迭代,对应的是更深层的产品架构重组。一方面,目前大厂基本都布局了Chatbot和一个或多个Agent产品,现在针对这些产品的整合已经开始。其中最激进的就是OpenAI对ChatGPT和Codex的整合。
OpenAI想要让ChatGPT从单纯的对话入口,升级成为协同Agent工作的主界面,而Codex则会升级为能够满足办公、科研、企业流程、数据分析、业务运营等多场景工作需求的通用Agent平台,其内核是对Coding Agent的使用场景泛化。通过这场整合,OpenAI期待将Codex推广向ChatGPT的庞大用户群体,扩大付费用户基数。
还有消息显示,OpenAI计划让AI浏览器Atlas也参与到这场超级AI应用的整合中。
另一方面的整合,是大厂原有的互联网产品能力和服务,在快速以Skill或Agent的形式被整合到AI产品中。阿里为千问增加点外卖、打车、淘宝购物的能力,是比较早期的探索。现在,我们可以看到字节、美团、腾讯都在做类似的工作。
字节在给豆包打通抖音商城之后,又在增加美食、电影票、民宿等本地生活服务的门店及团购套餐推荐。美团在财报会上表示,AI助手「小团」嵌入了美团APP,五一期间服务了过亿人次用户,覆盖吃喝玩乐、出行、问诊等场景。腾讯文档也将过去所积累的文档处理能力变成Skill,被WorkBuddy调用。
腾讯集团高级执行副总裁汤道生在2026腾讯云AI产业应用大会期间表示,过去很多传统应用的功能,要转换成可被智能体调用的能力,才能够把过去多年积累下来的价值进一步释放出来。所以今年企业微信在把原来的一些数据能力通过接口、通过Skill开放出来,让其他智能体可以调用。这种开放的趋势是越来越明显的。

第三方生态建设开始提上日程
Agent与此前产品的一个核心差异是,它具备工具调用的能力。这就要求Agent背后能够有一个足够丰富的工具生态。即便是大厂,也很难凭一己之力去构建起这个生态。这就需要第三方的Skill或Agent生态建设。
现在这个生态的建设已经提上了日程。
千问在完成对阿里内部第一方产品、服务的整合之后,宣布将向第三方Agent、Skill全面开放,让所有企业均可在千问运营自己的品牌Agent。本周,瑞幸、肯德基、蜜雪冰城、东方航空已经在千问上线了Skill。随后企业还能够在千问中自定义Agent人设与具体服务。
腾讯则一方面在将美团的小美接入到元宝中,为用户提供外卖点餐、配送等服务;另一方面在加速微信Agent生态的建设。
媒体报道显示,微信的Agent已完成原型测试,最快将于本月启动公开上线前的合规审批流程。这个Agent能调度微信小程序,实现点餐、打车、订票、购物及本地生活等复合服务。
此外,微信还在尝试与荣耀、小米等手机厂商建立Agent to Agent的连接,让自己的基础能力能够被手机厂商的Agent调用。也就是说,手机厂商也将成为微信Agent生态的新入口,形成多个入口共用一套Agent生态的架构。
OpenAI的Agent插件,则能够一次性打包岗位所需的工具、知识和技能。比如,创意生产插件可以根据brief生成campaign board、展示广告变体、产品生活方式图和电商图集,并能够调用Figma、Canva、Shutterstock、Picsart、Fal等工具。简单理解,这就是一套为Agent准备的职业传承体系。

目前Codex的Agent插件覆盖了62个热门应用和110项技能。后续,OpenAI希望把插件生态开放给合作伙伴,让第三方直接在Codex和ChatGPT中创建并部署自己的插件。

上下文变得更为重要
姚顺雨表示,模型越来越擅长把复杂输入变成输出,但前提是它能拿到足够好的输入。这就需要在用户端能够为模型和Agent提供足够详实、有用的信息,让模型和Agent能理解「你是谁」「你正在做什么」「什么答案对你有价值」等能锚定正确路径的问题。
在开发端,围绕AI产品开发,也需要有充分的上下文沟通。姚顺雨和汤道生在上述活动的对谈中提到,AI产品开发需要从产品反馈中去确定模型应该奖励什么、惩罚什么,什么回答算好,什么行为算差。这意味着,模型团队和产品团队需要通过一个上下文共享的过程,完成Co-Design,共同创造出更好的体验。
因此,AI产品在用户端要连接和积累多源的上下文信息,然后通过辨别什么信息该给,什么信息不该给,来与Agent对齐任务意图;在开发端则要建立顺畅的反馈机制,将模型团队与产品团队的开发目标进行对齐,加速体验优化。
无论是用户端上下文的积累,还是开发端上下文的共享,都不仅是开发问题,更是组织问题,要通过协同来实现上下文的积累与共享。
这也是为什么,OpenAI为了整合ChatGPT和Codex,在今年1月就开始重组团队,让产品团队和负责相关底层模型的研究人员更紧密协作;然后又将ChatGPT、Codex和API团队整合成了一个部门,由Thibault Sottiaux负责。
同时,对上下文的重视,可能还会刺激硬件的Agent化,让硬件成为一种Agent收集用户上下文的有效途径。微软的Project Solara项目就是在进行这种探索。随时随地的沟通并不是开发Agent桌面终端和随身设备的唯一目的,更多的目的是在桌面、移动场景中为Agent执行任务提供更多上下文信息。
过去几年,AI行业呈现出了一条相对清晰的技术路径:预训练→后训练→Agent→Coding Agent。这条路径可能不是未来唯一的主线,但却是大厂当下能抓住的最有效的主线。
我们提炼出的四个趋势,则是固定路径走向的层层相连的基础坐标,最终都是为了实现Coding Agent向通用场景的泛化。这又是一场系统级的竞争。
- END -



