当 Codex 成为 AI Agent 的标准运行时：一个开源项目的架构抉择

你在造轮子，还是在造车？#

假设你要做一个 AI Agent 平台。用户可以通过 Telegram、Discord、Slack 跟你的 Agent 对话，它能记住上下文，能定时执行任务，能搜索网页，能操作浏览器。

听起来很酷，对吧？但当你真正动手写代码的时候，会发现自己面对一个尴尬的问题：模型的「思考循环」到底该由谁来管？

是你自己写一套推理引擎，把模型的输出解析出来，判断它要不要调用工具，再把工具结果塞回去让它继续想？还是让模型背后的基础设施来处理这些事？

这个问题听起来技术性很强，但它决定了你的 Agent 平台到底能走多远。

OpenClaw 最近给出了自己的答案。

OpenClaw 是什么？#

OpenClaw 是一个开源的 AI Agent 平台，它的核心卖点是「多渠道」。你可以在 Telegram、Discord、Slack、WhatsApp、Matrix、网页聊天等任意渠道部署同一个 Agent，它共享记忆、人格、工具权限和定时任务。

这跟市面上那些只能在网页上对话的 AI 助手完全不同。OpenClaw 的 Agent 是一个真正「活」在你日常通讯工具里的存在。

但 OpenClaw 有一个老问题：它之前是自己驱动模型循环的。

自己管模型循环，有什么问题？#

所谓「模型循环」，就是 Agent 从接收用户消息开始，到返回最终回复之间发生的那一整套流程：

把用户消息和上下文发给模型
模型决定要调用某个工具（比如搜索网页）
执行工具，把结果返回给模型
模型继续推理，可能还要调用更多工具
最终生成回复

这个循环看起来简单，但实际实现起来非常复杂。你需要处理线程状态管理、上下文压缩、工具调度、代码执行环境、长对话的连贯性，等等。

OpenAI 在 Codex 的 app-server 里已经把这些问题都解决了。而且他们是针对自家模型的特性专门优化过的。

当 OpenClaw 自己管模型循环的时候，相当于在 Codex 已经修好的高速公路旁边，又修了一条坑坑洼洼的土路。模型在两条路上都能跑，但体验天差地别。

一个大胆的架构决策#

OpenClaw 团队做了一个很多人可能觉得「疯了」的决定：把模型循环的控制权交给 Codex。

具体来说，他们重新画了一条边界线：

Codex 负责的部分： OpenAI 模型的推理循环、原生线程状态管理、工具调用延续、上下文压缩、代码执行模式、动态工具搜索。

OpenClaw 负责的部分： 多渠道接入、Agent 人格配置、记忆系统、会话管理、定时任务、媒体处理、浏览器控制、网关、以及 OpenClaw 自己的工具集。

这个分工看起来很简单，但效果立竿见影。

为什么要这样分？#

原因其实很朴素：让每一层做它最擅长的事。

Codex 的 app-server 是 OpenAI 专门为 Agent 场景打造的运行时。它知道怎么高效地管理模型的推理状态，知道怎么在长对话中保持连贯性，知道怎么处理工具调用的中断和恢复。这些是底层能力，OpenClaw 自己重写一遍既费时又费力，还不一定写得好。

OpenClaw 的价值在上层：它知道你的 Agent 在哪些渠道活动，知道怎么管理记忆和人格，知道怎么调度定时任务，知道怎么处理媒体消息。这些是产品层面的能力，Codex 不会也不应该管这些。

当边界画对了，很多之前让人头疼的问题自然消失了。

动态工具加载：解决「提示词膨胀」#

这次架构改造中最让人眼前一亮的特性，是动态工具加载。

做过 Agent 开发的人都知道一个痛点：你的 Agent 有越多工具，初始提示词就越长。每个工具的 schema（参数定义、功能描述）都要塞进上下文里，模型每次推理都要「看」一遍所有工具的定义。

OpenClaw 的 Agent 可能有几十个工具：消息发送、会话管理、媒体处理、定时任务、浏览器控制、网关管理、网页搜索、MCP 服务器、各种插件工具，以及不同渠道特有的操作。如果把所有工具的 schema 都塞进初始提示词，不仅浪费 token，还会让模型更容易选错工具。

Codex 提供了一个优雅的解决方案：可搜索的动态工具。OpenClaw 把自己的工具能力注册为动态工具，模型在需要的时候可以主动搜索、按需加载工具的 schema，而不是一次性全部塞进去。

这意味着初始上下文更小，模型的选择更精准，推理速度也更快。

而且这个思路是双向的。OpenClaw 团队正在把从 Codex 学到的「动态工具」模式反哺到自己的默认 harness 中，让非 OpenAI 的模型也能受益。

你的 ChatGPT 订阅，现在能驱动 Agent 了#

还有一个很实际的好处：不用重复付费。

如果你已经有 ChatGPT Plus 或者 Pro 的订阅，你可以直接用这个订阅来驱动 OpenClaw 的 Agent。不需要额外买 API key，不需要单独计费。

每个 OpenClaw 的 Agent 都有自己独立的 Codex 运行环境，包括独立的线程状态、独立的账户绑定、独立的插件配置。你的个人 Codex CLI 配置不会被 Agent 偷偷导入，Agent 的状态也不会泄露回你的个人环境。

这种隔离设计很关键。当 Agent 越来越自主，越来越「有记忆」的时候，你需要确保它不会意外访问到不该访问的东西。

安全边界：放手但不放纵#

自主 Agent 需要有用的默认行为，但也需要可理解的安全边界。

Codex 的 harness 支持两种模式：自由执行模式和审批模式。在自由执行模式下，Agent 可以直接执行操作；在审批模式下，敏感操作需要人工确认。

OpenClaw 保持了「默认自由执行」的实用主义立场，同时允许运维人员按需切换到审批模式。在审批模式下，Codex 的审批请求可以通过 Codex 自己的审查流程处理，包括自动审查。

这样，模型可以使用 Codex 原生的安全机制，同时 OpenClaw 也不会放弃自己的策略层。两层安全，各司其职。

这对整个 Agent 生态意味着什么？#

OpenClaw 的这个选择，其实反映了一个更大的趋势：Agent 基础设施正在分层。

就像 Web 开发最终分出了浏览器（运行时）、框架（React/Vue）、和应用（你的网站）一样，Agent 生态也在走向类似的分层：

运行时层：Codex app-server、Claude 的 Agent 运行时。负责模型推理循环、工具调度、状态管理。
平台层：OpenClaw、AutoGPT、CrewAI。负责多渠道接入、记忆、人格、任务编排。
应用层：你基于这些平台搭建的具体 Agent。

当运行时层足够强大的时候，平台层就不需要重复造底层的轮子了。这跟当年 Node.js 的出现让前端开发者也能写后端是一个道理：当运行时统一了，上层的创新会更快。

反向赋能：好想法会流动#

值得注意的是，OpenClaw 和 Codex 的关系不是单向的「依赖」。

OpenClaw 团队明确表示，从 Codex 整合中学到的经验正在回流到 OpenClaw 自己的默认 harness 中。比如动态工具加载的模式、更清晰的工具边界、结构化的静默输出、更好的提示词作用域管理。

这些改进会让所有模型受益，不只是 OpenAI 的。Anthropic、Google、本地模型、DeepSeek、Kimi，最终都会获得更好的 Agent 运行体验。

这是一个健康的生态循环：好的设计模式从专用运行时流向通用平台，再从通用平台惠及所有模型。

写在最后#

OpenClaw 的这个架构决策，表面上看只是「换了个引擎」，但本质上它回答了一个更深层的问题：在 AI Agent 的世界里，什么是基础设施，什么是产品？

模型的推理循环是基础设施。它应该由最懂模型的人来维护，而不是每个 Agent 平台都自己重写一遍。

Agent 的人格、记忆、渠道接入是产品。这是每个平台的核心差异化所在，也是用户选择一个平台而不是另一个的理由。

当这条边界画清楚了，整个生态才能健康地发展。Codex 的 app-server 正在成为这条边界的标准实现之一，而这只是开始。

随着更多 Agent 平台做出类似的选择，我们可能会看到一个有趣的现象：AI Agent 的「运行时战争」，最终会像浏览器战争、容器运行时战争一样，走向少数几个标准的收敛。

对于开发者来说，这意味着选平台的时候，除了看功能列表，还要看它的底层运行时是什么。因为运行时决定了上限。

参考来源：OpenClaw Blog, “OpenAI Models in OpenClaw, Done Right”, Nik Pash, 2026-05-14 原文链接：https://openclaw.ai/blog/openai-models-in-openclaw-done-right