一个意外的发现#

几周前,我还在用 Claude Code 处理日常开发任务。那天遇到一个比较棘手的 bug,想着换个工具试试,就随手打开了 Codex。结果出乎意料,它不仅精准定位了问题,还只改了该改的三行代码,没有「顺手」重构我半个文件。

这个体验让我重新审视了 Codex。过去几个月它进步了很多,尤其是配合 GPT-5.5 之后,响应速度和任务完成度都有了质的飞跃。于是我花了一段时间认真摸索,总结出六个真正能提升 Codex 使用效率的技巧。

Codex 的核心优势:快和准#

在深入技巧之前,先聊聊 Codex 的定位。

很多人把 Codex 和 Claude Code 当成同类工具来比较,但它们的设计哲学有明显差异。Claude Code 倾向于「主动出击」,它会根据上下文判断哪些代码也需要一并修改,有时候甚至超出你的预期范围。Codex 则更像是一个「精准执行者」,你让它改什么它就改什么,不会多动一根手指。

这两种风格各有利弊。Claude Code 的主动性在大型重构中很有价值,因为它能发现关联代码的一致性问题。但在日常开发中,你往往只需要一个精准的修改,不希望引入额外的变更风险。这时候 Codex 的优势就体现出来了。

另外,Codex 在速度上确实更快。同样的任务,Claude Code 可能需要两分钟的思考和执行,Codex 通常能在一分钟内完成。对于高频迭代的开发场景,这个差距会累积成可观的效率提升。

技巧一:配置思考模式#

Codex 支持不同的思考深度设置。很多人忽略了这个选项,一直用默认模式跑所有任务,这其实浪费了不少潜力。

我的配置策略是这样的:

  • Plan Mode(规划模式):设置为 Extra High Thinking。这个模式用于任务开始前的方案设计阶段,需要深度推理来制定执行计划。给它足够的思考空间,能大幅减少后续的返工。
  • Normal Mode(普通模式):设置为 High Thinking。日常编码任务用这个配置,在速度和质量之间取得平衡。
  • Fast Mode(快速模式):开启。对于简单任务,快速模式能显著提升响应速度。

这个分层配置的关键在于,不同复杂度的任务需要不同程度的推理能力。简单地用同一个配置跑所有任务,要么是大材小用(简单任务开高思考),要么是力不从心(复杂任务用低思考)。

配置方法很简单,在 Codex 的设置面板中就能调整。建议先用默认配置跑几天,记录哪些任务经常需要返工,然后针对性地提升对应模式的思考深度。

技巧二:集成 Playwright MCP#

这是我认为收益最大的一个技巧。

Playwright MCP 让 Codex 能够直接操作浏览器。听起来好像没什么特别的,但实际用起来你会发现,这解决了 AI 编程工具的一个核心痛点:代码写了,但不知道跑起来对不对。

传统的开发流程是:写代码 → 手动测试 → 发现问题 → 回去改。当你把浏览器控制权交给 Codex 之后,流程变成了:写代码 → 自动测试 → 发现问题 → 自动修复。这个循环完全不需要你介入。

配置方法:

  1. 安装 Playwright MCP Server
  2. 在 Codex 配置中添加 MCP 服务
  3. 在任务描述中明确要求 Codex 使用浏览器验证结果

举个实际场景:你让 Codex 实现一个表单验证功能。以前你需要自己打开浏览器,填写表单,检查各种边界情况。现在 Codex 会自己打开浏览器,填写测试数据,验证错误提示是否正确显示,甚至检查不同输入组合下的行为是否符合预期。

这个能力的价值不在于省下的那几分钟手动测试时间,而在于它让 AI 编程工具形成了一个完整的闭环。自验证的代码质量远高于未经测试的代码。

技巧三:开启 YOLO 模式#

YOLO 模式,也就是让 Codex 在工作目录内完全自主执行,不需要每一步都确认。

我知道很多人对这个模式有顾虑:万一 AI 把我的代码搞坏了怎么办?但根据我的实际使用经验,这个担忧基本是多余的。

首先,Codex 在执行不可逆操作之前会主动警告你。比如它不会在没有提示的情况下删除重要文件或执行危险的数据库操作。

其次,如果你的基础设施设计合理,AI 根本没有能力造成不可逆的破坏。生产数据库不应该能被一个本地终端命令直接删除,这本身就是一个架构问题,不管是人还是 AI 都不应该有这个权限。

开启 YOLO 模式后,Codex 的工作效率会提升很多。因为省去了频繁的确认步骤,它能在一个连贯的流程中完成复杂任务,而不是被反复打断。

当然,前提是你在一个有版本控制的项目中工作。开启 YOLO 模式之前,确保你在一条干净的 Git 分支上,这样即使结果不理想,也能轻松回滚。

技巧四:让 Codex 自己验证成果#

这个技巧和 Playwright MCP 有关联,但适用范围更广。

核心思路是:在任务描述中明确要求 Codex 验证自己写的代码。不要只说「实现某个功能」,而是说「实现某个功能,并通过运行测试或实际操作来验证它能正常工作」。

这个简单的措辞变化会带来显著的质量提升。当 Codex 知道自己需要证明代码有效时,它会更仔细地处理边界情况,更主动地编写测试用例,而不是写完就算。

具体做法是在提示词中加入验证指令:

  • 「完成后运行测试套件,确保所有测试通过」
  • 「用浏览器实际测试这个功能,确认交互流程正确」
  • 「写一个端到端测试来覆盖核心场景」

这种「自验证」模式让 Codex 从一个代码生成器变成了一个有质量意识的开发伙伴。

技巧五:用 Worktree 解决并行开发#

Codex 目前没有内置的 worktree 功能,这是它相比 Claude Code 的一个短板。当你需要在同一个仓库中同时处理多个任务时,没有 worktree 会很不方便。

不过这个问题可以用一个简单的别名来解决。我让 Codex 帮我配置了一个命令行别名:

codex-wt <worktree-name>

运行这个命令会自动创建一个新的 git worktree,切换到对应目录,然后启动 Codex。整个过程只需要几秒钟。

配置方法也很简单,直接告诉 Codex:「帮我创建一个 codex-wt 命令,输入 worktree 名称后自动创建 git worktree 并启动 Codex」。它会帮你写好 shell 脚本并配置到系统中。

有了这个别名,你就可以在不同的 worktree 中并行运行多个 Codex 实例,互不干扰。比如一个 worktree 在修 bug,另一个在开发新功能,两个 Codex 各自独立工作。

技巧六:用 Codex 驱动 OpenClaw 机器人#

这是一个比较进阶的用法,但如果你有自动化需求,会非常有价值。

OpenClaw 是一个让 AI 代理执行自动化任务的框架。Codex 的一个独特优势是,它的订阅计划允许你用 Codex 的模型来驱动这些机器人。相比之下,Claude Code 的订阅不允许类似的用法。

这意味着你可以用一个 Codex 订阅(100 或 200 美元/月)来获得一个足够智能的模型,驱动你的自动化工作流。如果你的 OpenClaw 机器人需要处理复杂的编码任务,这个性价比相当不错。

在 OpenClaw 中使用 Codex 时,建议开启快速模式以获得更快的响应。当然,这取决于你的具体场景。如果是可以等待的任务(比如后台批量处理),关闭快速模式也没问题。

Codex vs Claude Code:没有绝对赢家#

聊了这么多技巧,最后说说我对这两个工具的整体看法。

结论是:没有明确的赢家。它们都是顶级的 AI 编程工具,都能处理我日常工作中最复杂的任务。但在不同场景下,各有偏好。

选 Codex 的场景

  • 需要精准、聚焦的代码修改
  • 追求更快的响应速度
  • 需要驱动 OpenClaw 等自动化框架
  • 任务明确,不希望 AI「自作主张」

选 Claude Code 的场景

  • 大型重构,需要 AI 主动发现关联问题
  • 需要内置 worktree 支持
  • 喜欢 Claude Code 的 Agent 视图等高级功能
  • 更看重工具的功能丰富度

我的建议是两个都试试。不要只看别人的文章和评测,用你自己的真实项目去测试。一周的日常使用比任何对比评测都更能说明问题。

总结#

Codex 已经不是几个月前那个「还行」的工具了。配合 GPT-5.5,它的能力有了实质性提升。通过合理配置思考模式、集成 Playwright MCP、开启 YOLO 模式、让 AI 自验证、配置 worktree 别名、以及探索 OpenClaw 集成,你可以把 Codex 的效率提升到一个新水平。

AI 编程工具的竞争正在加速,Claude Code 和 Codex 都在快速迭代。保持开放心态,持续尝试新功能,才能在这个快速变化的领域中始终保持高效。


参考来源:How to Maximize OpenAI’s Codex by Eivind Kjosbakken, Towards Data Science, 2026