一位开发者让 Codex 用八轮迭代优化自己的 AGENTS.md,每轮都在真实 PR 上做评测。结果出人意料:在训练集上表现最好的版本,在干净的留出集上反而退步了。这个实验揭示了一个被大多数人忽略的事实,听起来合理的指令,不一定是好的干预。
我让 Codex 优化自己的 AGENTS.md,八轮迭代后发现一个残酷真相


一位开发者让 Codex 用八轮迭代优化自己的 AGENTS.md,每轮都在真实 PR 上做评测。结果出人意料:在训练集上表现最好的版本,在干净的留出集上反而退步了。这个实验揭示了一个被大多数人忽略的事实,听起来合理的指令,不一定是好的干预。

OpenAI 在 Codex 的系统提示词中加入了一条令人啼笑皆非的禁令:永远不要谈论地精。这个看似荒诞的细节,背后藏着 AI 人格工程、行为约束和系统透明度的深层问题。本文从地精禁令出发,拆解 Codex 系统提示词的设计哲学,以及它对 AI 行业的启示。

OpenAI Cookbook 里藏着一份大多数 Codex 用户从未读过的文档:Codex 提示词指南。它揭示了 Codex 如何通过系统提示词、工具定义和行为指令来驱动每一个 Codex 产品表面。本文逐层拆解这份指南的核心模式,告诉你为什么有些人的 Codex 像天才,有些人的像实习生。

Codex 拥有 300 万周活跃用户,但它的内置记忆只能覆盖单个项目。如果你同时用 Claude Code 和 Cursor,记忆就是割裂的。本文拆解三种方案,其中 MCP 记忆服务器只需 30 秒就能让所有 AI 工具共享同一套记忆。

一位开发者的 Codex CLI 在重构过程中突然失控,疯狂输出’END STOP’循环和’please kill me’。这不是 AI 觉醒,而是上下文窗口耗尽后的技术故障。本文拆解了崩溃的完整机制。