Codex 30 天实测:零手写代码的背后,人类还剩下什么?

一个月前,我还在手写代码#
一个月前,我的日常是这样的:打开 Xcode,敲键盘,调试,重构,再敲键盘。我已经用 ChatGPT 辅助开发很久了——我那些从 Objective-C 迁移到 Swift 的十几万行代码里,有不少是 LLM 帮忙写的。但本质上,我还是那个在键盘上敲代码的人。
直到 Xcode 26.3 发布,内置了 Codex 集成。我好奇地试了一下,然后就再也没有回去过。
这篇文章不是评测。不是功能介绍。这是一个独立开发者花了整整一个月,用 Codex 做了所有他能想到的"疯狂实验"之后,写下的真实记录。
前情提要:我没有写过一行代码。全程。
第一周:从怀疑到震惊#
第一个实验:一小时内做出完整 App#
我很谨慎。我甚至不敢让 Codex 碰我的真实代码库。于是我挑了一个 Todo 列表里躺了很久的小项目——一个「时间线」App,让它从零开始。
我给了它一个 Markdown 格式的编码风格文件(类似于 AGENTS.md 的概念),以及一个预配置好的 Xcode 项目模板。然后就开始了。
一两个小时后,我得到了一个完整的 Mac/iPad 应用:有数据模型、能持久化到磁盘、支持打印和导出 PDF、自定义布局容器和拖拽选择。不是 Demo,不是原型,是可以直接上架 App Store 的应用。
我查了一下预算:用了 7% 的月度配额。对,一个完整 App,只花了我月配额的 7%。
第二个实验:更复杂的非标准 UI#
一个像素绘图 App——有浮动面板、毛玻璃效果、可缩放画布、在安全区域内居中显示内容并支持过度滚动。这些东西我自己写至少要好几天,Codex 在一个会话里就搞定了。
到此为止,它做的所有事情都在 Xcode 的沙盒里完成。但是很快,我就不满足于沙盒的限制了。
iPhone → Android:两次远离原始代码的移植#
我从 Git 历史里翻出了十年前的 SameGame——一个用 Objective-C 写的经典消除游戏。里面有早已废弃的音频 API、已经死掉的 Flurry 统计、还有为各种屏幕尺寸打的一堆补丁。
我让 Codex 把它一次性迁移到 Swift。
它做到了。一次性。 编译通过,运行正常。音频能用,游戏逻辑完整,自定义动画设置页完好无损。
但真正让我震撼的是接下来的事情:我让它把这个 Swift 版移植到 Android。
一年前我用 ChatGPT 的 Agent 功能试过,失败了。这一次,Codex 在两个会话内完成了一个 1:1 的 Android 移植——使用 Java/XML、Gradle、Android Studio,完整支持 Android 5.0 一直到 Android 14。
注意这里的"血缘关系":这个 Android 版本从一个 Swift 代码库生成,而这个 Swift 代码库又是从一个 Objective-C 代码库生成的。距离最后一个人类写下的代码,已经隔了两层。
我把它发布到了 Google Play。不是为了赚钱——SameGame 是一个零风险项目,没有广告,没有追踪。只为了验证一件事:AI 辅助开发的产物,能不能真正走到用户手里?
答案是可以的。
Unity → SpriteKit:把 12 年前的游戏复活#
12 年前,我参加 Ludum Dare 做了一款 Quake 3 Arena 的 2D 俯视角重制版,用的是 Unity。此后十年里我至少尝试过 4 次用不同技术栈重制它(C+SDL、Swift、Godot……),每次都半途而废。
这次我把整个 Unity 项目丢给 Codex,让它移植到 SpriteKit。
第一次运行就看到了一个可玩的地图。 AI 机器人在上面乱跑互相射击,地图、视角、HUD 基本上都在。我用了一个晚上不断反馈调整,最终得到了一个功能完整的版本,甚至支持游戏手柄输入。我把它打包、签名、发出来给人试玩。
10 年的未竟之事,Codex 用一个晚上帮我完成了。
第二周:正式发布一个"认真"的 Android 应用#
第一周的实验让我确信 Codex 不是玩具。第二周开始,我决定做一件认真的事:把我的 iOS 应用 Lights Off 完整移植到 Android。
这次不一样。我不想要一个「能跑就行」的版本。我要 Material Design 3、自适应布局(手机用底部导航栏、平板用侧边导轨)、动态取色(Material You,从用户壁纸提取配色方案)。
我甚至保留了整个过程的 Prompt 记录,让别人也能看到我是怎么引导 Codex 的。
两个会话——一个晚上加一个早晨——我得到了一个让我自豪的 Android 应用。它已经在 Google Play 上线了。
有趣的是,我从这个过程中得到了一个灵感:让游戏主题色从用户的壁纸和系统主题自动生成。我的玫瑰石英色 Pixel 有粉色壁纸,Lights Off 里就自动变成了一套粉紫色的配色方案——我觉得比手调的还好看。
第三周:杀入 Windows#
Pastel:7 万行 iOS 代码 → Windows#
我的 Pastel(一个取色工具)有 7 万行 iOS 代码。几年前我写过一版 UWP 原型,后来 UWP 被微软放弃了,现在要用新的 Windows App SDK(WASDK)。
Codex 还没有 Windows 原生版,我是在 WSL 里跑的 Linux 命令行版。这完全不是问题——它照样能写 C#/XAML/Win32 代码。
我让它逐模块地重建 Pastel 的核心功能:导航、数据模型、右键菜单、编辑。目前生成了大约 1 万行代码,完成了所有我设定的目标。它有自定义 UI、调用 Win32 API 做取色、支持拖放、多窗口、深色模式。
我还把测试版发布到了 Microsoft Store(仅限直接链接访问)。
从 Windows Phone 到 Windows 11#
作为压轴实验,我让 Codex 把我的 Windows Phone 时代的 Lights Off 移植到了 Windows 11。这一次我特意截屏记录了中间那些丑陋的状态——因为我不想给人一种「AI 一步到位就完美了」的错误印象。
实际上每一步都是反复迭代的:我说不对,它改;我截图给它看,它继续改。一个晚上加一个早晨,完成了一个让我满意的 Windows 版本,已经开始走 Microsoft Store 的上架流程。
花了多少钱?#
我用的是 $20/月的 ChatGPT Plus 订阅。Codex 在这个计划里是附带的,不需要额外付费。
在整个三周里,我每天都在用 Codex,一次都没有触及 5 小时的会话上限,也没有触及每周的使用量限制。
不过有个重要的背景:OpenAI 在 Codex 发布初期提供了 2 倍 的常规使用额度。如果按正常额度算,我每周都会超额,要么买 $40 的额外额度,要么升级到 $200/月的计划——我哪个都不想。
这个临时优惠将在 4 月 2 日结束。说实话,我不知道额度砍半之后会对我的使用造成多大影响。先给你尝一口,再收网——经典的商业策略。
最重要的问题:人类还剩下什么?#
这篇文章可能会让人产生一种错觉:「AI 已经能写代码了,开发者完蛋了。」
但恰恰相反。回顾这一个月,我自己得出的结论是:
我可以不需要 Codex 做这些事——但会慢 10 倍。Codex 可以不需要我——但它做不出任何我满意的东西。
这不是 AI 取代开发者的故事。这是一种重新分工。
从"演奏者"到"指挥家"#
过去的开发者是演奏者:亲自敲每一个音符。现在的开发者是指挥家:告诉乐团(AI)演奏什么、怎么演奏、在哪个段落加速、在哪个段落变调。
指挥家不需要会拉小提琴——但他必须有品味。
Codex 可以在一秒内重写一千行代码。代码本身变得廉价了——真正稀缺的是:
- 品味:什么是对的,什么是好的
- 判断力:这个方案可行吗?那个边界条件考虑了吗?
- 架构感:模块怎么拆?数据怎么流?
- 对用户的直觉:这个交互合理吗?那个动画对吗?
我全程没有写代码,但每一个决策都是我的。Codex 只是在执行。
那条警告:不要变成"节点"#
我看到有些公司正在用 AI Agent 节点替代人类开发者。对此我只想说:小心。
AI 可以输出代码,但它没有品味。当你把所有的人类判断力都替换成 AI 节点时,你会得到一堆技术上能跑、体验上一塌糊涂的产品。
这个月最让我确信的一件事就是:在所有这些例子里,AI 和我少了谁都不行。
我们正处在一个不可逆的抽象层级跃迁中#
这个月改变了我对软件开发的认知。我们刚刚经历了一次永久的、不可逆的抽象层级迁移。
就像现在你很难说服一个 Swift 开发者去写汇编一样,未来你很难说服一个从小看着 AI 写代码长大的人,去「亲手敲代码做开发」。
代码正在变得像电一样——无处不在,但没人在乎它是怎么发出来的。
参考来源:High Caffeine Content — A Month With OpenAI’s Codex (March 1, 2026) 本文为原创中文重写,在理解原文核心观点的基础上,用独立的结构和语言重新表达。