代码不用坐在电脑前才能写#

5 月 14 日,OpenAI 宣布 Codex 正式登陆 ChatGPT 移动端。ChatGPT Plus 和 Pro 用户现在可以通过手机 App,用语音或文字与 Codex 交互,创建任务、查看进度、接收完成通知,全程不需要打开电脑。

这个更新看起来只是「把工具搬到手机上」,但它背后的含义比表面更大:编程正在从「必须坐在电脑前」变成「随时随地」

手机上的 Codex 能干什么#

语音交互#

最直接的场景:通勤路上,你突然想起来昨天的 PR 有个 bug 还没修。以前你得等到公司打开电脑,现在直接对着手机说:

“帮我查一下 auth 模块的 token 刷新逻辑,好像有个边界条件没处理好。”

Codex 会连接你的代码仓库,分析代码,然后开始工作。你在地铁上就把问题丢出去了,到公司的时候修复已经等着你 review。

拍照即上下文#

手机比电脑多了一个摄像头,这个优势被 Codex 利用得很好。你可以:

  • 拍错误截图:屏幕上的报错信息直接拍照发给 Codex,它能读懂错误并定位问题
  • 拍白板草图:在会议室白板上画的架构图,拍一张就能让 Codex 基于此生成代码
  • 上传设计稿:Figma 截图或手绘 UI 草图,Codex 可以据此搭建前端页面

从「视觉信息」到「可执行代码」的路径被压缩到了一次拍照。

推送通知#

Codex 的任务通常是异步的,你发出指令,它在云端沙箱里执行,可能需要几分钟到几十分钟。手机端的关键改进是推送通知:任务完成后,手机会弹出通知,你随时可以打开查看结果并继续迭代。

这改变了人和 AI 编程工具的交互模式:不再是「盯着终端等输出」,而是「发任务 -> 做别的事 -> 收通知 -> 看结果」。

Computer Use:给 AI 一个完整的桌面#

移动端是面向用户的交互革新,而 Computer Use 则是面向 AI 的能力革新。

Codex 的 Computer Use 本质上是给 AI 一个完整的 Ubuntu 桌面环境,在里面它可以:

能力具体操作
终端执行任意 shell 命令、安装依赖、运行测试
浏览器内置 Chromium + Playwright,可以访问网页、调试前端
文件编辑读写项目文件,支持多文件批量操作
Git完整的版本控制操作
包管理pip、npm、yarn、apt 全部可用
Python/Node.js预装的运行时环境

这个沙箱是完全隔离的 Docker 容器,网络策略可配置,资源有上限。AI 在里面无论做什么操作,都不会影响宿主系统。

和 CLI 模式的区别#

你可能会问:Codex CLI 不也是在本地执行命令吗?Computer Use 有什么不同?

关键区别在于执行环境

  • Codex CLI:在你的本地机器上运行,直接操作你的文件系统。你需要信任 AI 不会搞坏你的环境。
  • Computer Use:在云端隔离容器里运行,完全沙箱化。AI 可以「为所欲为」而不产生实际风险。

这意味着你可以在 Computer Use 里让 AI 做更激进的实验,比如安装未知依赖、修改系统配置、甚至跑一些可能崩溃的脚本,因为最坏的结果也就是销毁这个沙箱容器。

使用建议#

OpenAI 官方给出的最佳实践:

  1. 指令要具体:「修复 login 函数里的 token 过期问题」比「修复 auth bug」好
  2. 提供上下文:告诉 AI 文件路径、错误信息、期望行为
  3. 从小任务开始:先验证 AI 理解了你的意图,再给大任务
  4. review 输出:沙箱里的操作安全,但 AI 生成的代码质量仍然需要人工把关

这意味着什么#

Codex 的移动端 + Computer Use 组合,代表了 AI 编程工具的一个方向:从「辅助工具」到「独立执行者」

以前,AI 编程工具是「你写代码,AI 帮你补全」。现在,它开始变成「你描述需求,AI 独立完成,你只做 review」。移动端让这个模式从「必须坐在电脑前」解放到了「任何时间任何地点」。

这不是说程序员不需要写代码了。而是说,写代码的门槛在降低,而 review 代码的能力在升值


参考来源: