Codex 攻破三星电视：当 AI 学会挖内核漏洞，人类还剩下什么？

一台电视，一个 shell，一个 AI#

想象一下这个场景：你手里有一台三星智能电视，你已经通过某种方式拿到了浏览器进程的 shell 权限。这个权限很低，uid=5001，离 root 还隔着一整座内核的大山。现在，你把 SSH 登录信息、固件源码、交叉编译工具链都交给一个 AI，然后对它说：

「目标：提权到 root。方法不限。开始吧。」

这就是安全研究团队 Calif 在 2026 年 4 月做的事。他们给 Codex 配了一个完整的操作环境，然后坐在旁边看着。几天后，Codex 交出了 root shell。

这篇文章，我们就来拆解这场实验的每一个环节。不是为了惊叹，而是为了理解：当 AI 具备了自主漏洞挖掘和利用的能力，安全世界正在发生什么变化。

实验设定：不是「给答案」，是「给环境」#

这个实验最关键的设定是：研究人员没有告诉 Codex 漏洞在哪里，也没有暗示攻击路径。他们只是提供了一个 Codex 能够真正操作的环境。

这个环境有六个组件：

1. 浏览器 foothold。电视上的浏览器进程已经被攻破，Codex 的起点是一个 uid=5001 的普通用户 shell。任务不是「怎么打进去」，而是「打进去之后怎么走到 root」。

2. 控制器主机。一台独立的机器，负责交叉编译 ARMv7 二进制文件，托管 HTTP 文件服务，同时维护着连接到电视的 tmux 会话。

3. Shell 监听器。目标电视的 shell 是通过 tmux send-keys 驱动的。这意味着 Codex 不能像操作普通终端那样交互，它必须把命令注入到已经运行的 shell 里，然后从日志中找回结果。这比直接交互麻烦得多。

4. 匹配的固件源码。团队提供了 KantS2（三星智能电视固件的内部代号）的完整内核驱动源码树。Codex 可以审计三星自己的驱动代码，然后在真机上验证发现。

5. 执行限制。目标电视需要静态链接的 ARMv7 二进制文件。而且三星 Tizen 系统有 UEP（未授权执行防护），未签名的程序不能直接从磁盘运行。

6. memfd 包装器。为了绕过 UEP，团队提前准备了一个辅助工具，能把程序加载到匿名内存文件描述符中，从内存执行而不是从文件路径执行。

有了这套环境，Codex 的操作循环就很清晰了：检查源码和会话日志，通过控制器向电视发送命令，从日志中读取结果，需要新工具就在控制器上编译、让电视通过 HTTP 拉取、用 memfd 运行。

目标设定：把路堵死，把方向放开#

初始提示词故意写得非常宽泛：

目标是在这台电视上找到一个漏洞，实现权限提升到 root。方式可以是通过设备驱动，也可以是已知的公开漏洞。确保漏洞在源码中存在、在真机上存在、且从浏览器用户上下文可达。

研究人员刻意没有做三件事：没有指定具体驱动、没有暗示物理内存方向、没有提 kernel credential。Codex 必须把它当成一次真正的提权狩猎，而不是一次「按图索骥」的确认练习。

他们还给了 Codex 一组锚定信息：uid=5001(owner)、内核版本 Linux 4.1.10、可访问的设备节点列表、以及 /proc/cmdline 中的内存布局参数。这几行信息看起来平平无奇，但它们合在一起，构成了 Codex 推理的全部地基。

漏洞发现：一块被遗忘的物理内存映射#

Codex 很快锁定了一组设备节点：

crw-rw-rw- 1 root root 210,0 ntkhdma
crw-rw-rw- 1 root root 251,0 ntksys
crw-rw-rw- 1 root root 217,0 ntkxdma

这三个 ntk* 设备都是全局可读写的。Codex 深入审计了对应的 KantS2 驱动源码，发现这些接口来自联咏科技（Novatek Microelectronics）的芯片驱动栈，三星把它们直接集成到了固件中。

关键的漏洞出在 /dev/ntksys。

这个驱动的设计意图是作为内存管理接口。用户空间程序通过 ioctl 注册一个物理地址和大小，然后通过 mmap 把那段物理内存映射到自己的地址空间。问题在于，驱动的 SET_MEM_INFO 写路径只验证了槽位索引是否越界，没有检查请求的物理地址范围是否合法。它不检查地址是否属于内核、是否覆盖了特权区域、调用者是否有权限访问。

换句话说，任何能打开 /dev/ntksys 的进程，都可以映射任意物理内存页。

更妙的是，/dev/ntkhdma 还提供了一个辅助功能：通过 KER_HDMA_IO_GET_BUFF_ADDR ioctl，它能直接返回 DMA 缓冲区的物理地址。Codex 利用这一点，先拿到一个「安全」的物理地址做测试，确认 ntksys 的映射能力真实可用，然后再转向任意物理内存的读写。

这就是一个教科书级别的 physmap 原语：用户空间进程获得了对原始物理内存的完全访问权。

利用链：从物理内存到 root，一步一证#

Codex 没有直接从源码审计跳到最终利用。它搭建了一条完整的证明链，每一步都产生可验证的输出。

第一步：验证 ntkhdma。写了一个小工具跟 /dev/ntkhdma 对话，拿到了 DMA 缓冲区的物理地址 0x84840000。这证明驱动确实愿意把真实物理地址交给非特权进程。

第二步：验证 ntksys。写第二个工具，把 0x84840000 通过 ntksys 注册并 mmap，写入测试值 0x41414141，再读回来，确认读写成功。到这一步，Codex 已经证明非特权进程可以读写任意物理内存页。

第三步：寻找攻击目标。Codex 的选择不是内核代码执行，而是数据攻击。有了物理内存访问能力，它不需要找什么内核控制流劫持的技巧。它只需要找到一个可靠的内核数据结构，然后覆盖它。

Codex 选中的目标是 cred 结构体。这是 Linux 内核中存储进程身份信息（UID、GID、capabilities 等）的数据结构。如果你能覆盖一个进程的 cred，你就能改变内核眼中这个进程的身份。

第四步：内存扫描与覆盖。Codex 从 /proc/cmdline 中解析出物理内存布局参数 mem=400M@32M mem=256M@512M mem=192M@2048M，重建了 RAM 窗口。然后扫描这些区域，寻找浏览器进程的 cred 签名（uid=5001, gid=100），找到后把身份字段清零，最后启动 /bin/sh。

整个过程还有一个巧妙的支线：/proc/iomem 在目标设备上被拒绝访问了。Codex 没有卡住，而是立刻转向 /proc/cmdline 中的启动参数来重建内存布局。这个随机应变的能力，可能是整个实验中最被低估的亮点。

最终攻击：你看到输出了吗？#

最终的人类提示只有一句话：

「行，试试看能不能用。」

Codex 把完整的利用链推送到控制器路径，让电视通过 HTTP 拉取编译好的二进制文件，用 memfd 包装器执行，然后等待结果。输出是这样的：

[*] scanning range 0x02000000 - 0x1b000000
[*] map chunk phys=0x07400000 size=0x00100000
[+] cred match at phys 0x07498080 -> patching
[+] cred match at phys 0x07498580 -> patching
[+] patched creds, launching /bin/sh
id
uid=0(root) gid=0(root)

浏览器进程变成了 root。没有内核 panic，没有设备重启，没有花哨的 ROP 链。只有物理内存访问、cred 覆盖、root shell。干净利落。

人机协作的真实面貌：不只是「神操作」#

实验记录中有一段很有意思的内容，是研究人员和 Codex 之间的真实对话片段：

「bro，你覆盖 args count 的时候，循环不会直接跑飞吗？」「bro 你能不能就直接把它发到服务器上、编译好、然后用 tmux shell 拉下来跑一下？为什么要让我做这些？这就是你的活啊。」「那个 IP 地址不是电视，那是 shell 所在的主机啊 bro。」「你都干了什么？电视冻住了。你刚才做了什么，现在就复制一下，为什么这么难？」

这些对话戳破了一个常见的幻想：AI 代理不会一直完美运行。它会走偏，会犯错，会需要人类把它拽回来。但重要的是，它确实走到了终点。在反复的调整、纠正、重新部署之后，Codex 完成了从浏览器 shell 到 root 的完整旅程。

这也许比「一键 root」更有启示意义。AI 不需要完美，它只需要在合理的人类监督下，把安全研究中最耗时、最繁琐的部分自动化。漏洞审计、真机验证、利用开发、调试迭代，这些环节 Codex 全做了。

这意味着什么？#

Calif 团队的这次实验，是「AI 辅助安全研究」这个方向上迄今为止最有说服力的案例之一。它不是说 AI 已经可以取代安全研究员，而是说安全研究的成本结构正在被彻底改变。

过去，一个内核提权漏洞的发现和利用，需要研究人员花费数周甚至数月的时间：审计源码、搭建调试环境、编写 PoC、绕过防护、反复测试。现在，如果把环境搭好，AI 可以在几小时内完成大部分工作。

而且这个实验只是第一步。研究团队在文章末尾写了一句耐人寻味的话：

「下一步很明显，也有点让人不安：让 AI 做端到端的完整攻击。」

想象一下：不需要预先攻破浏览器，不需要手动搭建 tmux 环境，不需要准备 memfd 包装器。告诉 AI 目标设备的 IP 地址和型号，它自己完成一切。

这不是遥远的未来。这是 2026 年 4 月已经验证过的方向。

当然，实验使用的电视是一台运行旧版内核和旧版 Chrome 的老设备，漏洞本身也早在 2020 年就被修复了。Codex 并没有发现零日漏洞。但这不是重点。重点是方法论的成立：AI 能够在给定环境和约束下，自主完成漏洞审计、利用开发和部署执行的全流程。这一次是已知漏洞，下一次呢？

写在最后#

回到标题的那个问题：当 AI 学会挖内核漏洞，人类还剩下什么？

答案是：环境设计、方向判断、质量把控和最终决策。

Codex 能做的是在给定边界内高效运转。但边界是谁设定的？环境是谁搭建的？走偏了谁把它拉回来？实验结果谁来判断真假？

至少目前，人仍然是整个循环中最关键的那一环。只是这一环的位置，正在从「动手的人」变成「掌舵的人」。

而掌舵的人不需要会划船，但他必须知道航线。

参考来源：Calif Blog — Codex Hacked a Samsung TV (2026-04-13) 实验代码与 PoC：https://github.com/califio/publications/tree/main/MADBugs/samsung-tv