给你的 AI 编程助手装一个「智能调度员」：Weave Router 深度解析

Sat, 27 Jun 2026 09:00:00 +0800

一个让你肉疼的场景

凌晨两点，你刚让 Codex 帮你修了一个小小的拼写错误。它用了 GPT-5.5。成本：$0.38。

上午十点，你让 Claude Code 帮你检查一下代码风格。它用了 Opus 4.8。成本：$0.52。

下午三点，Cursor 帮你补全了一行 import 语句。它可能也调了顶级模型。成本：你不确定，但你隐约觉得不对劲。

这些场景每天都在数以万计的开发者电脑上发生。AI 编程助手让我们效率翻倍，但也让 API 账单悄悄膨胀。问题出在哪？你只用一把「牛刀」杀了所有的「鸡」。

细看一个典型的 AI 编程会话：有时你在描述复杂架构，有时你只是让它重命名一个变量。这两种场景对模型能力的要求天差地别，但你为它们付了同样的费用。

这个问题的解法很直观：不同难度的任务，用不同级别的模型。 但这说来容易做起来难。谁来判定？怎么判定？手动切换模型吗？一天切换几十次？

六月底，Hacker News 上一个项目悄然走红，收获了 140 个推荐和 88 条讨论。它就是 Weave Router，一个为 AI 编程助手量身打造的智能模型路由器。

Weave Router 的核心理念非常简洁：它像一个透明的代理，插在你的编程助手和 AI 服务商之间。每个 API 请求经过它时，它会实时判断这个请求该交给哪个模型处理，然后帮你做出最优选择，全程你不需要做任何事。

这可不是简单的「检查关键词」或「启发式规则」。Weave Router 用的是强化学习。

背后的逻辑是这样的：Weave 团队收集了上万个真实编程场景的 Agent 执行轨迹（traces），包括请求内容、最终任务是否成功完成、用了多少 Token 等。他们以此训练了一个路由模型，奖励机制很简单：选对了模型，任务成功完成，加分；选了过强或过弱的模型导致浪费或失败，扣分。

训练完成后，这个路由模型能够在接收到新请求时，快速判断出用哪个模型最合适。具体来说：

这不是凭感觉切换，而是基于成千上万个真实案例训练出来的决策。决策依据来自请求内容的语义特征，而非关键词匹配或硬编码规则。