AI 编程工具，到底该用哪个？

用 AI 写代码这件事，这两年已经从"极客的玩具"变成了几乎所有人都在用的日常。但我观察到一个挺有意思的反差：用的人越来越多，真心信它的人反而越来越少。JetBrains 在 2026 年初做过一次上万名专业开发者的调查，九成的人每天工作里都离不开 AI 工具；可几乎同一时间，Stack Overflow 那份覆盖近五万名开发者的调查里，有 46% 的人明确说"我并不信任 AI 写出来的东西"，真心觉得它靠谱的反倒只有三成出头。

这两个数字放一起，恰恰说明了 AI 编程现在真实的样子：它强到你绕不开，但又远没到"按一下就交付"的程度。我自己的体会是，它更像一个能力极强、上手极快、但你必须盯着的实习生——它能帮你飞快地把活儿干个七八成，可哪里偷工减料、哪里想当然，得你自己看出来。也正因如此，我一直觉得，真正值得花时间投资的，是"怎么把需求讲清楚、怎么验收它的产出、怎么把这些工具串成自己的工作流"这套思维，而不是死磕某一个具体工具。工具下个月可能就改名、改价、被收购了，思维不会。

还得把话说在前头，这篇我有明确的偏向：我真正看重的，是那些能自主干活的工具和模型——国外的 Claude Code、Codex，国内的 GLM、Kimi，以及 Qoder 这类。至于 GitHub Copilot 那种纯代码补全工具，在我看来已经是上一个时代的东西，跟上面这批根本不在一个维度，下面我不会花太多篇幅在它身上。尤其要说的是，好用的早就不全是国外货了——这两年国产追得很猛，智谱 GLM、月之暗面 Kimi 都已经站进第一梯队，国内用户更该重点关注。

下面聊到价格时，国外工具基本按美元算、国产按人民币算，个别国产工具的国际版用美元定价，我会随手注明。价格这两年变得很快，文中都是 2026 年 6 月的口径。

先把工具分成三档

市面上的工具五花八门，但你真正会遇到的，按"它能多大程度自己干活"大致就三档，能力和价格基本是顺着这条线往上走的。

最低一档是补全和对话型：在编辑器里给你灰色的补全建议，或者开个侧边栏跟你聊。经典代表就是 GitHub Copilot，国产的各种灵码类插件早期也大多是这形态。这一档门槛最低，但说句实话，它已经被后面两档甩开了——今天真正能把生产力拉上去的，是能读懂整个项目、自己动手干的智能体，而不是在你打字时提示几行代码的补全。

往上一档是编辑器里的多文件智能体：它能读懂你整个项目、跨好几个文件一起改、还能自己跑命令看结果对不对。Cursor、Windsurf，以及 Copilot 和 Codex 的 Agent 模式都属于这一档。这是目前生产力真正能跃一个台阶的主力形态。

最高一档是终端或云端的自主智能体：在命令行或者云上跑，能顺着一条长链路自己干——读代码、改、测、再修。Claude Code、OpenAI Codex、Devin 是代表。这一档最强，也最"烧 token"，前提是你得会给指令、会验收，不然它跑偏了你都不知道。

这篇我的重心，就放在第 2、3 档——能自主干活的那批。第 1 档你了解一下就够了，不必专门停在上面练。

国外这几个，值得知道

先说我最推荐的 Claude Code。它是这两年资深开发者圈里冒出来的黑马，形态是终端命令行里的自主编码智能体（也有编辑器集成），特别能扛长链路的活儿和大型代码库。在偏资深、创业团队为主的开发者调查里，它 2025 年 5 月才发布，八个月就冲到了"最常用"和"最受喜爱"双第一。它不单独卖，含在 Claude Pro 订阅里（20 美元一个月，年付合 17，预付是 200），用量大就上 Claude Max，从 100 美元起，给你五倍到二十倍的额度。注意免费档能聊天能生成代码，但不含 Claude Code。如果你能把需求写清楚、舍得花时间验收，它是我心里"自己干活"这一档的天花板。

和它并列的是 OpenAI Codex，特点是不单独收费、跟着 ChatGPT 订阅走。它给你 Chat、Agent、Agent 全权限三档自主度，从纯对话到几乎全自主，VS Code、Cursor、Windsurf、JetBrains 全家都能接，三大系统通吃。价格含在各级 ChatGPT 里——Plus 20 美元一个月，Pro 从 100 起。它 2026 年 4 月也改成了按 token 的 Credits 计费，官方说单个任务大概消耗几个到几十个 Credits，一个人每月平摊下来百来美元，用得越狠花得越多。本来就在用 ChatGPT 的人，顺手把它的编码智能体开起来最划算。

如果你更习惯"在编辑器里写"，那 Cursor 是这一派的代表。它基于 VS Code，强项是"读懂整个项目、跨文件一把改"的 Agent 体验，还有那个特别顺手的 Tab 补全。免费的 Hobby 档不用绑卡就能用，Pro 从 20 美元一个月起，团队版 40 美元一个人。计费 2025 年 6 月变过一次，Pro 不再按请求次数算，而是含每月 20 美元的模型用量额度——Tab 和 Auto 模式随便用，前沿模型按 API 成本扣那 20 美元，不够再加购。网上传的"Pro 16 美元"其实是年付折下来的等效价，别被误导。

Windsurf 现在已经被 Cognition 收购、并进了 Devin，原来的 windsurf.com 直接跳到 devin.ai 了。它还留着免费档，Pro 是 20 美元一个月，能用上前沿模型和 Devin 的云端 agent。想要"编辑器加云端 agent"一体化的团队，可以看它。

最后说说 GitHub Copilot。它确实是普及度第一、几乎人人都知道的名字，补全、聊天、多文件编辑、Agent 模式现在也都有，IDE 生态最成熟。但我得把话讲明白：它起家就是个代码补全工具，骨子里还是"在你写的时候给点提示"那一套，就算后来补上了 Agent 模式，跟 Claude Code、Codex 这种能自己扛完一整个任务的智能体也不在一个维度。价格上它有免费档（每月两千次补全加五十次聊天），Pro 10 美元一个月、Pro+ 39 美元，2026 年 6 月起改成按用量的 AI Credits 计费。结论很简单：你要的只是主流 IDE 里一个稳定的补全，它够用；但要论"能自主干活"，它已经不是这场比赛的主角了。

国内这几个，别小看

国产工具更新和改名都很勤，下面这些是 2026 年中的口径。

通义灵码 是阿里这边的，现在已经更名叫 Qoder CN，2026 年 5 月 20 日改成了 Credits 计费。社区版免费，给有限的补全和对话外加 300 个 Credits 起步；个人专业版 59 元一个月（2000 Credits）；企业标准版 99 元一个席位一个月，再往上还有 199 元的 VPC 版，五十席起售、适合要私有化的团队。它通常绑阿里自家的 Qwen 代码模型。国内团队、看重中文支持和不用翻墙就能用的，从它的免费档起步很顺。

百度文心快码 Comate 最大的卖点是个人标准版的代码补全完全免费，智能体功能另外按"请求券"算。企业版分两档，专业版 358 元一个月（也有按季 1074、按年 3998 的），旗舰版 2500 元一年，都会每月送点请求券。想要"补全白嫖"、国内开箱即用的，它合适。

腾讯 CodeBuddy 的定价页是按美元的：个人 Pro 在做促销，9.95 美元一个月（原价 19.90），含每月一千个 credits；团队版 40 美元一个席位。它的定价页没列免费档，也没点名底层用的是哪个大模型。腾讯云生态里的人、需要团队协作的，可以考虑。

字节 Trae 走的是低价路线，国际版 Lite 才 3 美元一个月、Pro 10 美元（Pro 还送七天试用），2026 年 2 月底起也改成了按 token 计费。国内版按官网人民币口径来。预算敏感、就想花点小钱用上 AI 编辑器的，它门槛最低。

除了上面这几个大厂的，还有三个国产工具我觉得值得单独点一下。智谱 CodeGeeX 个人有免费档，付费走智谱的 GLM Coding Plan，20 元一个月起，底子是智谱自家的 GLM 模型。讯飞 iFlyCode（星火飞码） 基于讯飞星火大模型，团队版 129 元一人一个月起，个人想试的话可以先免费用着。字节豆包 MarsCode 目前是免费的——这里要专门提醒一句，网上传的 68、200、500 那套价是"豆包 App"的会员价，跟 MarsCode 不是一回事，别搞混了。

懒得读全文，看这张表就够了

先把币种说清楚：下面 $ 是美元、元/¥ 是人民币；其中腾讯 CodeBuddy 和字节 Trae 这两个国产工具，列的是它们国际版的美元定价。

工具	免费档	付费起步价	计费特点	形态 / 集成	适合人群
GitHub Copilot	有（2000 补全 + 50 聊天/月）	Pro $10/月，Pro+$ 39/月	2026-06 起转用量 Credits	补全/对话/多文件/Agent；VS Code、JetBrains 等	只想要 IDE 里的稳定补全
Cursor	有（Hobby）	Pro 从 $20/月，Teams$ 40/席	含 $20 用量额度	AI 原生编辑器、多文件 Agent	重度 Agent 用户
Claude Code	不含（免费档无 Claude Code）	含于 Claude Pro $20/月（年付合$ 17），Max 从 $100/月	随订阅用量	终端/编辑器自主 agent	中高阶、长链路自动化
OpenAI Codex	有（随 ChatGPT Free）	随 ChatGPT Plus $20/月、Pro 从$ 100/月	2026-04 起 token Credits	Chat/Agent/全自主；多 IDE	已用 ChatGPT 的人
Windsurf（Devin）	有（Free $0）	Pro $20/月	含云端 agent 额度	编辑器 + 云端 agent	一体化团队
通义灵码 / Qoder CN	有（社区版，300 Credits）	Pro 59 元/月，企业 99 元/席起	Credits 计费	补全/对话/Agent；中文友好	国内个人/团队
百度文心快码 Comate	有（补全完全免费）	企业 ¥3998/年起	补全免费 + Agent 请求券	补全/Agent；国内开箱即用	看重免费补全
腾讯 CodeBuddy	官方页未列	Pro 促销 $9.95/月，团队$ 40/席	credits	腾讯云生态	腾讯云用户/团队
字节 Trae	国内版另计	Lite $3/月，Pro$ 10/月	2026-02 起 token 计费	AI 编辑器；价格低	预算敏感个人
智谱 CodeGeeX	有	GLM Coding Plan 20 元/月起	随套餐	补全/对话；GLM 模型	国内个人
讯飞 iFlyCode	可免费试	团队 129 元/人·月起	随套餐	补全/对话；星火模型	国内团队
豆包 MarsCode	免费	—	目前免费	AI 编辑器；国内可达	零成本上手

它到底有多聪明

一个工具聪不聪明，很大程度上取决于它背后接的是哪个大模型。衡量这件事，目前业内最认的公开考卷是 SWE-bench——简单说，就是把真实开源项目里的 GitHub 问题丢给模型，看它能解掉多少。后来还出了更难、更防"背题"的升级版，专治那种题目太简单、被模型提前见过的情况。

在 Scale AI 用统一脚手架跑出来的一份公开榜上（成绩是 2026 年 6 月初的），前几名长这样：

排名	模型	得分
1	GPT-5.4 (xHigh)	59.1%
2	Muse Spark	55.0%
3	Claude Opus 4.6 (thinking)	51.9%
4	Gemini 3.1 Pro (thinking)	46.1%

我想强调的不是这个排名，而是两件容易被忽略的事。

第一，别太拿那零点几个百分点当回事。前三名的误差范围其实是互相重叠的，统计上就是咬得很紧的一团，不能简单说"第一名碾压第三名"。第二，不同口径的分数压根不能放一起比。上面是统一脚手架下的成绩，厂商拿自家脚手架报的分往往高得多（比如有的模型自报能到六七成），那是另一把尺子，跟这张榜不是一回事。看分数，永远要先确认是不是"同一套脚手架、同一份题"。

所以对刚入门的人，我的实操结论很直白：主流的前沿模型——GPT、Claude、Gemini，还有下面要说的国产 GLM、Kimi、Qwen——能力都在第一梯队，真正把人和人拉开的不是模型差那几分，而是你会不会用。

国产模型也能打

说到国产模型，现在我会重点推荐两个，都是 2026 年 6 月刚放出来的。

一个是智谱的 GLM-5.2——就是前面 CodeGeeX 背后那家。它最大的卖点是把上下文做到了真正可用的 100 万 token，意味着能把一个完整代码库整个塞进去让它读，写多文件、改大项目时特别顶用；而且按 MIT 协议开源，谁都能拿去自己部署，订阅走 GLM Coding Plan、20 元起就能用上，性价比在国产里很突出。

另一个是月之暗面的 Kimi（最新的 K2.7 Code）。它专门冲着编程和"长链路自己干活"去——能扛十几个小时的自主任务、一口气改几千行代码，最新这版还把推理消耗的 token 又压下去三成，更省钱，同样是开源的。

再加上更早就证明过自己的阿里 Qwen3-Coder，国产模型这条线现在的状态很清楚：底层早就不是"凑合用用"，第一梯队里已经有它们的位置。对国内用户来说，中文场景更顺、不用翻墙也能稳定访问，这反而是实打实的优势。

我会怎么帮你选

如果你是零基础、刚上手、预算也紧，别再走"先用补全工具练手"的老路了——直接上能自主干活的智能体。想免费起步，Qoder CN 的社区版、豆包 MarsCode 都能白嫖到 Agent 能力；预算再松一点，国内接 GLM、Kimi 的工具（GLM Coding Plan 20 元起）、国外的 Claude Code 或 Codex（各 20 美元一个月）都值得直接上。一开始就把"描述需求 → 看产出 → 读报错 → 再交代"这个闭环放在真能干活的工具上练，比在补全工具上磨蹭进步快得多。

如果你主要在国内开发、看重中文和免代理可达，我会让你优先看 Qoder CN、文心快码、CodeBuddy、Trae 这些国产工具，本地化和访问都省心得多。

如果你就想要最强的"自己干活"体验，那上 Claude Code 或 OpenAI Codex，前提是你得做好"会给指令、会验收、token 要花钱"的心理准备。

如果你离不开多文件重构、又喜欢 AI 原生编辑器，Cursor 或 Windsurf（Devin）二选一。

如果你是企业或团队，那就按生态和合规来挑——国外有 Cursor 团队版、Claude Code 和 Codex 的团队方案，国内有 Qoder CN、文心快码的企业版和 CodeBuddy 团队版，要私有化的话还有 VPC 版可选（GLM-5.2 走 MIT 开源、能自部署，对数据敏感的团队尤其值得看）。

最后

工具会一直变，价格会一直调，文中的数字是 2026 年中的行情。但有一件事不会过时：怎么把需求讲清楚、怎么验收 AI 的产出、怎么把它们搭成自己顺手的工作流——这套思维，换哪个工具都通用。所以我的建议始终是同一句：先投资思维，再追工具。