AI 编程工具,到底该用哪个?

用 AI 写代码这件事,这两年已经从"极客的玩具"变成了几乎所有人都在用的日常。但我观察到一个挺有意思的反差:用的人越来越多,真心信它的人反而越来越少。JetBrains 在 2026 年初做过一次上万名专业开发者的调查,九成的人每天工作里都离不开 AI 工具;可几乎同一时间,Stack Overflow 那份覆盖近五万名开发者的调查里,有 46% 的人明确说"我并不信任 AI 写出来的东西",真心觉得它靠谱的反倒只有三成出头。

这两个数字放一起,恰恰说明了 AI 编程现在真实的样子:它强到你绕不开,但又远没到"按一下就交付"的程度。我自己的体会是,它更像一个能力极强、上手极快、但你必须盯着的实习生——它能帮你飞快地把活儿干个七八成,可哪里偷工减料、哪里想当然,得你自己看出来。也正因如此,我一直觉得,真正值得花时间投资的,是"怎么把需求讲清楚、怎么验收它的产出、怎么把这些工具串成自己的工作流"这套思维,而不是死磕某一个具体工具。工具下个月可能就改名、改价、被收购了,思维不会。

还得把话说在前头,这篇我有明确的偏向:我真正看重的,是那些能自主干活的工具和模型——国外的 Claude Code、Codex,国内的 GLM、Kimi,以及 Qoder 这类。至于 GitHub Copilot 那种纯代码补全工具,在我看来已经是上一个时代的东西,跟上面这批根本不在一个维度,下面我不会花太多篇幅在它身上。尤其要说的是,好用的早就不全是国外货了——这两年国产追得很猛,智谱 GLM、月之暗面 Kimi 都已经站进第一梯队,国内用户更该重点关注。

下面聊到价格时,国外工具基本按美元算、国产按人民币算,个别国产工具的国际版用美元定价,我会随手注明。价格这两年变得很快,文中都是 2026 年 6 月的口径。

先把工具分成三档

市面上的工具五花八门,但你真正会遇到的,按"它能多大程度自己干活"大致就三档,能力和价格基本是顺着这条线往上走的。

最低一档是补全和对话型:在编辑器里给你灰色的补全建议,或者开个侧边栏跟你聊。经典代表就是 GitHub Copilot,国产的各种灵码类插件早期也大多是这形态。这一档门槛最低,但说句实话,它已经被后面两档甩开了——今天真正能把生产力拉上去的,是能读懂整个项目、自己动手干的智能体,而不是在你打字时提示几行代码的补全。

往上一档是编辑器里的多文件智能体:它能读懂你整个项目、跨好几个文件一起改、还能自己跑命令看结果对不对。Cursor、Windsurf,以及 Copilot 和 Codex 的 Agent 模式都属于这一档。这是目前生产力真正能跃一个台阶的主力形态。

最高一档是终端或云端的自主智能体:在命令行或者云上跑,能顺着一条长链路自己干——读代码、改、测、再修。Claude Code、OpenAI Codex、Devin 是代表。这一档最强,也最"烧 token",前提是你得会给指令、会验收,不然它跑偏了你都不知道。

这篇我的重心,就放在第 2、3 档——能自主干活的那批。第 1 档你了解一下就够了,不必专门停在上面练。

国外这几个,值得知道

先说我最推荐的 Claude Code。它是这两年资深开发者圈里冒出来的黑马,形态是终端命令行里的自主编码智能体(也有编辑器集成),特别能扛长链路的活儿和大型代码库。在偏资深、创业团队为主的开发者调查里,它 2025 年 5 月才发布,八个月就冲到了"最常用"和"最受喜爱"双第一。它不单独卖,含在 Claude Pro 订阅里(20 美元一个月,年付合 17,预付是 200),用量大就上 Claude Max,从 100 美元起,给你五倍到二十倍的额度。注意免费档能聊天能生成代码,但不含 Claude Code。如果你能把需求写清楚、舍得花时间验收,它是我心里"自己干活"这一档的天花板。

和它并列的是 OpenAI Codex,特点是不单独收费、跟着 ChatGPT 订阅走。它给你 Chat、Agent、Agent 全权限三档自主度,从纯对话到几乎全自主,VS Code、Cursor、Windsurf、JetBrains 全家都能接,三大系统通吃。价格含在各级 ChatGPT 里——Plus 20 美元一个月,Pro 从 100 起。它 2026 年 4 月也改成了按 token 的 Credits 计费,官方说单个任务大概消耗几个到几十个 Credits,一个人每月平摊下来百来美元,用得越狠花得越多。本来就在用 ChatGPT 的人,顺手把它的编码智能体开起来最划算。

如果你更习惯"在编辑器里写",那 Cursor 是这一派的代表。它基于 VS Code,强项是"读懂整个项目、跨文件一把改"的 Agent 体验,还有那个特别顺手的 Tab 补全。免费的 Hobby 档不用绑卡就能用,Pro 从 20 美元一个月起,团队版 40 美元一个人。计费 2025 年 6 月变过一次,Pro 不再按请求次数算,而是含每月 20 美元的模型用量额度——Tab 和 Auto 模式随便用,前沿模型按 API 成本扣那 20 美元,不够再加购。网上传的"Pro 16 美元"其实是年付折下来的等效价,别被误导。

Windsurf 现在已经被 Cognition 收购、并进了 Devin,原来的 windsurf.com 直接跳到 devin.ai 了。它还留着免费档,Pro 是 20 美元一个月,能用上前沿模型和 Devin 的云端 agent。想要"编辑器加云端 agent"一体化的团队,可以看它。

最后说说 GitHub Copilot。它确实是普及度第一、几乎人人都知道的名字,补全、聊天、多文件编辑、Agent 模式现在也都有,IDE 生态最成熟。但我得把话讲明白:它起家就是个代码补全工具,骨子里还是"在你写的时候给点提示"那一套,就算后来补上了 Agent 模式,跟 Claude Code、Codex 这种能自己扛完一整个任务的智能体也不在一个维度。价格上它有免费档(每月两千次补全加五十次聊天),Pro 10 美元一个月、Pro+ 39 美元,2026 年 6 月起改成按用量的 AI Credits 计费。结论很简单:你要的只是主流 IDE 里一个稳定的补全,它够用;但要论"能自主干活",它已经不是这场比赛的主角了。

国内这几个,别小看

国产工具更新和改名都很勤,下面这些是 2026 年中的口径。

通义灵码 是阿里这边的,现在已经更名叫 Qoder CN,2026 年 5 月 20 日改成了 Credits 计费。社区版免费,给有限的补全和对话外加 300 个 Credits 起步;个人专业版 59 元一个月(2000 Credits);企业标准版 99 元一个席位一个月,再往上还有 199 元的 VPC 版,五十席起售、适合要私有化的团队。它通常绑阿里自家的 Qwen 代码模型。国内团队、看重中文支持和不用翻墙就能用的,从它的免费档起步很顺。

百度文心快码 Comate 最大的卖点是个人标准版的代码补全完全免费,智能体功能另外按"请求券"算。企业版分两档,专业版 358 元一个月(也有按季 1074、按年 3998 的),旗舰版 2500 元一年,都会每月送点请求券。想要"补全白嫖"、国内开箱即用的,它合适。

腾讯 CodeBuddy 的定价页是按美元的:个人 Pro 在做促销,9.95 美元一个月(原价 19.90),含每月一千个 credits;团队版 40 美元一个席位。它的定价页没列免费档,也没点名底层用的是哪个大模型。腾讯云生态里的人、需要团队协作的,可以考虑。

字节 Trae 走的是低价路线,国际版 Lite 才 3 美元一个月、Pro 10 美元(Pro 还送七天试用),2026 年 2 月底起也改成了按 token 计费。国内版按官网人民币口径来。预算敏感、就想花点小钱用上 AI 编辑器的,它门槛最低。

除了上面这几个大厂的,还有三个国产工具我觉得值得单独点一下。智谱 CodeGeeX 个人有免费档,付费走智谱的 GLM Coding Plan,20 元一个月起,底子是智谱自家的 GLM 模型。讯飞 iFlyCode(星火飞码) 基于讯飞星火大模型,团队版 129 元一人一个月起,个人想试的话可以先免费用着。字节豆包 MarsCode 目前是免费的——这里要专门提醒一句,网上传的 68、200、500 那套价是"豆包 App"的会员价,跟 MarsCode 不是一回事,别搞混了。

懒得读全文,看这张表就够了

先把币种说清楚:下面 $ 是美元、/¥ 是人民币;其中腾讯 CodeBuddy 和字节 Trae 这两个国产工具,列的是它们国际版的美元定价。

工具免费档付费起步价计费特点形态 / 集成适合人群
GitHub Copilot有(2000 补全 + 50 聊天/月)Pro 10/月,Pro+10/月,Pro+ 39/月2026-06 起转用量 Credits补全/对话/多文件/Agent;VS Code、JetBrains 等只想要 IDE 里的稳定补全
Cursor有(Hobby)Pro 从 20/月,Teams20/月,Teams 40/席含 $20 用量额度AI 原生编辑器、多文件 Agent重度 Agent 用户
Claude Code不含(免费档无 Claude Code)含于 Claude Pro 20/月(年付合20/月(年付合17),Max 从 $100/月随订阅用量终端/编辑器自主 agent中高阶、长链路自动化
OpenAI Codex有(随 ChatGPT Free)随 ChatGPT Plus 20/月、Pro20/月、Pro 从 100/月2026-04 起 token CreditsChat/Agent/全自主;多 IDE已用 ChatGPT 的人
Windsurf(Devin)有(Free $0)Pro $20/月含云端 agent 额度编辑器 + 云端 agent一体化团队
通义灵码 / Qoder CN有(社区版,300 Credits)Pro 59 元/月,企业 99 元/席起Credits 计费补全/对话/Agent;中文友好国内个人/团队
百度文心快码 Comate有(补全完全免费)企业 ¥3998/年起补全免费 + Agent 请求券补全/Agent;国内开箱即用看重免费补全
腾讯 CodeBuddy官方页未列Pro 促销 9.95/月,团队9.95/月,团队 40/席credits腾讯云生态腾讯云用户/团队
字节 Trae国内版另计Lite 3/月,Pro3/月,Pro 10/月2026-02 起 token 计费AI 编辑器;价格低预算敏感个人
智谱 CodeGeeXGLM Coding Plan 20 元/月起随套餐补全/对话;GLM 模型国内个人
讯飞 iFlyCode可免费试团队 129 元/人·月起随套餐补全/对话;星火模型国内团队
豆包 MarsCode免费目前免费AI 编辑器;国内可达零成本上手

它到底有多聪明

一个工具聪不聪明,很大程度上取决于它背后接的是哪个大模型。衡量这件事,目前业内最认的公开考卷是 SWE-bench——简单说,就是把真实开源项目里的 GitHub 问题丢给模型,看它能解掉多少。后来还出了更难、更防"背题"的升级版,专治那种题目太简单、被模型提前见过的情况。

在 Scale AI 用统一脚手架跑出来的一份公开榜上(成绩是 2026 年 6 月初的),前几名长这样:

排名模型得分
1GPT-5.4 (xHigh)59.1%
2Muse Spark55.0%
3Claude Opus 4.6 (thinking)51.9%
4Gemini 3.1 Pro (thinking)46.1%

我想强调的不是这个排名,而是两件容易被忽略的事。

第一,别太拿那零点几个百分点当回事。前三名的误差范围其实是互相重叠的,统计上就是咬得很紧的一团,不能简单说"第一名碾压第三名"。第二,不同口径的分数压根不能放一起比。上面是统一脚手架下的成绩,厂商拿自家脚手架报的分往往高得多(比如有的模型自报能到六七成),那是另一把尺子,跟这张榜不是一回事。看分数,永远要先确认是不是"同一套脚手架、同一份题"。

所以对刚入门的人,我的实操结论很直白:主流的前沿模型——GPT、Claude、Gemini,还有下面要说的国产 GLM、Kimi、Qwen——能力都在第一梯队,真正把人和人拉开的不是模型差那几分,而是你会不会用。

国产模型也能打

说到国产模型,现在我会重点推荐两个,都是 2026 年 6 月刚放出来的。

一个是智谱的 GLM-5.2——就是前面 CodeGeeX 背后那家。它最大的卖点是把上下文做到了真正可用的 100 万 token,意味着能把一个完整代码库整个塞进去让它读,写多文件、改大项目时特别顶用;而且按 MIT 协议开源,谁都能拿去自己部署,订阅走 GLM Coding Plan、20 元起就能用上,性价比在国产里很突出。

另一个是月之暗面的 Kimi(最新的 K2.7 Code)。它专门冲着编程和"长链路自己干活"去——能扛十几个小时的自主任务、一口气改几千行代码,最新这版还把推理消耗的 token 又压下去三成,更省钱,同样是开源的。

再加上更早就证明过自己的阿里 Qwen3-Coder,国产模型这条线现在的状态很清楚:底层早就不是"凑合用用",第一梯队里已经有它们的位置。对国内用户来说,中文场景更顺、不用翻墙也能稳定访问,这反而是实打实的优势。

我会怎么帮你选

如果你是零基础、刚上手、预算也紧,别再走"先用补全工具练手"的老路了——直接上能自主干活的智能体。想免费起步,Qoder CN 的社区版、豆包 MarsCode 都能白嫖到 Agent 能力;预算再松一点,国内接 GLM、Kimi 的工具(GLM Coding Plan 20 元起)、国外的 Claude Code 或 Codex(各 20 美元一个月)都值得直接上。一开始就把"描述需求 → 看产出 → 读报错 → 再交代"这个闭环放在真能干活的工具上练,比在补全工具上磨蹭进步快得多。

如果你主要在国内开发、看重中文和免代理可达,我会让你优先看 Qoder CN、文心快码、CodeBuddy、Trae 这些国产工具,本地化和访问都省心得多。

如果你就想要最强的"自己干活"体验,那上 Claude Code 或 OpenAI Codex,前提是你得做好"会给指令、会验收、token 要花钱"的心理准备。

如果你离不开多文件重构、又喜欢 AI 原生编辑器,Cursor 或 Windsurf(Devin)二选一。

如果你是企业或团队,那就按生态和合规来挑——国外有 Cursor 团队版、Claude Code 和 Codex 的团队方案,国内有 Qoder CN、文心快码的企业版和 CodeBuddy 团队版,要私有化的话还有 VPC 版可选(GLM-5.2 走 MIT 开源、能自部署,对数据敏感的团队尤其值得看)。

最后

工具会一直变,价格会一直调,文中的数字是 2026 年中的行情。但有一件事不会过时:怎么把需求讲清楚、怎么验收 AI 的产出、怎么把它们搭成自己顺手的工作流——这套思维,换哪个工具都通用。所以我的建议始终是同一句:先投资思维,再追工具。