Google Antigravity 评测:免费 AI IDE 对标 Cursor 与 Claude Code (2026)
Google Antigravity IDE 深度评测。包含基准测试、定价方案,以及 2026 年开发者在 Cursor 和 Claude Code 之间的诚实对比。
TL;DR — Google Antigravity 表现如何?
| Google Antigravity | Cursor | Claude Code | |
|---|---|---|---|
| 类型 | Agent 优先的 IDE (VS Code fork) | AI 驱动的 IDE (VS Code fork) | 基于终端的 CLI Agent |
| 主要模型 | Gemini 3.1 Pro | Composer 2 (原生) + 多模型 | Claude Opus 4.6 / Sonnet 4.6 |
| 免费层级 | 是 (额度慷慨,每周限制) | 是 (每月 50 次慢速请求) | 否 (Pro 每月至少 $20) |
| 付费方案 | Pro $20/月, Ultra $250/月 | Pro $20/月, Ultra $200/月 | Pro $20/月, Max $100/月 |
| SWE-bench Verified | 76.2% | 未公布 (取决于模型) | ~72–80.8% (取决于模型) |
| 多 Agent | 是 (支持 5 个并行 Agent) | 是 (Agents 窗口) | 否 (单 Agent) |
| 上下文窗口 | 200万 tokens | 约 200K (取决于模型) | 约 200K (取决于模型) |
| MCP 支持 | 否 | 是 (市场) | 是 (深度集成) |
| 稳定性 | 早期阶段,存在一些 Bug | 成熟,生产环境就绪 | 成熟,生产环境就绪 |
什么是 Google Antigravity?
Google Antigravity 是在 2025 年 11 月 18 日随 Gemini 3 发布时宣布的一款 Agent 优先的 IDE。它是对 Visual Studio Code 进行深度修改后的分支 —— 由 Google 在 2025 年 7 月以 24 亿美元收购的 Windsurf (原 Codeium) 团队打造。该团队在 CEO Varun Mohan 的带领下,仅用大约四个月时间就交付了 Antigravity。
其核心理念是:不再是你编写代码并偶尔向 AI 寻求帮助,而是你成为一名任务经理。你定义需要完成的任务,然后由 AI Agent 规划步骤、编写代码、运行终端、打开浏览器、验证输出,并留下可验证的 Artifacts,确切地展示它们修改了什么。
它目前处于公开预览阶段,对个人用户免费,并支持 macOS、Windows 和 Linux。
Manager View 究竟是如何工作的
Antigravity 引入了两个定义该产品的界面:
Editor View —— 熟悉的编码体验。包含 Tab 补全、行内 AI 命令、侧边栏聊天。如果你使用过 Cursor 或 Windsurf,会感觉非常自然。补全功能由 Gemini 3 Flash 驱动,速度极快。 Manager View —— 这是它的差异化所在。你可以同时启动多达五个并行工作的 Agent,每个 Agent 在隔离的工作区处理不同的任务。一个 Agent 构建功能脚手架,另一个编写测试,第三个处理数据库迁移。你可以观察它们的进度,查看 Artifacts,并直接在它们的工作上留下反馈 —— 类似于在 Google Doc 上发表评论。该平台提供四种操作模式:
- Agent-Driven —— 完全自主,无干扰
- Agent-Assisted —— Agent 在检查点暂停等待你的审查(推荐)
- Review-Driven —— 你批准每一个步骤
- Custom —— 按任务类型混合模式
什么是 Artifacts?
每个 Agent 都会生成 Artifacts —— 包括实施计划、任务列表、带注释的代码差异、屏幕截图和浏览器录像。你不需要通过翻阅终端日志来弄清楚 Agent 做了什么,而是会得到一个结构化的交付成果。
反馈循环是最出色的部分:你对某个 Artifact 发表评论,Agent 就会采纳你的建议,而无需重启整个对话。Agent 还会维护一个持久的知识库 (Knowledge Base),随着时间的推移学习你的代码模式、命名约定和偏好。
这对团队协作至关重要。Artifacts 创建了一个可审计的路径,记录了变更内容及其原因,这对代码审查和合规性非常有价值。
基准测试 —— 它的性能究竟如何?
以下是根据已公布数据得出的结果:
| 基准测试 | Antigravity | Cursor 3 | Claude Code (Opus 4.6) |
|---|---|---|---|
| SWE-bench Verified | 76.2% | N/A (取决于模型) | 80.8% |
| Terminal-Bench 2.0 | 54.2% | 前 3 名 | 65.4% |
| WebDev Arena Elo | 1487 | 未排名 | 未排名 |
| Next.js + Supabase 功能构建 | 42 秒 | 68 秒 | N/A |
一些诚实的观察:
SWE-bench 76.2% 表现强劲但并非领先。 通过 Claude Code 使用的 Claude Opus 4.6 达到了 80.8%。Antigravity 的得分落后约 5 个百分点。也就是说,SWE-bench 衡量的是模型本身而非工具。Antigravity 的得分反映了 Gemini 3.1 Pro 的能力,而且你可以在 Antigravity 内部切换到 Claude Opus 4.6。 速度是真正的优势。 在全天的开发过程中,42 秒与 Cursor 的 68 秒功能构建差异是有意义的。200万 tokens 的上下文窗口意味着 Antigravity 可以将整个大型代码库保存在内存中 —— 无需分块,无需检索黑科技。 Terminal-Bench 表现较弱。 在 54.2% 的得分下,Antigravity 明显落后于 Claude Code。如果你的工作流偏重终端(运行测试、git 操作、CI 调试),Claude Code 仍然是更好的 Agent。定价 —— “免费”是真的免费吗?
这是情况变得复杂的地方。
Antigravity 推出时带有非常慷慨的免费限制。但由于需求量巨大,Google 在 2026 年初一直在收紧限制:
| 层级 | 每月费用 | 你将获得 |
|---|---|---|
| Free | $0 | 带有每周速率限制的 Gemini 3.1 Pro,无限制的 Tab 补全 |
| Pro (Google AI Pro) | $20/月 | 更高的速率限制,5 小时刷新周期 |
| Ultra (Google AI Ultra) | $250/月 | 最高限制,优先访问权限 |
| Credits | $25 / 2,500 积分 | 达到限制时可充值 |
细则:免费层用户报告在进行 2-3 小时高强度编码后就会触及限制。Google 使用“已完成工作量”指标而非简单的请求计数,因此复杂的推理任务比快速补全消耗配额更快。2026 年 3 月,多名 Pro 订阅者报告遭遇了 7 天的锁定,而非广告宣传的 5 小时刷新,这引发了社区的抵制。
与 Cursor 相比: Cursor Pro 每月 20 美元为你提供一个根据模型使用情况消耗的 $20 信用池。重度用户也会经常触及限制,但系统更具可预测性。 与 Claude Code 相比: 每月 20 美元的 Pro 方案很直接,但资深用户通常需要每月 100 美元的 Max 方案。对于 Sonnet 4.6,API 访问每百万输入/输出 tokens 运行成本为 $3/$15,在大型代码库上累积速度很快。真正的对比:Antigravity 的免费层包含 Claude Opus 4.6 的访问权限。以 $0 的价格获得 Opus 级别的输出是一个了不起的交易 —— 如果你能忍受速率限制的话。
Antigravity 的不足之处
没必要粉饰。在使用了几周该工具后,以下是真实存在的问题:
不支持 MCP。 这是最大的短板。Cursor 拥有成熟的 MCP 集成市场 —— Figma、Linear、Amplitude、数据库。Claude Code 拥有连接外部工具的深度 MCP 支持。Antigravity 目前完全没有。如果你的工作流依赖于将 AI 与其他服务集成,这在今天是一个硬伤。 稳定性问题。 2026 年初,上下文内存错误、Agent 在任务中途终止以及版本兼容性 Bug 非常普遍。这是一个公开预览版,而且痕迹明显。你现在还不会想依靠 Antigravity 来处理生产关键型工作。 仅限云端处理。 所有代码都在 Google 的服务器上处理。如果你的公司有数据驻留要求或处理敏感代码,这可能会让你完全无法使用 Antigravity。Cursor 支持本地处理。Claude Code 在你的终端中运行。 在遗留代码库中表现挣扎。 Agent 假设使用的是标准库和现代模式。自定义框架、不寻常的命名约定或没有文档的遗留代码可能会让 Agent 非常困惑。对于任何复杂的事情,人工监督都是必不可少的。 速率限制不可预测。 “已完成工作量”指标是不透明的。你无法轻松估算特定任务的配额能持续多久,这使得计划变得困难。谁该选择哪款工具?
在以下情况下选择 Google Antigravity:- 你想以零成本尝试 Agent 优先的开发
- 你在 Google 生态系统中工作 (Firebase, Cloud Run, Gemini API)
- 你喜欢 Manager View 带来的并行多 Agent 工作流
- 你需要 200万 tokens 的上下文窗口来处理大型代码库问题
- 你想在不支付 $100+/月的情况下获得 Opus 级模型的访问权限
- 你需要一个成熟、稳定的日常编码环境
- 你依赖 MCP 集成和 VS Code 扩展
- 你想要最好的 Tab 补全和行内编辑功能
- 你所在的团队已有现成的
.cursorrules配置 - 可预测的计费对你很重要
- 你更喜欢终端优先的工作流
- 你处理复杂的、多步骤的重构任务
- 你追求最高的 SWE-bench 准确率 (Opus 4.6)
- 你需要深度的 MCP 集成
- 你看重可以在任何 IDE 或无需 IDE 情况下工作的编辑器无关工具
常见问题解答
Google Antigravity 真的是免费的吗?
是的,公开预览版对个人用户免费,Gemini 3.1 Pro 有每周速率限制,并可访问 Claude Opus 4.6。重度用户在 2-3 小时的高强度工作后会触及限制。付费层级(Pro 每月 $20,Ultra 每月 $250)提供更高的限制。
Antigravity 比 Cursor 更好吗?
对于日常编码来说,目前还不是。Cursor 更稳定,拥有成熟的扩展生态系统和更好的 MCP 支持。Antigravity 用于多 Agent 工作流的 Manager View 确实很新颖,但整体精致程度还没达到 Cursor 的水平。如果你想要并行 Agent 和免费的 Opus 访问权限,Antigravity 更好。
Antigravity 能取代 Claude Code 吗?
对于不同的受众,有可能。Antigravity 是可视化 IDE;Claude Code 是终端优先。Claude Code 在 SWE-bench (80.8% vs 76.2%) 和 Terminal-Bench (65.4% vs 54.2%) 上得分更高。习惯于终端操作的开发者会觉得 Claude Code 更自然。
Antigravity 支持 Claude 和 GPT 模型吗?
是的。Antigravity 支持 Gemini 3.1 Pro (主打)、Claude Sonnet 4.6、Claude Opus 4.6 和 GPT-OSS-120B。你可以为不同的 Agent 分配不同的模型 —— 例如,让 Opus 进行架构规划,让 Flash 进行快速实施。
Antigravity 是 VS Code 的分支吗?
是的,它是 VS Code 的一个深度修改分支,源自 Google 以 24 亿美元收购的 Windsurf 代码库。它在 VS Code 的基础上增加了 Manager View、Artifacts 系统和深度的 Gemini 集成。
Antigravity 会一直免费吗?
Google 已表示将推出付费订阅模式。目前的免费层是建立用户群的预览策略。预计 2026 年晚些时候将正式推出基于使用量或分层的定价,但很可能会保留一个有意义的免费层。
更宏观的前景
2026 年的 AI IDE 市场是一场三方竞赛:Cursor (在位者,年经常性收入已达 10 亿美元以上)、Claude Code (终端原生 Agent) 和 Google Antigravity (资金雄厚、提供免费高级模型的新晋者)。
Google 的策略很明确 —— 通过补贴 AI 编码来吸引开发者进入 Google Cloud 和 Gemini 生态系统,这与他们在 Android 和 Chrome 上使用的策略如出一辙。Antigravity 是否能长期保持免费尚存疑问,但短期价值是真实的。
对于开发者来说,竞争是一件好事。Antigravity 迫使 Cursor 加快了其多 Agent 功能的开发,并推动 Anthropic 使 Claude Code 更加易于获取。这些工具将持续变得更好。
如果你是一名开发者,请尝试所有这三款工具。它们服务于不同的工作流并互为补充。
如果你是不懂代码的创始人或产品构建者 —— 这些工具虽然强大,但仍需要工程判断力。从“AI 可以写代码”到“我有一个能赚钱的上线产品”之间仍有巨大的鸿沟:部署、SEO、分析、增长、迭代。这就是像 Y Build 这样的平台发挥作用的地方 —— AI Agent 处理从想法到上线产品的全过程,而无需你亲自管理 IDE。有时候,最好的开发工具就是那个你永远不需要打开的工具。
资料来源: