Google Antigravity Test: Kostenlose KI-IDE vs. Cursor vs. Claude Code (2026)
Praxisbericht zur Google Antigravity IDE. Benchmarks, Preise und ein ehrlicher Vergleich mit Cursor und Claude Code für Entwickler im Jahr 2026.
TL;DR — Wie schlägt sich Google Antigravity im Vergleich?
| Google Antigravity | Cursor | Claude Code | |
|---|---|---|---|
| Typ | Agent-fokussierte IDE (VS Code Fork) | KI-gestützte IDE (VS Code Fork) | Terminal-basierter CLI-Agent |
| Primäres Modell | Gemini 3.1 Pro | Composer 2 (proprietär) + Multi-Modell | Claude Opus 4.6 / Sonnet 4.6 |
| Kostenlose Stufe | Ja (großzügig, wöchentliche Limits) | Ja (50 langsame Anfragen/Monat) | Nein (Pro mind. $20/Monat) |
| Bezahlpläne | Pro $20/Monat, Ultra $250/Monat | Pro $20/Monat, Ultra $200/Monat | Pro $20/Monat, Max $100/Monat |
| SWE-bench Verified | 76,2% | Nicht veröffentlicht (modellabhängig) | ~72–80,8% (modellabhängig) |
| Multi-Agent | Ja (5 parallele Agenten) | Ja (Agents Window) | Nein (einzelner Agent) |
| Kontextfenster | 2M Tokens | ~200K (modellabhängig) | ~200K (modellabhängig) |
| MCP-Unterstützung | Nein | Ja (Marketplace) | Ja (tiefe Integration) |
| Stabilität | Frühes Stadium, einige Bugs | Ausgereift, produktionsbereit | Ausgereift, produktionsbereit |
Was ist Google Antigravity?
Google Antigravity ist eine Agent-fokussierte IDE, die am 18. November 2025 zusammen mit dem Start von Gemini 3 angekündigt wurde. Es handelt sich um einen stark modifizierten Fork von Visual Studio Code — entwickelt von dem Team, das Google im Juli 2025 für 2,4 Milliarden US-Dollar von Windsurf (ehemals Codeium) übernommen hat. Dieses Team, unter der Leitung von CEO Varun Mohan, hat Antigravity in etwa vier Monaten auf den Markt gebracht.
Die Kernidee: Anstatt dass Sie Code schreiben und gelegentlich die KI um Hilfe bitten, werden Sie zum Aufgabenmanager. Sie definieren, was passieren soll, und KI-Agenten planen die Schritte, schreiben den Code, bedienen das Terminal, öffnen einen Browser, validieren die Ergebnisse und hinterlassen verifizierbare Artifacts, die genau zeigen, was geändert wurde.
Es befindet sich derzeit in der Public Preview, ist für Einzelpersonen kostenlos und für macOS, Windows und Linux verfügbar.
Wie der Manager View tatsächlich funktioniert
Antigravity führt zwei Schnittstellen ein, die das Produkt definieren:
Editor View — das vertraute Coding-Erlebnis. Tab-Vervollständigungen, Inline-KI-Befehle, Sidebar-Chat. Wer Cursor oder Windsurf genutzt hat, wird sich sofort heimisch fühlen. Die Vervollständigungen werden von Gemini 3 Flash angetrieben und sind extrem schnell. Manager View — das ist das Alleinstellungsmerkmal. Sie können bis zu fünf Agenten parallel starten, die jeweils eine separate Aufgabe in isolierten Workspaces bearbeiten. Ein Agent erstellt das Gerüst für ein Feature, ein anderer schreibt Tests, ein dritter kümmert sich um Datenbank-Migrationen. Sie beobachten deren Fortschritt, prüfen die Artifacts und hinterlassen Feedback direkt an deren Arbeit — ähnlich wie beim Kommentieren eines Google Docs.Die Plattform bietet vier Betriebsmodi:
- Agent-Driven — volle Autonomie, keine Unterbrechungen
- Agent-Assisted — Agenten halten an Checkpoints für Ihre Überprüfung an (empfohlen)
- Review-Driven — Sie genehmigen jeden einzelnen Schritt
- Custom — Mischmodi je nach Aufgabentyp
Was sind Artifacts?
Jeder Agent generiert Artifacts — Implementierungspläne, Aufgabenlisten, annotierte Code-Diffs, Screenshots und Browser-Aufzeichnungen. Anstatt durch Terminal-Logs zu scrollen, um herauszufinden, was ein Agent getan hat, erhalten Sie ein strukturiertes Ergebnis.
Der Feedback-Loop ist der beste Teil: Sie kommentieren ein Artifact, und der Agent arbeitet Ihr Feedback ein, ohne die gesamte Konversation neu starten zu müssen. Agenten pflegen zudem eine persistente Knowledge Base, die Ihre Code-Muster, Benennungskonventionen und Vorlieben im Laufe der Zeit lernt.
Das ist wichtig für Teams. Artifacts erstellen einen prüfbaren Pfad darüber, was warum geändert wurde, was für Code-Reviews und Compliance-Anforderungen wertvoll ist.
Benchmarks — Liefert es wirklich ab?
Hier ist das, was wir aus den veröffentlichten Zahlen wissen:
| Benchmark | Antigravity | Cursor 3 | Claude Code (Opus 4.6) |
|---|---|---|---|
| SWE-bench Verified | 76,2% | N/A (modellabhängig) | 80,8% |
| Terminal-Bench 2.0 | 54,2% | Top-3 Platzierung | 65,4% |
| WebDev Arena Elo | 1487 | Nicht gerankt | Nicht gerankt |
| Next.js + Supabase Feature-Build | 42 Sekunden | 68 Sekunden | N/A |
Ein paar ehrliche Beobachtungen:
SWE-bench 76,2% ist stark, aber nicht führend. Claude Opus 4.6 erreicht via Claude Code 80,8%. Der Score von Antigravity liegt etwa 5 Punkte dahinter. Dennoch misst SWE-bench das Modell ebenso wie das Tool. Der Score von Antigravity spiegelt die Fähigkeiten von Gemini 3.1 Pro wider, wobei man innerhalb von Antigravity auch auf Claude Opus 4.6 umschalten kann. Geschwindigkeit ist ein echter Vorteil. Der Feature-Build in 42 Sekunden gegenüber 68 Sekunden bei Cursor ist über einen vollen Arbeitstag hinweg bedeutsam. Das Kontextfenster von 2M Tokens bedeutet, dass Antigravity eine gesamte große Codebasis im Speicher halten kann — kein Chunking, keine Retrieval-Hacks. Terminal-Bench ist schwächer. Mit 54,2% liegt Antigravity deutlich hinter Claude Code. Wenn Ihr Workflow terminal-lastig ist (Tests ausführen, Git-Operationen, CI-Debugging), ist Claude Code nach wie vor der bessere Agent.Preise — Ist „Kostenlos“ wirklich kostenlos?
Hier wird es kompliziert.
Antigravity startete mit wirklich großzügigen kostenlosen Limits. Aber die Nachfrage ist hoch, und Google hat Anfang 2026 die Zügel angezogen:
| Stufe | Monatliche Kosten | Was man bekommt |
|---|---|---|
| Free | $0 | Gemini 3.1 Pro mit wöchentlichen Rate Limits, unbegrenzte Tab-Vervollständigungen |
| Pro (Google AI Pro) | $20/Monat | Höhere Rate Limits, 5-Stunden-Refresh-Zyklen |
| Ultra (Google AI Ultra) | $250/Monat | Höchste Limits, Prioritätszugang |
| Credits | $25 / 2.500 Credits | Aufladen, wenn man die Limits erreicht |
Das Kleingedruckte: Nutzer der kostenlosen Stufe berichten, dass sie bei intensivem Coding innerhalb von 2–3 Stunden an die Limits stoßen. Google verwendet eine „Work Done“-Metrik anstelle einfacher Request-Zahlen. Komplexe Reasoning-Aufgaben verbrauchen das Kontingent also schneller als schnelle Vervollständigungen. Im März 2026 meldeten mehrere Pro-Abonnenten 7-tägige Sperren anstatt des beworbenen 5-Stunden-Refreshes, was zu Kritik in der Community führte.
Im Vergleich zu Cursor: Cursor Pro für $20/Monat gibt Ihnen einen $20-Credit-Pool, der basierend auf der Modellnutzung abnimmt. Power-User erreichen auch hier regelmäßig Limits, aber das System ist berechenbarer. Im Vergleich zu Claude Code: Der Pro-Plan für $20/Monat ist unkompliziert, aber professionelle Nutzer benötigen meist den Max-Plan für $100/Monat. Der API-Zugang kostet $3/$15 pro Million Input/Output-Tokens für Sonnet 4.6, was sich bei großen Codebasen schnell summiert.Der eigentliche Vergleich: Die kostenlose Stufe von Antigravity beinhaltet den Zugang zu Claude Opus 4.6. Ergebnisse auf Opus-Niveau für $0 zu erhalten, ist ein bemerkenswerter Deal — sofern man mit den Rate Limits leben kann.
Was Antigravity falsch macht
Man muss es nicht beschönigen. Nach mehreren Wochen mit dem Tool sind dies die echten Probleme:
Keine MCP-Unterstützung. Dies ist die größte Lücke. Cursor hat einen ausgereiften Marketplace für MCP-Integrationen — Figma, Linear, Amplitude, Datenbanken. Claude Code bietet tiefe MCP-Unterstützung zur Anbindung externer Tools. Antigravity hat bisher nichts davon. Wenn Ihr Workflow davon abhängt, die KI mit anderen Diensten zu verbinden, ist das aktuell ein Ausschlusskriterium. Stabilitätsprobleme. Kontext-Fehler, Agenten, die mitten in der Aufgabe abbrechen, und Versionskompatibilitäts-Bugs sind Anfang 2026 häufig. Es ist eine Public Preview, und das merkt man. Für produktionskritische Arbeiten sollte man sich noch nicht allein auf Antigravity verlassen. Nur Cloud-Verarbeitung. Der gesamte Code wird auf Google-Servern verarbeitet. Wenn Ihr Unternehmen Anforderungen an die Datenresidenz hat oder mit hochsensiblem Code arbeitet, könnte dies Antigravity komplett disqualifizieren. Cursor verarbeitet teilweise lokal. Claude Code läuft in Ihrem Terminal. Probleme mit Legacy-Code. Die Agenten setzen Standard-Bibliotheken und moderne Muster voraus. Eigene Frameworks, ungewöhnliche Benennungskonventionen oder Legacy-Code ohne Dokumentation können die Agenten massiv verwirren. Aufsicht ist bei allem Komplexen unverzichtbar. Unvorhersehbare Rate Limits. Die „Work Done“-Metrik ist intransparent. Man kann schwer abschätzen, wie lange das Kontingent für eine bestimmte Aufgabe reicht, was die Planung erschwert.Wer sollte was nutzen?
Wählen Sie Google Antigravity, wenn:- Sie Agent-fokussierte Entwicklung zum Nulltarif ausprobieren wollen
- Sie im Google-Ökosystem arbeiten (Firebase, Cloud Run, Gemini API)
- Sie den Manager View für parallele Multi-Agent-Workflows mögen
- Sie ein 2M-Token-Kontextfenster für Fragen zu großen Codebasen benötigen
- Sie Zugang zu Modellen auf Opus-Niveau wollen, ohne $100+/Monat zu zahlen
- Sie eine ausgereifte, stabile tägliche Coding-Umgebung benötigen
- Sie auf MCP-Integrationen und VS Code Extensions angewiesen sind
- Sie die besten Tab-Vervollständigungen und Inline-Edits wollen
- Sie in einem Team mit bestehenden
.cursorrules-Konfigurationen arbeiten - Ihnen eine planbare Abrechnung wichtig ist
- Sie Terminal-fokussierte Workflows bevorzugen
- Sie an komplexen, mehrstufigen Refactoring-Aufgaben arbeiten
- Sie die höchste SWE-bench Genauigkeit (Opus 4.6) wollen
- Sie eine tiefe MCP-Integration benötigen
- Sie ein Editor-agnostisches Tool schätzen, das mit jeder IDE funktioniert
Häufig gestellte Fragen (FAQ)
Ist Google Antigravity wirklich kostenlos?
Ja, die Public Preview ist für Einzelpersonen kostenlos, mit wöchentlichen Rate Limits für Gemini 3.1 Pro und Zugang zu Claude Opus 4.6. Power-User erreichen die Limits bei intensiver Arbeit in 2–3 Stunden. Bezahlte Stufen (Pro für $20/Monat, Ultra für $250/Monat) bieten höhere Limits.
Ist Antigravity besser als Cursor?
Noch nicht für das tägliche Coding. Cursor ist stabiler, hat ein ausgereiftes Extension-Ökosystem und bessere MCP-Unterstützung. Der Manager View von Antigravity für Multi-Agent-Workflows ist wirklich neuartig, aber der Feinschliff erreicht noch nicht das Niveau von Cursor. Antigravity ist besser, wenn Sie parallele Agenten und kostenlosen Opus-Zugang suchen.
Kann Antigravity Claude Code ersetzen?
Für eine andere Zielgruppe potenziell ja. Antigravity ist eine visuelle IDE; Claude Code ist Terminal-fokussiert. Claude Code schneidet im SWE-bench besser ab (80,8% vs. 76,2%) ebenso wie im Terminal-Bench (65,4% vs. 54,2%). Entwickler, die im Terminal „leben“, werden Claude Code natürlicher finden.
Unterstützt Antigravity Claude- und GPT-Modelle?
Ja. Antigravity unterstützt Gemini 3.1 Pro (primär), Claude Sonnet 4.6, Claude Opus 4.6 und GPT-OSS-120B. Man kann verschiedenen Agenten unterschiedliche Modelle zuweisen — zum Beispiel Opus für die Architekturplanung und Flash für schnelle Implementierungen.
Ist Antigravity ein VS Code Fork?
Ja, es ist ein stark modifizierter Fork von VS Code, der auf der Windsurf-Codebasis basiert, die Google für 2,4 Milliarden US-Dollar erworben hat. Es fügt den Manager View, das Artifacts-System und eine tiefe Gemini-Integration auf dem VS-Code-Fundament hinzu.
Wird Antigravity kostenlos bleiben?
Google hat angekündigt, dass ein kostenpflichtiges Abonnementmodell kommen wird. Die aktuelle kostenlose Stufe ist eine Strategie für die Preview-Phase, um die Nutzerbasis aufzubauen. Es ist zu erwarten, dass später im Jahr 2026 eine nutzungsbasierte oder gestaffelte Preisgestaltung eingeführt wird, wobei wahrscheinlich eine sinnvolle kostenlose Stufe erhalten bleibt.
Das große Ganze
Der Markt für KI-IDEs im Jahr 2026 ist ein Dreikampf: Cursor (der Platzhirsch, mittlerweile bei über 1 Mrd. USD Umsatz), Claude Code (der Terminal-native Agent) und Google Antigravity (der finanzstarke Newcomer, der Premium-Modelle kostenlos anbietet).
Googles Strategie ist klar — KI-Coding zu subventionieren, um Entwickler in das Google Cloud- und Gemini-Ökosystem zu ziehen, genau wie sie es mit Android und Chrome getan haben. Ob Antigravity langfristig kostenlos bleibt, ist offen, aber der kurzfristige Nutzen ist real.
Für Entwickler ist dieser Wettbewerb großartig. Antigravity hat Cursor dazu gezwungen, seine Multi-Agent-Funktionen zu beschleunigen, und Anthropic dazu gebracht, Claude Code zugänglicher zu machen. Die Tools werden immer besser werden.
Wenn Sie Entwickler sind, probieren Sie alle drei aus. Sie dienen unterschiedlichen Workflows und ergänzen einander.
Wenn Sie Gründer oder Produktmanager sind, der nicht selbst programmiert — diese Tools sind mächtig, erfordern aber immer noch technisches Urteilsvermögen. Die Lücke zwischen „KI kann Code schreiben“ und „Ich habe ein fertiges Produkt, das Geld verdient“ ist immer noch groß: Deployment, SEO, Analytics, Wachstum, Iteration. Hier kommen Plattformen wie Y Build ins Spiel — KI-Agenten, die den gesamten Weg von der Idee bis zum Live-Produkt übernehmen, ohne dass Sie überhaupt eine IDE bedienen müssen. Manchmal ist das beste Entwicklungstool dasjenige, das man nie öffnen muss.
Quellen: