Claude Opus 4.7: Apa yang Baru, Benchmark & Panduan Lengkap (2026)
Claude Opus 4.7 telah hadir — 13% lebih baik dalam coding, kapasitas vision 3x lipat, tingkat upaya xhigh baru. Benchmark lengkap, harga, dan perbandingannya dengan GPT-5.4.
TL;DR
| Detail | Claude Opus 4.7 |
|---|---|
| Tanggal rilis | 16 April 2026 |
| ID Model | claude-opus-4-7 |
| Harga | $5/$25 per MTok (sama dengan Opus 4.6) |
| Context window | 1M token |
| Ketersediaan | API, Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry |
| Peningkatan utama | 13% lebih baik dalam coding, vision 3x lipat, tingkat upaya baru |
| SWE-bench Verified | ~85-90% (naik dari 80,8%) |
| Fitur baru Claude Code | /ultrareview — review kode multi-agent |
Apa yang Baru di Claude Opus 4.7?
Claude Opus 4.7 adalah model frontier terbaru dari Anthropic yang tersedia secara umum, dirilis pada 16 April 2026. Ini merupakan peningkatan inkremental namun bermakna dibandingkan Opus 4.6, dengan keuntungan terbesar di bidang rekayasa perangkat lunak dan vision.
Berbeda dengan Claude Mythos Preview (yang dibatasi oleh Anthropic hanya untuk mitra keamanan siber), Opus 4.7 tersedia secara publik di semua produk dan API Claude.
Hasil Benchmark
Rekayasa Perangkat Lunak
| Benchmark | Opus 4.7 | Opus 4.6 | GPT-5.4 | Mythos Preview |
|---|---|---|---|---|
| SWE-bench Verified | ~85-90% | 80,8% | ~80% | 93,9% |
| SWE-bench Pro | ~45% | — | 57,7% | 77,8% |
| Terminal-Bench 2.0 | 65,4% | 66,5% | 75,1% | 82% |
| Coding internal 93-tugas | +13% vs 4.6 | baseline | — | — |
| Rakuten-SWE-Bench | 3x lebih banyak teratasi | baseline | — | — |
Peningkatan terbesar terlihat pada tugas multi-file yang sulit. Anthropic secara khusus menyoroti peningkatan pada "tugas yang paling sulit" — jenis tugas yang memerlukan pemahaman banyak file, refactoring yang kompleks, dan verifikasi output.
Kemampuan Lainnya
| Bidang | Peningkatan |
|---|---|
| Penalaran dokumen | Error 21% lebih sedikit |
| Otomasi pabrik | Peningkatan performa 10-15% |
| Vision | Resolusi gambar 3x lipat (hingga 2.576px / 3,75MP) |
| Konteks panjang | Peningkatan pengambilan data dan penalaran pada 1M token |
| Optimalisasi MCP | Overhead token 30% lebih sedikit vs Opus 4.5 |
Upgrade Vision: Resolusi 3x Lipat
Opus 4.7 menerima gambar hingga 2.576 piksel pada sisi terpanjang (~3,75 megapiksel) — lebih dari 3x lipat kapasitas sebelumnya. Ini sangat penting untuk:
- Diagram teknis — bagan arsitektur, skema sirkuit
- Struktur kimia — diagram molekul dengan kualitas publikasi
- Screenshot padat — tangkapan layar penuh kode, dasbor, spreadsheet
- Mockup desain — desain UI dengan fidelitas tinggi
Baru: Kontrol Upaya dengan "xhigh"
Opus 4.7 memperkenalkan tingkat upaya (effort level) baru: xhigh — berada di antara "high" dan "max".
| Tingkat Upaya | Contoh Penggunaan | Penggunaan Token |
|---|---|---|
| low | Kueri sederhana, jawaban cepat | Minimal |
| medium | Tugas standar | Normal |
| high | Penalaran kompleks | Meningkat |
| xhigh | Tugas multi-langkah yang sulit | Tinggi |
| max | Masalah tersulit, kualitas tertinggi | Maksimum |
Tingkat xhigh memberi Anda kedalaman penalaran yang lebih dari high tanpa biaya token penuh seperti max — jalan tengah yang praktis untuk beban kerja produksi.
Task Budgets (Public Beta)
Bersamaan dengan kontrol upaya, Anthropic memperkenalkan task budgets — cara bagi pengembang untuk menetapkan batas pengeluaran token untuk operasi yang berjalan lama. Ini memberi Anda kendali biaya tanpa harus mengelola setiap panggilan API secara mikro.
Pembaruan Claude Code
/ultrareview — Review Kode Multi-Agent
Fitur unggulan Claude Code adalah /ultrareview — sistem review kode berbasis cloud yang menggunakan beberapa sub-agent untuk menganalisis kode Anda:
- Fase Deteksi Bug: Memunculkan 5-20 sub-agent yang secara independen mengeksplorasi jalur berbeda melalui codebase Anda.
- Fase Verifikasi: Sub-agent terpisah memverifikasi setiap kandidat bug, menyaring hasil positif palsu.
Auto Mode untuk Pengguna Max
Auto mode — di mana Claude Code menjalankan perintah dan melakukan pengeditan tanpa meminta konfirmasi — kini tersedia untuk pelanggan Max.
Opus 4.7 vs GPT-5.4: Mana yang Harus Anda Gunakan?
| Dimensi | Opus 4.7 | GPT-5.4 |
|---|---|---|
| Coding kompleks | Unggul (refactoring multi-file) | Kuat namun tertinggal |
| Computer use | Tidak tersedia | Unggul (75% OSWorld) |
| Konteks panjang | 1M token, penalaran lebih baik | 1,05M token |
| Vision | 3,75MP, diagram teknis | Bagus namun lebih kecil |
| Kecepatan | Lebih lambat, lebih teliti | Eksekusi lebih cepat |
| Harga | $5/$25 per MTok | $2,50/$15 per MTok |
| Dukungan MCP | Native, dioptimalkan | Terbatas |
Peringatan Penggunaan Token
Opus 4.7 menggunakan tokenizer yang diperbarui yang memproses teks secara berbeda. Input yang sama mungkin dipetakan ke 1,0–1,35x lebih banyak token tergantung pada kontennya. Dikombinasikan dengan lebih banyak output token pada tingkat upaya yang lebih tinggi, biaya Anda mungkin meningkat meskipun harga per token tidak berubah.
Jika Anda melakukan upgrade dari Opus 4.6, pantau penggunaan token Anda selama beberapa hari pertama.
Perlindungan Keamanan Siber
Setelah situasi Mythos Preview, Anthropic telah membangun perlindungan keamanan siber langsung ke dalam Opus 4.7:
- Deteksi dan pemblokiran otomatis terhadap permintaan keamanan siber yang terlarang atau berisiko tinggi.
- Program Verifikasi Siber untuk peneliti keamanan resmi dan pengetes penetrasi (pen tester).
- Sengaja dibuat kurang mampu dibanding Mythos Preview dalam hal siber, memungkinkan Anthropic untuk menguji perlindungan pada model yang kurang kuat terlebih dahulu.
Cara Mengakses
# API
curl https://api.anthropic.com/v1/messages \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "content-type: application/json" \
-d '{"model": "claude-opus-4-7", "max_tokens": 1024, "messages": [{"role": "user", "content": "Hello"}]}'
# Claude Code
claude --model opus # default ke opus terbaru
Juga tersedia di Amazon Bedrock, Google Cloud Vertex AI, dan Microsoft Foundry sejak hari pertama.
Pertanyaan yang Sering Diajukan (FAQ)
Berapa biaya Claude Opus 4.7?
$5 per satu juta input token dan $25 per satu juta output token — sama dengan Opus 4.6. Namun, tokenizer yang diperbarui mungkin menghasilkan 1,0-1,35x lebih banyak token untuk konten yang sama.
Apakah Opus 4.7 lebih baik daripada GPT-5.4?
Untuk rekayasa perangkat lunak yang kompleks dan tugas coding multi-file, ya. Untuk penggunaan komputer (computer use), otomasi desktop, dan efisiensi biaya, GPT-5.4 saat ini lebih baik. Keduanya unggul di bidang yang berbeda.
Apa itu perintah /ultrareview di Claude Code?
Ini adalah sistem review kode multi-agent yang memunculkan 5-20 sub-agent untuk secara independen menemukan bug di kode Anda, kemudian memverifikasi setiap temuan untuk menyaring bug palsu. Pengguna Pro dan Max mendapatkan 3 ultrareview gratis.
Bagaimana perbandingan Opus 4.7 dengan Claude Mythos Preview?
Mythos Preview secara signifikan lebih mampu (93,9% vs ~85-90% pada SWE-bench) tetapi tidak tersedia secara publik. Opus 4.7 adalah model Claude terbaik yang benar-benar bisa Anda gunakan.
Haruskah saya upgrade dari Opus 4.6?
Ya, jika Anda melakukan coding yang kompleks atau bekerja dengan gambar teknis. Peningkatan coding 13% dan resolusi vision 3x lipat sangatlah berarti. Pastikan saja untuk memantau penggunaan token Anda karena tokenizer baru mungkin meningkatkan biaya.
Apa itu tingkat upaya "xhigh"?
Pengaturan upaya baru antara high dan max yang memberikan kedalaman penalaran lebih banyak tanpa biaya token penuh dari upaya max. Bagus untuk tugas-tugas sulit di mana Anda menginginkan kualitas tetapi perlu mengontrol biaya.
Kesimpulan
Opus 4.7 adalah peningkatan yang solid, bukan sebuah revolusi. Keuntungan coding-nya nyata, peningkatan vision-nya signifikan, dan /ultrareview adalah kemampuan yang benar-benar baru. Namun kabar terbesarnya mungkin adalah apa yang bukan dirinya — ini bukan Mythos Preview. Kesenjangan antara model publik dan privat Anthropic kini lebih lebar dari sebelumnya.
Bagi pengembang, Opus 4.7 adalah model Claude publik terbaik dan pilihan yang kuat untuk pekerjaan engineering yang kompleks. Jika Anda ingin membangun produk bertenaga AI tanpa harus mengelola model dan infrastruktur, Y Build menangani hal itu untuk Anda — anggap saja ini sebagai agen AI mobile-first yang merilis produk, tanpa memerlukan server atau terminal.