Claude Opus 4.7: Yang Baharu, Penanda Aras & Panduan Penuh (2026)
Claude Opus 4.7 kini di sini — 13% lebih baik dalam pengkodan, 3x kapasiti vision, tahap usaha xhigh baharu. Penanda aras penuh, harga, dan perbandingannya dengan GPT-5.4.
TL;DR
| Perincian | Claude Opus 4.7 |
|---|---|
| Tarikh keluaran | 16 April 2026 |
| ID Model | claude-opus-4-7 |
| Harga | $5/$25 setiap MTok (sama seperti Opus 4.6) |
| Tetingkap konteks | 1M token |
| Ketersediaan | API, Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry |
| Penambahbaikan utama | 13% lebih baik dalam pengkodan, 3x vision, tahap usaha baharu |
| SWE-bench Verified | ~85-90% (meningkat daripada 80.8%) |
| Ciri Claude Code baharu | /ultrareview — semakan kod berbilang ejen |
Apa yang Baharu dalam Claude Opus 4.7?
Claude Opus 4.7 adalah model sempadan (frontier model) terbaharu daripada Anthropic yang tersedia secara umum, dikeluarkan pada 16 April 2026. Ia merupakan peningkatan berperingkat tetapi bermakna berbanding Opus 4.6, dengan lonjakan terbesar dalam kejuruteraan perisian dan vision.
Berbeza dengan Claude Mythos Preview (yang dihadkan oleh Anthropic kepada rakan kongsi keselamatan siber sahaja), Opus 4.7 tersedia secara umum merentasi semua produk dan API Claude.
Keputusan Penanda Aras
Kejuruteraan Perisian
| Penanda Aras | Opus 4.7 | Opus 4.6 | GPT-5.4 | Mythos Preview |
|---|---|---|---|---|
| SWE-bench Verified | ~85-90% | 80.8% | ~80% | 93.9% |
| SWE-bench Pro | ~45% | — | 57.7% | 77.8% |
| Terminal-Bench 2.0 | 65.4% | 66.5% | 75.1% | 82% |
| Pengkodan 93-tugasan dalaman | +13% vs 4.6 | baseline | — | — |
| Rakuten-SWE-Bench | 3x lebih banyak diselesaikan | baseline | — | — |
Peningkatan terbesar adalah pada tugasan berbilang fail yang sukar. Anthropic secara khusus menekankan peningkatan pada "tugasan yang paling sukar" — jenis tugasan yang memerlukan pemahaman terhadap berbilang fail, refactoring yang kompleks, dan pengesahan output.
Keupayaan Lain
| Bidang | Penambahbaikan |
|---|---|
| Penaakulan dokumen | 21% kurang ralat |
| Automasi kilang | 10-15% peningkatan prestasi |
| Vision | 3x resolusi imej (sehingga 2,576px / 3.75MP) |
| Konteks panjang | Penambahbaikan pencapaian maklumat (retrieval) dan penaakulan melebihi 1M token |
| Pengoptimuman MCP | 30% kurang overhed token berbanding Opus 4.5 |
Naik Taraf Vision: 3x Resolusi
Opus 4.7 menerima imej sehingga 2,576 piksel pada sisi panjang (~3.75 megapiksel) — lebih daripada 3x kapasiti sebelumnya. Ini penting untuk:
- Diagram teknikal — carta seni bina, skematik litar
- Struktur kimia — diagram molekul pada kualiti penerbitan
- Tangkapan skrin padat — tangkapan halaman penuh kod, papan pemuka, hamparan kerja
- Mockup reka bentuk — reka bentuk UI berketepatan tinggi (high-fidelity)
Baharu: Kawalan Usaha dengan "xhigh"
Opus 4.7 memperkenalkan tahap usaha (effort level) baharu: xhigh — berada di antara "high" dan "max."
| Tahap Usaha | Kes Kegunaan | Penggunaan Token |
|---|---|---|
| low | Pertanyaan ringkas, jawapan cepat | Minimum |
| medium | Tugasan standard | Normal |
| high | Penaakulan kompleks | Meningkat |
| xhigh | Tugasan berbilang langkah yang sukar | Tinggi |
| max | Masalah paling sukar, kualiti tertinggi | Maksimum |
Tahap xhigh memberikan anda kedalaman penaakulan yang lebih daripada "high" tanpa kos token sepenuhnya seperti "max" — jalan tengah yang praktikal untuk beban kerja produksi.
Bajet Tugasan (Beta Awam)
Bersama dengan kawalan usaha, Anthropic memperkenalkan bajet tugasan (task budgets) — cara untuk pembangun menetapkan had perbelanjaan token untuk operasi yang berjalan lama. Ini memberi anda kawalan kos tanpa perlu mengurus setiap panggilan API secara mikro.
Kemas Kini Claude Code
/ultrareview — Semakan Kod Berbilang Ejen
Ciri utama Claude Code ialah /ultrareview — sistem semakan kod berkuasa awan yang menggunakan berbilang sub-ejen untuk menganalisis kod anda:
- Fasa Pengesanan Pepijat: Melahirkan 5-20 sub-ejen yang meneroka laluan berbeza melalui pangkalan kod (codebase) anda secara bebas
- Fasa Pengesahan: Sub-ejen berasingan mengesahkan setiap calon pepijat, menapis positif palsu (false positives)
Mod Auto untuk Pengguna Max
Mod Auto — di mana Claude Code menjalankan arahan dan membuat suntingan tanpa meminta pengesahan — kini tersedia untuk pelanggan Max.
Opus 4.7 vs GPT-5.4: Mana Satu Patut Anda Gunakan?
| Dimensi | Opus 4.7 | GPT-5.4 |
|---|---|---|
| Pengkodan kompleks | Mendahului (refactoring berbilang fail) | Kuat tetapi di belakang |
| Penggunaan komputer | Tidak tersedia | Mendahului (75% OSWorld) |
| Konteks panjang | 1M token, penaakulan lebih baik | 1.05M token |
| Vision | 3.75MP, diagram teknikal | Baik tetapi lebih kecil |
| Kelajuan | Lebih perlahan, lebih teliti | Pelaksanaan lebih pantas |
| Harga | $5/$25 setiap MTok | $2.50/$15 setiap MTok |
| Sokongan MCP | Natif, dioptimumkan | Terhad |
Amaran Penggunaan Token
Opus 4.7 menggunakan tokenizer yang dikemas kini yang memproses teks secara berbeza. Input yang sama mungkin dipetakan kepada 1.0–1.35x lebih banyak token bergantung pada kandungan. Digabungkan dengan lebih banyak token output pada tahap usaha yang lebih tinggi, kos anda mungkin meningkat walaupun harga per-token tidak berubah.
Jika anda menaik taraf daripada Opus 4.6, pantau penggunaan token anda untuk beberapa hari pertama.
Perlindungan Keselamatan Siber
Selepas situasi Mythos Preview, Anthropic telah membina perlindungan keselamatan siber terus ke dalam Opus 4.7:
- Pengesanan dan penyekatan automatik bagi permintaan keselamatan siber yang dilarang atau berisiko tinggi
- Program Pengesahan Siber untuk penyelidik keselamatan yang sah dan penguji penembusan (pen testers)
- Sengaja dibuat kurang berupaya berbanding Mythos Preview dalam bidang siber, membolehkan Anthropic menguji perlindungan pada model yang kurang berkuasa terlebih dahulu
Cara untuk Mengakses
# API
curl https://api.anthropic.com/v1/messages \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "content-type: application/json" \
-d '{"model": "claude-opus-4-7", "max_tokens": 1024, "messages": [{"role": "user", "content": "Hello"}]}'
# Claude Code
claude --model opus # lalai kepada opus terkini
Juga tersedia di Amazon Bedrock, Google Cloud Vertex AI, dan Microsoft Foundry bermula hari pertama.
Soalan Lazim
Berapakah kos Claude Opus 4.7?
$5 setiap sejuta token input dan $25 setiap sejuta token output — sama seperti Opus 4.6. Walau bagaimanapun, tokenizer yang dikemas kini mungkin menghasilkan 1.0-1.35x lebih banyak token untuk kandungan yang sama.
Adakah Opus 4.7 lebih baik daripada GPT-5.4?
Untuk kejuruteraan perisian yang kompleks dan tugasan pengkodan berbilang fail, ya. Untuk penggunaan komputer, automasi desktop, dan kecekapan kos, GPT-5.4 buat masa ini lebih baik. Mereka cemerlang dalam bidang yang berbeza.
Apakah arahan /ultrareview dalam Claude Code?
Ia adalah sistem semakan kod berbilang ejen yang melahirkan 5-20 sub-ejen untuk mencari pepijat dalam kod anda secara bebas, kemudian mengesahkan setiap penemuan untuk menapis positif palsu. Pengguna Pro dan Max mendapat 3 ultrareview percuma.
Bagaimana Opus 4.7 berbanding dengan Claude Mythos Preview?
Mythos Preview adalah jauh lebih berkeupayaan (93.9% vs ~85-90% pada SWE-bench) tetapi tidak tersedia secara umum. Opus 4.7 adalah model Claude terbaik yang sebenarnya boleh anda gunakan.
Patutkah saya menaik taraf daripada Opus 4.6?
Ya, jika anda melakukan pengkodan yang kompleks atau bekerja dengan imej teknikal. Peningkatan pengkodan sebanyak 13% dan resolusi vision 3x adalah sangat bermakna. Cuma pastikan anda memantau penggunaan token kerana tokenizer baharu mungkin meningkatkan kos.
Apakah itu tahap usaha "xhigh"?
Tetapan usaha baharu antara "high" dan "max" yang memberikan kedalaman penaakulan lebih tanpa kos token penuh bagi usaha max. Sesuai untuk tugasan sukar di mana anda mahukan kualiti tetapi perlu mengawal kos.
Kesimpulan
Opus 4.7 adalah satu peningkatan yang mantap, bukannya satu revolusi. Peningkatan dalam pengkodan adalah nyata, penambahbaikan vision adalah signifikan, dan /ultrareview adalah keupayaan yang benar-benar baharu. Namun berita terbesar mungkin adalah apa yang sebaliknya — ia bukan Mythos Preview. Jurang antara model awam dan peribadi Anthropic kini lebih luas daripada sebelumnya.
Bagi pembangun, Opus 4.7 adalah model Claude terbaik yang tersedia secara umum dan pilihan yang kuat untuk kerja kejuruteraan yang kompleks. Jika anda ingin membina produk berkuasa AI tanpa mengurus model dan infrastruktur, Y Build menguruskan perkara itu untuk anda — anggap ia sebagai ejen AI berutamakan mudah alih yang melancarkan produk, tanpa memerlukan pelayan atau terminal.