Claude Opus 4.7: Có gì mới, Điểm chuẩn & Hướng dẫn đầy đủ (2026)
Claude Opus 4.7 đã ra mắt — tốt hơn 13% về lập trình, khả năng thị giác gấp 3 lần, mức độ nỗ lực xhigh mới. Chi tiết điểm chuẩn, giá cả và so sánh với GPT-5.4.
TL;DR
| Chi tiết | Claude Opus 4.7 |
|---|---|
| Ngày phát hành | 16 tháng 4, 2026 |
| Model ID | claude-opus-4-7 |
| Giá cả | $5/$25 trên mỗi triệu token (tương đương Opus 4.6) |
| Cửa sổ ngữ cảnh | 1 triệu tokens |
| Khả năng tiếp cận | API, Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry |
| Cải tiến chính | Lập trình tốt hơn 13%, thị giác gấp 3 lần, các mức độ nỗ lực mới |
| SWE-bench Verified | ~85-90% (tăng từ 80.8%) |
| Tính năng Claude Code mới | /ultrareview — đánh giá mã nguồn đa agent |
Có gì mới trong Claude Opus 4.7?
Claude Opus 4.7 là mô hình tiên phong mới nhất của Anthropic hiện đã được phát hành rộng rãi vào ngày 16 tháng 4 năm 2026. Đây là một bản nâng cấp gia tăng nhưng đầy ý nghĩa so với Opus 4.6, với những bước tiến lớn nhất nằm ở lĩnh vực kỹ thuật phần mềm và thị giác.
Khác với Claude Mythos Preview (phiên bản mà Anthropic chỉ giới hạn cho các đối tác an ninh mạng), Opus 4.7 có sẵn công khai trên tất cả các sản phẩm và API của Claude.
Kết quả điểm chuẩn (Benchmarks)
Kỹ thuật phần mềm
| Điểm chuẩn | Opus 4.7 | Opus 4.6 | GPT-5.4 | Mythos Preview |
|---|---|---|---|---|
| SWE-bench Verified | ~85-90% | 80.8% | ~80% | 93.9% |
| SWE-bench Pro | ~45% | — | 57.7% | 77.8% |
| Terminal-Bench 2.0 | 65.4% | 66.5% | 75.1% | 82% |
| Lập trình 93 tác vụ nội bộ | +13% so với 4.6 | baseline | — | — |
| Rakuten-SWE-Bench | Giải quyết gấp 3 lần | baseline | — | — |
Cải tiến lớn nhất nằm ở các tác vụ khó, đa tệp tin. Anthropic đặc biệt nhấn mạnh những bước tiến trong "các tác vụ khó khăn nhất" — loại tác vụ yêu cầu hiểu biết về nhiều tệp tin, refactoring phức tạp và xác minh kết quả đầu ra.
Các khả năng khác
| Lĩnh vực | Cải tiến |
|---|---|
| Suy luận tài liệu | Giảm 21% lỗi |
| Tự động hóa nhà máy | Hiệu suất tăng 10-15% |
| Thị giác | Độ phân giải hình ảnh gấp 3 lần (lên đến 2,576px / 3.75MP) |
| Ngữ cảnh dài | Cải thiện khả năng truy xuất và suy luận trên 1 triệu tokens |
| Tối ưu hóa MCP | Giảm 30% chi phí token bổ sung so với Opus 4.5 |
Nâng cấp thị giác: Độ phân giải gấp 3 lần
Opus 4.7 chấp nhận hình ảnh lên tới 2,576 pixel ở cạnh dài (~3.75 megapixels) — gấp hơn 3 lần so với khả năng trước đó. Điều này có ý nghĩa quan trọng đối với:
- Sơ đồ kỹ thuật — biểu đồ kiến trúc, sơ đồ mạch điện
- Cấu trúc hóa học — sơ đồ phân tử ở chất lượng xuất bản
- Ảnh chụp màn hình dày đặc — ảnh chụp toàn trang của mã nguồn, bảng điều khiển (dashboards), bảng tính
- Bản phác thảo thiết kế — thiết kế UI độ trung thực cao
Mới: Kiểm soát nỗ lực với "xhigh"
Opus 4.7 giới thiệu một mức độ nỗ lực (effort level) mới: xhigh — nằm giữa mức "high" và "max".
| Mức độ nỗ lực | Trường hợp sử dụng | Mức sử dụng Token |
|---|---|---|
| low | Các truy vấn đơn giản, câu trả lời nhanh | Tối thiểu |
| medium | Các tác vụ tiêu chuẩn | Bình thường |
| high | Suy luận phức tạp | Tăng cao |
| xhigh | Các tác vụ đa bước khó khăn | Cao |
| max | Các vấn đề khó nhất, chất lượng cao nhất | Tối đa |
Mức xhigh mang lại cho bạn chiều sâu suy luận tốt hơn so với "high" mà không tốn toàn bộ chi phí token như mức "max" — một lựa chọn trung gian thực tế cho các khối lượng công việc sản xuất.
Ngân sách tác vụ (Bản thử nghiệm công khai)
Cùng với việc kiểm soát nỗ lực, Anthropic cũng giới thiệu ngân sách tác vụ (task budgets) — một cách để các nhà phát triển thiết lập giới hạn chi tiêu token cho các hoạt động chạy lâu dài. Điều này giúp bạn kiểm soát chi phí mà không cần quản lý chi tiết từng lần gọi API.
Cập nhật Claude Code
/ultrareview — Đánh giá mã nguồn đa Agent
Tính năng nổi bật của Claude Code là /ultrareview — một hệ thống đánh giá mã nguồn dựa trên đám mây, sử dụng nhiều sub-agent để phân tích mã của bạn:
- Giai đoạn phát hiện lỗi (Bug Detection Phase): Tạo ra 5-20 sub-agent hoạt động độc lập để khám phá các đường dẫn khác nhau trong cơ sở mã của bạn.
- Giai đoạn xác minh (Verification Phase): Các sub-agent riêng biệt sẽ xác minh từng lỗi tiềm năng, giúp lọc bỏ các kết quả dương tính giả (false positives).
Chế độ Auto cho người dùng Max
Chế độ tự động (Auto mode) — nơi Claude Code thực hiện các lệnh và chỉnh sửa mà không cần hỏi xác nhận — hiện đã khả dụng cho những người đăng ký gói Max.
Opus 4.7 vs GPT-5.4: Bạn nên sử dụng cái nào?
| Khía cạnh | Opus 4.7 | GPT-5.4 |
|---|---|---|
| Lập trình phức tạp | Dẫn đầu (refactoring đa tệp) | Mạnh nhưng đứng sau |
| Sử dụng máy tính | Chưa có sẵn | Dẫn đầu (75% OSWorld) |
| Ngữ cảnh dài | 1 triệu tokens, suy luận tốt hơn | 1.05 triệu tokens |
| Thị giác | 3.75MP, sơ đồ kỹ thuật | Tốt nhưng nhỏ hơn |
| Tốc độ | Chậm hơn, kỹ lưỡng hơn | Thực thi nhanh hơn |
| Giá cả | $5/$25 trên mỗi triệu triệu token | $2.50/$15 trên mỗi triệu triệu token |
| Hỗ trợ MCP | Bản địa, được tối ưu hóa | Hạn chế |
Cảnh báo về mức sử dụng Token
Opus 4.7 sử dụng một tokenizer được cập nhật để xử lý văn bản theo cách khác. Cùng một đầu vào có thể tương ứng với gấp 1.0–1.35 lần số lượng token tùy thuộc vào nội dung. Kết hợp với việc có nhiều token đầu ra hơn ở các mức độ nỗ lực cao hơn, chi phí của bạn có thể tăng lên mặc dù giá trên mỗi token không thay đổi.
Nếu bạn đang nâng cấp từ Opus 4.6, hãy theo dõi mức sử dụng token của mình trong vài ngày đầu tiên.
Các biện pháp bảo mật không gian mạng
Sau tình huống với Mythos Preview, Anthropic đã xây dựng các biện pháp bảo mật không gian mạng trực tiếp vào Opus 4.7:
- Tự động phát hiện và ngăn chặn các yêu cầu an ninh mạng bị cấm hoặc có rủi ro cao.
- Chương trình xác minh mạng (Cyber Verification Program) dành cho các nhà nghiên cứu bảo mật và chuyên gia kiểm thử xâm nhập hợp pháp.
- Được thiết kế có chủ đích ít khả năng hơn Mythos Preview trong lĩnh vực mạng, cho phép Anthropic thử nghiệm các biện pháp bảo vệ trên một mô hình ít quyền năng hơn trước.
Cách truy cập
# API
curl https://api.anthropic.com/v1/messages \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "content-type: application/json" \
-d '{"model": "claude-opus-4-7", "max_tokens": 1024, "messages": [{"role": "user", "content": "Xin chào"}]}'
# Claude Code
claude --model opus # mặc định sử dụng opus mới nhất
Cũng có sẵn trên Amazon Bedrock, Google Cloud Vertex AI và Microsoft Foundry ngay từ ngày đầu tiên.
Các câu hỏi thường gặp
Claude Opus 4.7 có giá bao nhiêu?
$5 cho mỗi triệu token đầu vào và $25 cho mỗi triệu token đầu ra — tương đương với Opus 4.6. Tuy nhiên, tokenizer được cập nhật có thể dẫn đến số lượng token nhiều hơn gấp 1.0-1.35 lần cho cùng một nội dung.
Opus 4.7 có tốt hơn GPT-5.4 không?
Đối với các tác vụ kỹ thuật phần mềm phức tạp và lập trình đa tệp, câu trả lời là có. Đối với việc sử dụng máy tính, tự động hóa máy tính để bàn và hiệu quả chi phí, GPT-5.4 hiện đang tốt hơn. Chúng vượt trội ở các lĩnh vực khác nhau.
Lệnh /ultrareview trong Claude Code là gì?
Đó là một hệ thống đánh giá mã nguồn đa agent, tạo ra 5-20 sub-agent để độc lập tìm lỗi trong mã của bạn, sau đó xác minh từng phát hiện để lọc bỏ các lỗi sai. Người dùng Pro và Max được tặng 3 lần ultrareview miễn phí.
So sánh Opus 4.7 với Claude Mythos Preview như thế nào?
Mythos Preview có khả năng cao hơn đáng kể (93.9% so với ~85-90% trên SWE-bench) nhưng không được cung cấp công khai. Opus 4.7 là mô hình Claude tốt nhất mà bạn thực sự có thể sử dụng.
Tôi có nên nâng cấp từ Opus 4.6 không?
Có, nếu bạn thực hiện lập trình phức tạp hoặc làm việc với các hình ảnh kỹ thuật. Cải thiện 13% về lập trình và độ phân giải thị giác gấp 3 lần là những nâng cấp có ý nghĩa. Chỉ cần chú ý mức sử dụng token của bạn vì tokenizer mới có thể làm tăng chi phí.
Mức độ nỗ lực "xhigh" là gì?
Một cài đặt nỗ lực mới nằm giữa "high" và "max", mang lại chiều sâu suy luận cao hơn mà không tốn toàn bộ chi phí token của mức nỗ lực tối đa (max). Phù hợp cho các tác vụ khó khi bạn muốn chất lượng nhưng cần kiểm soát chi phí.
Điểm mấu chốt
Opus 4.7 là một bản nâng cấp vững chắc, không phải là một cuộc cách mạng. Những cải tiến về lập trình là có thật, sự nâng cấp về thị giác rất đáng kể và /ultrareview là một khả năng thực sự mới mẻ. Nhưng tin tức lớn nhất có lẽ là những gì nó không có — đó không phải là Mythos Preview. Khoảng cách giữa các mô hình công khai và riêng tư của Anthropic hiện đang rộng hơn bao giờ hết.
Đối với các nhà phát triển, Opus 4.7 là mô hình Claude công khai tốt nhất và là lựa chọn mạnh mẽ cho các công việc kỹ thuật phức tạp. Nếu bạn muốn xây dựng các sản phẩm hỗ trợ AI mà không cần quản lý mô hình và cơ sở hạ tầng, Y Build sẽ xử lý việc đó cho bạn — hãy coi nó như một AI agent ưu tiên di động giúp vận chuyển sản phẩm, không cần máy chủ hay terminal.