Claude Opus 4.7: Có gì mới, Điểm chuẩn & Hướng dẫn đầy đủ (2026)

Q: Opus 4.7 vs GPT-5.4: Bạn nên sử dụng cái nào?

| Khía cạnh | Opus 4.7 | GPT-5.4 | |-----------|----------|---------| | Lập trình phức tạp | Dẫn đầu (refactoring đa tệp) | Mạnh nhưng đứng sau |

TL;DR

Chi tiết	Claude Opus 4.7
Ngày phát hành	16 tháng 4, 2026
Model ID	`claude-opus-4-7`
Giá cả	$5/$25 trên mỗi triệu token (tương đương Opus 4.6)
Cửa sổ ngữ cảnh	1 triệu tokens
Khả năng tiếp cận	API, Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry
Cải tiến chính	Lập trình tốt hơn 13%, thị giác gấp 3 lần, các mức độ nỗ lực mới
SWE-bench Verified	~85-90% (tăng từ 80.8%)
Tính năng Claude Code mới	`/ultrareview` — đánh giá mã nguồn đa agent

Có gì mới trong Claude Opus 4.7?

Claude Opus 4.7 là mô hình tiên phong mới nhất của Anthropic hiện đã được phát hành rộng rãi vào ngày 16 tháng 4 năm 2026. Đây là một bản nâng cấp gia tăng nhưng đầy ý nghĩa so với Opus 4.6, với những bước tiến lớn nhất nằm ở lĩnh vực kỹ thuật phần mềm và thị giác.

Khác với Claude Mythos Preview (phiên bản mà Anthropic chỉ giới hạn cho các đối tác an ninh mạng), Opus 4.7 có sẵn công khai trên tất cả các sản phẩm và API của Claude.

Kết quả điểm chuẩn (Benchmarks)

Kỹ thuật phần mềm

Điểm chuẩn	Opus 4.7	Opus 4.6	GPT-5.4	Mythos Preview
SWE-bench Verified	~85-90%	80.8%	~80%	93.9%
SWE-bench Pro	~45%	—	57.7%	77.8%
Terminal-Bench 2.0	65.4%	66.5%	75.1%	82%
Lập trình 93 tác vụ nội bộ	+13% so với 4.6	baseline	—	—
Rakuten-SWE-Bench	Giải quyết gấp 3 lần	baseline	—	—

Cải tiến lớn nhất nằm ở các tác vụ khó, đa tệp tin. Anthropic đặc biệt nhấn mạnh những bước tiến trong "các tác vụ khó khăn nhất" — loại tác vụ yêu cầu hiểu biết về nhiều tệp tin, refactoring phức tạp và xác minh kết quả đầu ra.

Các khả năng khác

Lĩnh vực	Cải tiến
Suy luận tài liệu	Giảm 21% lỗi
Tự động hóa nhà máy	Hiệu suất tăng 10-15%
Thị giác	Độ phân giải hình ảnh gấp 3 lần (lên đến 2,576px / 3.75MP)
Ngữ cảnh dài	Cải thiện khả năng truy xuất và suy luận trên 1 triệu tokens
Tối ưu hóa MCP	Giảm 30% chi phí token bổ sung so với Opus 4.5

Nâng cấp thị giác: Độ phân giải gấp 3 lần

Opus 4.7 chấp nhận hình ảnh lên tới 2,576 pixel ở cạnh dài (~3.75 megapixels) — gấp hơn 3 lần so với khả năng trước đó. Điều này có ý nghĩa quan trọng đối với:

Sơ đồ kỹ thuật — biểu đồ kiến trúc, sơ đồ mạch điện
Cấu trúc hóa học — sơ đồ phân tử ở chất lượng xuất bản
Ảnh chụp màn hình dày đặc — ảnh chụp toàn trang của mã nguồn, bảng điều khiển (dashboards), bảng tính
Bản phác thảo thiết kế — thiết kế UI độ trung thực cao

Nếu bạn từng cảm thấy thất vọng vì khả năng hiểu hình ảnh của Claude đối với các chi tiết phức tạp, thì đây là một bản nâng cấp đáng kể.

Mới: Kiểm soát nỗ lực với "xhigh"

Opus 4.7 giới thiệu một mức độ nỗ lực (effort level) mới: xhigh — nằm giữa mức "high" và "max".

Mức độ nỗ lực	Trường hợp sử dụng	Mức sử dụng Token
low	Các truy vấn đơn giản, câu trả lời nhanh	Tối thiểu
medium	Các tác vụ tiêu chuẩn	Bình thường
high	Suy luận phức tạp	Tăng cao
xhigh	Các tác vụ đa bước khó khăn	Cao
max	Các vấn đề khó nhất, chất lượng cao nhất	Tối đa

Mức xhigh mang lại cho bạn chiều sâu suy luận tốt hơn so với "high" mà không tốn toàn bộ chi phí token như mức "max" — một lựa chọn trung gian thực tế cho các khối lượng công việc sản xuất.

Ngân sách tác vụ (Bản thử nghiệm công khai)

Cùng với việc kiểm soát nỗ lực, Anthropic cũng giới thiệu ngân sách tác vụ (task budgets) — một cách để các nhà phát triển thiết lập giới hạn chi tiêu token cho các hoạt động chạy lâu dài. Điều này giúp bạn kiểm soát chi phí mà không cần quản lý chi tiết từng lần gọi API.

Cập nhật Claude Code

/ultrareview — Đánh giá mã nguồn đa Agent

Tính năng nổi bật của Claude Code là /ultrareview — một hệ thống đánh giá mã nguồn dựa trên đám mây, sử dụng nhiều sub-agent để phân tích mã của bạn:

Giai đoạn phát hiện lỗi (Bug Detection Phase): Tạo ra 5-20 sub-agent hoạt động độc lập để khám phá các đường dẫn khác nhau trong cơ sở mã của bạn.
Giai đoạn xác minh (Verification Phase): Các sub-agent riêng biệt sẽ xác minh từng lỗi tiềm năng, giúp lọc bỏ các kết quả dương tính giả (false positives).

Người dùng Pro và Max sẽ nhận được 3 lần ultrareview miễn phí. Đây là khả năng đánh giá mã nguồn tinh vi nhất trong số các công cụ lập trình AI hiện nay.

Chế độ Auto cho người dùng Max

Chế độ tự động (Auto mode) — nơi Claude Code thực hiện các lệnh và chỉnh sửa mà không cần hỏi xác nhận — hiện đã khả dụng cho những người đăng ký gói Max.

Opus 4.7 vs GPT-5.4: Bạn nên sử dụng cái nào?

Khía cạnh	Opus 4.7	GPT-5.4
Lập trình phức tạp	Dẫn đầu (refactoring đa tệp)	Mạnh nhưng đứng sau
Sử dụng máy tính	Chưa có sẵn	Dẫn đầu (75% OSWorld)
Ngữ cảnh dài	1 triệu tokens, suy luận tốt hơn	1.05 triệu tokens
Thị giác	3.75MP, sơ đồ kỹ thuật	Tốt nhưng nhỏ hơn
Tốc độ	Chậm hơn, kỹ lưỡng hơn	Thực thi nhanh hơn
Giá cả	$5/$25 trên mỗi triệu triệu token	$2.50/$15 trên mỗi triệu triệu token
Hỗ trợ MCP	Bản địa, được tối ưu hóa	Hạn chế

Chọn Opus 4.7 cho: kỹ thuật phần mềm phức tạp, refactoring đa tệp, phân tích ngữ cảnh dài, suy luận tài liệu kỹ thuật, quy trình làm việc agentic với MCP. Chọn GPT-5.4 cho: sử dụng/tự động hóa máy tính, tạo mẫu nhanh, các ứng dụng nhạy cảm về chi phí, các tác vụ agent trên máy tính để bàn.

Cảnh báo về mức sử dụng Token

Opus 4.7 sử dụng một tokenizer được cập nhật để xử lý văn bản theo cách khác. Cùng một đầu vào có thể tương ứng với gấp 1.0–1.35 lần số lượng token tùy thuộc vào nội dung. Kết hợp với việc có nhiều token đầu ra hơn ở các mức độ nỗ lực cao hơn, chi phí của bạn có thể tăng lên mặc dù giá trên mỗi token không thay đổi.

Nếu bạn đang nâng cấp từ Opus 4.6, hãy theo dõi mức sử dụng token của mình trong vài ngày đầu tiên.

Các biện pháp bảo mật không gian mạng

Sau tình huống với Mythos Preview, Anthropic đã xây dựng các biện pháp bảo mật không gian mạng trực tiếp vào Opus 4.7:

Tự động phát hiện và ngăn chặn các yêu cầu an ninh mạng bị cấm hoặc có rủi ro cao.
Chương trình xác minh mạng (Cyber Verification Program) dành cho các nhà nghiên cứu bảo mật và chuyên gia kiểm thử xâm nhập hợp pháp.
Được thiết kế có chủ đích ít khả năng hơn Mythos Preview trong lĩnh vực mạng, cho phép Anthropic thử nghiệm các biện pháp bảo vệ trên một mô hình ít quyền năng hơn trước.

Cách truy cập

bash

# API
curl https://api.anthropic.com/v1/messages \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "content-type: application/json" \
  -d '{"model": "claude-opus-4-7", "max_tokens": 1024, "messages": [{"role": "user", "content": "Xin chào"}]}'

# Claude Code
claude --model opus  # mặc định sử dụng opus mới nhất

Cũng có sẵn trên Amazon Bedrock, Google Cloud Vertex AI và Microsoft Foundry ngay từ ngày đầu tiên.

Các câu hỏi thường gặp

Claude Opus 4.7 có giá bao nhiêu?

$5 cho mỗi triệu token đầu vào và $25 cho mỗi triệu token đầu ra — tương đương với Opus 4.6. Tuy nhiên, tokenizer được cập nhật có thể dẫn đến số lượng token nhiều hơn gấp 1.0-1.35 lần cho cùng một nội dung.

Opus 4.7 có tốt hơn GPT-5.4 không?

Đối với các tác vụ kỹ thuật phần mềm phức tạp và lập trình đa tệp, câu trả lời là có. Đối với việc sử dụng máy tính, tự động hóa máy tính để bàn và hiệu quả chi phí, GPT-5.4 hiện đang tốt hơn. Chúng vượt trội ở các lĩnh vực khác nhau.

Lệnh /ultrareview trong Claude Code là gì?

Đó là một hệ thống đánh giá mã nguồn đa agent, tạo ra 5-20 sub-agent để độc lập tìm lỗi trong mã của bạn, sau đó xác minh từng phát hiện để lọc bỏ các lỗi sai. Người dùng Pro và Max được tặng 3 lần ultrareview miễn phí.

So sánh Opus 4.7 với Claude Mythos Preview như thế nào?

Mythos Preview có khả năng cao hơn đáng kể (93.9% so với ~85-90% trên SWE-bench) nhưng không được cung cấp công khai. Opus 4.7 là mô hình Claude tốt nhất mà bạn thực sự có thể sử dụng.

Tôi có nên nâng cấp từ Opus 4.6 không?

Có, nếu bạn thực hiện lập trình phức tạp hoặc làm việc với các hình ảnh kỹ thuật. Cải thiện 13% về lập trình và độ phân giải thị giác gấp 3 lần là những nâng cấp có ý nghĩa. Chỉ cần chú ý mức sử dụng token của bạn vì tokenizer mới có thể làm tăng chi phí.

Mức độ nỗ lực "xhigh" là gì?

Một cài đặt nỗ lực mới nằm giữa "high" và "max", mang lại chiều sâu suy luận cao hơn mà không tốn toàn bộ chi phí token của mức nỗ lực tối đa (max). Phù hợp cho các tác vụ khó khi bạn muốn chất lượng nhưng cần kiểm soát chi phí.

Điểm mấu chốt

Opus 4.7 là một bản nâng cấp vững chắc, không phải là một cuộc cách mạng. Những cải tiến về lập trình là có thật, sự nâng cấp về thị giác rất đáng kể và /ultrareview là một khả năng thực sự mới mẻ. Nhưng tin tức lớn nhất có lẽ là những gì nó không có — đó không phải là Mythos Preview. Khoảng cách giữa các mô hình công khai và riêng tư của Anthropic hiện đang rộng hơn bao giờ hết.

Đối với các nhà phát triển, Opus 4.7 là mô hình Claude công khai tốt nhất và là lựa chọn mạnh mẽ cho các công việc kỹ thuật phức tạp. Nếu bạn muốn xây dựng các sản phẩm hỗ trợ AI mà không cần quản lý mô hình và cơ sở hạ tầng, Y Build sẽ xử lý việc đó cho bạn — hãy coi nó như một AI agent ưu tiên di động giúp vận chuyển sản phẩm, không cần máy chủ hay terminal.