Claude Sonnet 4.6 cho Lập trình viên: Hướng dẫn thực tế

TL;DR

Claude Sonnet 4.6 là mô hình tốt nhất cho hầu hết các công việc phát triển vào tháng 2 năm 2026. Dưới đây là hướng dẫn thực tế:

Claude Code: Sử dụng Sonnet 4.6 làm mặc định. Chi phí khoảng $0.60/phiên làm việc so với $3.00 khi dùng Opus. Sự khác biệt về chất lượng là không đáng kể đối với 90% tác vụ.
Computer use agents: Đạt 72.5% trên OSWorld — đã sẵn sàng cho môi trường production. Xây dựng các agent tự động hóa trình duyệt, điền biểu mẫu, và kiểm thử với mức giá của Sonnet.
API integration: Model ID claude-sonnet-4-6-20250217. Cùng mức giá với Sonnet 4.5 ($3/$15). Có thể thay thế trực tiếp (drop-in replacement).
Khi nào nên dùng Opus: Tái cấu trúc (refactor) quy mô toàn bộ codebase, điều phối đa agent (multi-agent coordination), giải quyết các vấn đề mới lạ.
1M context (beta): Cung cấp toàn bộ codebase. Kết hợp với context compaction cho các phiên làm việc dài hơn nữa.

Claude Code với Sonnet 4.6

Điều gì đã thay đổi

Sonnet 4.6 là mô hình mặc định cho Claude Code. Những cải tiến so với Sonnet 4.5 có thể nhận thấy ngay lập tức:

Trước đây (hành vi của Sonnet 4.5):

Đôi khi sửa đổi mã mà không đọc đầy đủ ngữ cảnh.
Thỉnh thoảng tạo ra logic trùng lặp đã tồn tại ở nơi khác.
Tuyên bố "đã sửa lỗi" trong khi việc sửa lỗi chưa hoàn thành.
Thêm các lớp trừu tượng không cần thiết "để linh hoạt trong tương lai".
Mất dấu các tác vụ nhiều bước trong các phiên làm việc dài.

Hiện tại (hành vi của Sonnet 4.6):

Đọc ngữ cảnh mã hiện có trước khi sửa đổi.
Hợp nhất logic thay vì sao chép trùng lặp.
Ít tuyên bố thành công giả hơn — trung thực hơn về những gì chưa hoàn thành.
Ít thiết kế quá mức (over-engineering) — thực hiện đúng những gì bạn yêu cầu, không thừa thãi.
Theo sát công việc tốt hơn trong các phiên làm việc dài nhờ context compaction.

Các lập trình viên ưu tiên Sonnet 4.6 hơn Sonnet 4.5 70% thời gian trong các bài kiểm tra. Đáng ngạc nhiên hơn, họ ưu tiên nó hơn cả Opus 4.5 (mô hình frontier tháng 11) 59% thời gian.

Tác động về chi phí

Mô hình	Chi phí phiên làm việc điển hình (100K input + 20K output)
Sonnet 4.6	$0.60
Sonnet 4.5	$0.60 (cùng giá, chất lượng kém hơn)
Opus 4.6	$3.00

Bạn nhận được kết quả tốt hơn rõ rệt với cùng một mức chi phí. Hoặc tương đương: các tác vụ trước đây yêu cầu Opus ($3.00/phiên) giờ đây hoạt động tốt trên Sonnet ($0.60/phiên) — giúp giảm 80% chi phí với sự sụt giảm chất lượng tối thiểu.

Khi nào nên dùng Opus

Hãy giữ lại Opus 4.6 cho:

Tái cấu trúc (refactor) toàn bộ codebase — Opus đạt 65.4% trên Terminal-Bench 2.0 so với 59.1% của Sonnet. Khi bạn đang tái cấu trúc kiến trúc trên hàng chục tệp tin, khoảng cách 6.3% này rất quan trọng.

Điều phối đa agent (multi-agent coordination) — Opus xử lý việc điều phối phức tạp tốt hơn khi nhiều AI agent cần cộng tác trong một tác vụ duy nhất.

Các vấn đề mới lạ — ARC-AGI-2: Opus 68.8% so với Sonnet 58.3%. Nếu bạn đang giải quyết một vấn đề thực sự độc đáo mà mô hình chưa từng thấy mẫu trước đó, Opus có khả năng suy luận sâu hơn.

Nghiên cứu web chuyên sâu — BrowseComp: Opus 84.0% so với Sonnet 74.7%. Khi bạn cần tìm kiếm mang tính tác nhân (agentic search) toàn diện trên nhiều nguồn.

Đối với mọi thứ khác — triển khai tính năng, sửa lỗi, viết test, tài liệu, code review — Sonnet 4.6 là lựa chọn đúng đắn.

Mẹo thực tế khi dùng Claude Code

Sử dụng cửa sổ ngữ cảnh 1M (1M context window): Sonnet 4.6 hỗ trợ 1M token trong bản beta. Đối với các codebase lớn, điều này có nghĩa là ít phải chuyển đổi ngữ cảnh hơn và hiểu biết xuyên suốt các tệp tin tốt hơn. Context compaction: Các phiên lập trình dài không còn bị giảm chất lượng. Tính năng compaction của Sonnet 4.6 tự động tóm tắt các đoạn hội thoại cũ, giữ cho ngữ cảnh gần đây luôn sắc bén ngay cả sau nhiều giờ làm việc. Hãy cụ thể, đừng dài dòng: Sonnet 4.6 tuân thủ hướng dẫn tốt hơn bất kỳ phiên bản Sonnet nào trước đó. Các prompt ngắn gọn, rõ ràng mang lại hiệu quả cao hơn các giải thích dài dòng:

# Tốt
"Add input validation to the signup form. Email must be valid, password min 8 chars. Show inline errors."

# Không cần thiết
"I would like you to please add comprehensive input validation to our user registration form component. Specifically, we need to validate that the email address follows proper RFC 5322 format and that passwords meet our minimum security requirements of at least 8 characters in length. Please implement inline error messages that appear below each form field to provide users with clear feedback about what needs to be corrected."

Cả hai prompt đều cho kết quả tương tự với Sonnet 4.6. Cái đầu tiên nhanh hơn và rẻ hơn.

Xây dựng Computer Use Agents

Tại sao Sonnet 4.6 thay đổi cuộc chơi

Computer use là khả năng đột phá của Sonnet 4.6:

Mô hình	Điểm OSWorld	Chi phí (trên mỗi triệu token)
Sonnet 4.6	72.5%	$3/$15
Opus 4.6	72.7%	$15/$75
GPT-5.2	38.2%	$5/$15

Sonnet 4.6 ngang ngửa với Opus về computer use nhưng với mức giá chỉ bằng 1/5. GPT-5.2 thậm chí còn chưa theo kịp. Điều này có nghĩa là các agent sử dụng máy tính hiện đã khả thi về mặt kinh tế cho các khối lượng công việc production.

Những gì Computer Use Agent có thể làm

Các trường hợp sử dụng thực tế hoạt động ổn định với Sonnet 4.6:

Trích xuất dữ liệu từ các hệ thống cũ (legacy):

Điều hướng các bảng quản trị trên web.
Điền vào các biểu mẫu tìm kiếm, trích xuất kết quả.
Xuất dữ liệu không có API.

Kiểm thử tự động:

Đi bộ qua các luồng người dùng (user flows) trong trình duyệt thực.
Xác minh bố cục hình ảnh, các thành phần tương tác.
Kiểm tra biểu mẫu, điều hướng, các trạng thái lỗi.

Điền biểu mẫu ở quy mô lớn:

Đơn đăng ký bảo hiểm (độ chính xác 94% theo báo cáo của Pace).
Các biểu mẫu chính phủ.
Giấy tờ tiếp nhận nhà cung cấp (vendor onboarding).

Tự động hóa bảng tính:

Điều hướng các tệp Excel/Google Sheets phức tạp.
Áp dụng công thức, tạo biểu đồ.
Đối chiếu dữ liệu giữa các trang tính.

Xây dựng một Computer Use Agent

python

import anthropic

client = anthropic.Anthropic()

# Agent computer use cơ bản
response = client.messages.create(
    model="claude-sonnet-4-6-20250217",
    max_tokens=4096,
    tools=[
        {
            "type": "computer_20250124",
            "name": "computer",
            "display_width_px": 1920,
            "display_height_px": 1080,
        }
    ],
    messages=[
        {
            "role": "user",
            "content": "Go to our admin dashboard at app.example.com, "
                       "navigate to the Users section, and export the "
                       "list of users who signed up this month as CSV."
        }
    ],
)

Xem xét về an toàn

Sonnet 4.6 đã cải thiện đáng kể khả năng chống lại prompt injection cho computer use — tương đương với cấp độ của Opus 4.6. Điều này rất quan trọng vì các agent sử dụng máy tính tương tác với nội dung web không đáng tin cậy.

Các thực hành tốt nhất:

Cô lập các computer use agent trong môi trường sandbox (VMs, containers).

Không cấp cho agent quyền truy cập vào các thông tin nhạy cảm trừ khi thực sự cần thiết.

Ghi lại (log) tất cả các hành động để phục vụ kiểm tra (audit trails).

Thiết lập rào chắn (guardrails) về các tên miền/ứng dụng mà agent có thể tương tác.

Tích hợp API

Di chuyển từ Sonnet 4.5

Sonnet 4.6 là một sự thay thế trực tiếp. Cùng mức giá, cùng cấu trúc API, kết quả tốt hơn.

python

# Thay đổi cái này:
model="claude-sonnet-4-5-20250514"
# Thành cái này:
model="claude-sonnet-4-6-20250217"

Không yêu cầu thay đổi mã nguồn nào khác.

Extended Thinking (Tư duy mở rộng)

Sonnet 4.6 hỗ trợ extended thinking, cho phép nó dành nhiều tính toán hơn cho các vấn đề khó hơn:

python

response = client.messages.create(
    model="claude-sonnet-4-6-20250217",
    max_tokens=16000,
    thinking={
        "type": "enabled",
        "budget_tokens": 10000  # token dành cho "suy luận"
    },
    messages=[{"role": "user", "content": "Complex reasoning task here"}],
)

Lưu ý quan trọng: Sonnet 4.6 hoạt động tốt ngay cả khi không có extended thinking. Chỉ sử dụng nó cho các tác vụ suy luận thực sự khó, đừng dùng làm mặc định — bạn sẽ tiết kiệm được token và giảm độ trễ.

Xử lý hàng loạt (Batch Processing)

Đối với khối lượng công việc lớn, không khẩn cấp:

python

# Gửi một loạt yêu cầu với mức giảm giá 50%
batch = client.messages.batches.create(
    requests=[
        {
            "custom_id": f"request-{i}",
            "params": {
                "model": "claude-sonnet-4-6-20250217",
                "max_tokens": 1024,
                "messages": [{"role": "user", "content": prompt}],
            },
        }
        for i, prompt in enumerate(prompts)
    ]
)

Batch processing giúp cắt giảm chi phí API thêm 50%. Kết hợp với mức giá vốn đã thấp của Sonnet 4.6, điều này làm cho các hoạt động AI quy mô lớn trở nên rất hợp túi tiền.

Truy cập qua nền tảng Cloud

Amazon Bedrock:

python

# Model ID cho Bedrock
model_id = "anthropic.claude-sonnet-4-6-20250217-v1:0"

Google Vertex AI:

python

# Model ID cho Vertex
model_id = "claude-sonnet-4-6@20250217"

Cả hai đều có sẵn ngay từ ngày đầu ra mắt.

Chiến lược tối ưu hóa chi phí

1. Mặc định dùng Sonnet, nâng cấp lên Opus khi cần

Yêu cầu người dùng → Sonnet 4.6 (thử lần đầu)
                   ↓ nếu độ tin cậy < ngưỡng
                 Opus 4.6 (thử lại)

Quy trình này giải quyết 90% tác vụ ở mức giá của Sonnet. Chỉ những vấn đề thực sự khó nhất mới cần đến Opus.

2. Sử dụng Prompt Caching

Claude hỗ trợ prompt caching — lưu trữ các system prompt hoặc tài liệu tham khảo được sử dụng thường xuyên và tái sử dụng chúng qua các yêu cầu. Các token đầu vào được cache có chi phí thấp hơn 90%.

python

response = client.messages.create(
    model="claude-sonnet-4-6-20250217",
    max_tokens=1024,
    system=[
        {
            "type": "text",
            "text": "Your long system prompt here...",
            "cache_control": {"type": "ephemeral"}
        }
    ],
    messages=[{"role": "user", "content": "User query"}],
)

3. Gom nhóm các công việc không khẩn cấp

Code review, tạo tài liệu, viết test — bất cứ thứ gì không cần phản hồi theo thời gian thực đều có thể chạy qua batch processing để được giảm giá 50%.

4. Context Compaction cho các phiên làm việc dài

Thay vì bắt đầu các phiên làm việc mới khi ngữ cảnh quá dài, hãy để tính năng compaction của Sonnet 4.6 xử lý. Điều này giúp tránh việc gửi lại system prompt và mất đi ngữ cảnh đã tích lũy.

Ước tính chi phí hàng tháng

Trường hợp sử dụng	Số phiên/ngày	Mô hình	Chi phí hàng tháng
Lập trình viên cá nhân	20	Sonnet 4.6	~$360
Đội ngũ nhỏ (5 người)	100	Sonnet 4.6	~$1,800
Đội ngũ nhỏ (5 người)	100	Opus 4.6	~$9,000
Hệ thống AI agent	500	Sonnet 4.6	~$9,000
Hệ thống AI agent	500	Sonnet 4.6 (batch)	~$4,500

Sự khác biệt giữa Sonnet và Opus là $7,200/tháng cho một đội ngũ 5 người. Con số đó tương đương với lương của một nhân viên toàn thời gian.

Quy trình làm việc thực tế: Triển khai một tính năng với Sonnet 4.6

Dưới đây là cách triển khai một tính năng điển hình với Sonnet 4.6 trong Claude Code:

Bước 1: Mô tả tính năng

"Add a user notification preferences page. Users should be able to
toggle email, push, and in-app notifications for: new messages,
mentions, and weekly digest. Store preferences in the existing
user_settings table. Use our existing UI component library."

Bước 2: Sonnet 4.6 khám phá codebase

Khác với các phiên bản Sonnet trước, 4.6 sẽ:

Đọc thư viện component hiện tại của bạn để khớp với hệ thống thiết kế (design system).
Kiểm tra schema của bảng user_settings.
Xem cách cấu trúc của các trang cài đặt hiện có.
Xem lại cách triển khai hệ thống thông báo của bạn.

Bước 3: Triển khai

Sonnet 4.6 tạo ra:

Database migration cho các cột tùy chọn mới.
API endpoint để đọc/cập nhật tùy chọn.
React component sử dụng design system hiện tại của bạn.
Các bài test bao quát các luồng chính.

Bước 4: Review và Ship

Mã nguồn tuân theo các mẫu (patterns) hiện có của bạn vì Sonnet 4.6 đã thực sự đọc chúng. Ít phải trao đổi qua lại hơn, ít các bản sửa lỗi kiểu "thực tế là chúng tôi làm theo cách này" hơn.

Bước 5: Deploy

Đẩy lên pipeline triển khai của bạn. Nếu bạn đang sử dụng Y Build, việc triển khai, SEO và phân tích sẽ được xử lý tự động.

Tổng thời gian: 15-30 phút cho một tính năng mà bình thường sẽ mất một ngày để xây dựng thủ công.

Điều gì sẽ xảy ra tiếp theo

Sonnet 4.6 là bản phát hành lớn thứ hai của Anthropic trong vòng 11 ngày (sau Opus 4.6). Tốc độ này cho thấy:

1M context sẽ sớm chuyển từ beta sang phát hành rộng rãi (GA).
Độ tin cậy của Computer use sẽ tiếp tục được cải thiện (quỹ đạo từ 14.9% lên 72.5% trong 16 tháng là phi thường).
Model routing — tự động lựa chọn giữa Sonnet và Opus dựa trên độ phức tạp của tác vụ — có khả năng sẽ xuất hiện trên Claude Code.

Đối với các lập trình viên, bài học thực tế là: hãy chuyển sang Sonnet 4.6 ngay bây giờ. Nó tốt hơn, rẻ hơn (so với việc dùng Opus) và nó là lựa chọn mặc định.

Triển khai nhanh hơn với AI. Y Build kết hợp với Claude Code để hỗ trợ phát triển bằng AI, sau đó xử lý phần còn lại: triển khai lên production chỉ với một cú nhấp chuột, Demo Cut cho các video giới thiệu sản phẩm, AI SEO cho lưu lượng truy cập tự nhiên và phân tích để theo dõi sự tăng trưởng. Từ dòng code đến khách hàng. Bắt đầu miễn phí.

Nguồn:

TL;DR

Claude Sonnet 4.6 là mô hình tốt nhất cho hầu hết các công việc phát triển vào tháng 2 năm 2026. Dưới đây là hướng dẫn thực tế:

Claude Code: Sử dụng Sonnet 4.6 làm mặc định. Chi phí khoảng $0.60/phiên làm việc so với $3.00 khi dùng Opus. Sự khác biệt về chất lượng là không đáng kể đối với 90% tác vụ.
Computer use agents: Đạt 72.5% trên OSWorld — đã sẵn sàng cho môi trường production. Xây dựng các agent tự động hóa trình duyệt, điền biểu mẫu, và kiểm thử với mức giá của Sonnet.
API integration: Model ID claude-sonnet-4-6-20250217. Cùng mức giá với Sonnet 4.5 ($3/$15). Có thể thay thế trực tiếp (drop-in replacement).
Khi nào nên dùng Opus: Tái cấu trúc (refactor) quy mô toàn bộ codebase, điều phối đa agent (multi-agent coordination), giải quyết các vấn đề mới lạ.
1M context (beta): Cung cấp toàn bộ codebase. Kết hợp với context compaction cho các phiên làm việc dài hơn nữa.

Claude Code với Sonnet 4.6

Điều gì đã thay đổi

Sonnet 4.6 là mô hình mặc định cho Claude Code. Những cải tiến so với Sonnet 4.5 có thể nhận thấy ngay lập tức:

Trước đây (hành vi của Sonnet 4.5):

Đôi khi sửa đổi mã mà không đọc đầy đủ ngữ cảnh.
Thỉnh thoảng tạo ra logic trùng lặp đã tồn tại ở nơi khác.
Tuyên bố "đã sửa lỗi" trong khi việc sửa lỗi chưa hoàn thành.
Thêm các lớp trừu tượng không cần thiết "để linh hoạt trong tương lai".
Mất dấu các tác vụ nhiều bước trong các phiên làm việc dài.

Hiện tại (hành vi của Sonnet 4.6):

Đọc ngữ cảnh mã hiện có trước khi sửa đổi.
Hợp nhất logic thay vì sao chép trùng lặp.
Ít tuyên bố thành công giả hơn — trung thực hơn về những gì chưa hoàn thành.
Ít thiết kế quá mức (over-engineering) — thực hiện đúng những gì bạn yêu cầu, không thừa thãi.
Theo sát công việc tốt hơn trong các phiên làm việc dài nhờ context compaction.

Tác động về chi phí

Mô hình	Chi phí phiên làm việc điển hình (100K input + 20K output)
Sonnet 4.6	$0.60
Sonnet 4.5	$0.60 (cùng giá, chất lượng kém hơn)
Opus 4.6	$3.00

Khi nào nên dùng Opus

Hãy giữ lại Opus 4.6 cho:

Tái cấu trúc (refactor) toàn bộ codebase — Opus đạt 65.4% trên Terminal-Bench 2.0 so với 59.1% của Sonnet. Khi bạn đang tái cấu trúc kiến trúc trên hàng chục tệp tin, khoảng cách 6.3% này rất quan trọng.

Điều phối đa agent (multi-agent coordination) — Opus xử lý việc điều phối phức tạp tốt hơn khi nhiều AI agent cần cộng tác trong một tác vụ duy nhất.

Các vấn đề mới lạ — ARC-AGI-2: Opus 68.8% so với Sonnet 58.3%. Nếu bạn đang giải quyết một vấn đề thực sự độc đáo mà mô hình chưa từng thấy mẫu trước đó, Opus có khả năng suy luận sâu hơn.

Nghiên cứu web chuyên sâu — BrowseComp: Opus 84.0% so với Sonnet 74.7%. Khi bạn cần tìm kiếm mang tính tác nhân (agentic search) toàn diện trên nhiều nguồn.

Đối với mọi thứ khác — triển khai tính năng, sửa lỗi, viết test, tài liệu, code review — Sonnet 4.6 là lựa chọn đúng đắn.

Mẹo thực tế khi dùng Claude Code

# Tốt
"Add input validation to the signup form. Email must be valid, password min 8 chars. Show inline errors."

# Không cần thiết
"I would like you to please add comprehensive input validation to our user registration form component. Specifically, we need to validate that the email address follows proper RFC 5322 format and that passwords meet our minimum security requirements of at least 8 characters in length. Please implement inline error messages that appear below each form field to provide users with clear feedback about what needs to be corrected."

Cả hai prompt đều cho kết quả tương tự với Sonnet 4.6. Cái đầu tiên nhanh hơn và rẻ hơn.

Xây dựng Computer Use Agents

Tại sao Sonnet 4.6 thay đổi cuộc chơi

Computer use là khả năng đột phá của Sonnet 4.6:

Mô hình	Điểm OSWorld	Chi phí (trên mỗi triệu token)
Sonnet 4.6	72.5%	$3/$15
Opus 4.6	72.7%	$15/$75
GPT-5.2	38.2%	$5/$15

Những gì Computer Use Agent có thể làm

Các trường hợp sử dụng thực tế hoạt động ổn định với Sonnet 4.6:

Trích xuất dữ liệu từ các hệ thống cũ (legacy):

Điều hướng các bảng quản trị trên web.
Điền vào các biểu mẫu tìm kiếm, trích xuất kết quả.
Xuất dữ liệu không có API.

Kiểm thử tự động:

Đi bộ qua các luồng người dùng (user flows) trong trình duyệt thực.
Xác minh bố cục hình ảnh, các thành phần tương tác.
Kiểm tra biểu mẫu, điều hướng, các trạng thái lỗi.

Điền biểu mẫu ở quy mô lớn:

Đơn đăng ký bảo hiểm (độ chính xác 94% theo báo cáo của Pace).
Các biểu mẫu chính phủ.
Giấy tờ tiếp nhận nhà cung cấp (vendor onboarding).

Tự động hóa bảng tính:

Điều hướng các tệp Excel/Google Sheets phức tạp.
Áp dụng công thức, tạo biểu đồ.
Đối chiếu dữ liệu giữa các trang tính.

Xây dựng một Computer Use Agent

python

import anthropic

client = anthropic.Anthropic()

# Agent computer use cơ bản
response = client.messages.create(
    model="claude-sonnet-4-6-20250217",
    max_tokens=4096,
    tools=[
        {
            "type": "computer_20250124",
            "name": "computer",
            "display_width_px": 1920,
            "display_height_px": 1080,
        }
    ],
    messages=[
        {
            "role": "user",
            "content": "Go to our admin dashboard at app.example.com, "
                       "navigate to the Users section, and export the "
                       "list of users who signed up this month as CSV."
        }
    ],
)

Xem xét về an toàn

Các thực hành tốt nhất:

Cô lập các computer use agent trong môi trường sandbox (VMs, containers).

Không cấp cho agent quyền truy cập vào các thông tin nhạy cảm trừ khi thực sự cần thiết.

Ghi lại (log) tất cả các hành động để phục vụ kiểm tra (audit trails).

Thiết lập rào chắn (guardrails) về các tên miền/ứng dụng mà agent có thể tương tác.

Tích hợp API

Di chuyển từ Sonnet 4.5

Sonnet 4.6 là một sự thay thế trực tiếp. Cùng mức giá, cùng cấu trúc API, kết quả tốt hơn.

python

# Thay đổi cái này:
model="claude-sonnet-4-5-20250514"
# Thành cái này:
model="claude-sonnet-4-6-20250217"

Không yêu cầu thay đổi mã nguồn nào khác.

Extended Thinking (Tư duy mở rộng)

Sonnet 4.6 hỗ trợ extended thinking, cho phép nó dành nhiều tính toán hơn cho các vấn đề khó hơn:

python

response = client.messages.create(
    model="claude-sonnet-4-6-20250217",
    max_tokens=16000,
    thinking={
        "type": "enabled",
        "budget_tokens": 10000  # token dành cho "suy luận"
    },
    messages=[{"role": "user", "content": "Complex reasoning task here"}],
)

Xử lý hàng loạt (Batch Processing)

Đối với khối lượng công việc lớn, không khẩn cấp:

python

# Gửi một loạt yêu cầu với mức giảm giá 50%
batch = client.messages.batches.create(
    requests=[
        {
            "custom_id": f"request-{i}",
            "params": {
                "model": "claude-sonnet-4-6-20250217",
                "max_tokens": 1024,
                "messages": [{"role": "user", "content": prompt}],
            },
        }
        for i, prompt in enumerate(prompts)
    ]
)

Truy cập qua nền tảng Cloud

Amazon Bedrock:

python

# Model ID cho Bedrock
model_id = "anthropic.claude-sonnet-4-6-20250217-v1:0"

Google Vertex AI:

python

# Model ID cho Vertex
model_id = "claude-sonnet-4-6@20250217"

Cả hai đều có sẵn ngay từ ngày đầu ra mắt.

Chiến lược tối ưu hóa chi phí

1. Mặc định dùng Sonnet, nâng cấp lên Opus khi cần

Yêu cầu người dùng → Sonnet 4.6 (thử lần đầu)
                   ↓ nếu độ tin cậy < ngưỡng
                 Opus 4.6 (thử lại)

Quy trình này giải quyết 90% tác vụ ở mức giá của Sonnet. Chỉ những vấn đề thực sự khó nhất mới cần đến Opus.

2. Sử dụng Prompt Caching

python

response = client.messages.create(
    model="claude-sonnet-4-6-20250217",
    max_tokens=1024,
    system=[
        {
            "type": "text",
            "text": "Your long system prompt here...",
            "cache_control": {"type": "ephemeral"}
        }
    ],
    messages=[{"role": "user", "content": "User query"}],
)

3. Gom nhóm các công việc không khẩn cấp

Code review, tạo tài liệu, viết test — bất cứ thứ gì không cần phản hồi theo thời gian thực đều có thể chạy qua batch processing để được giảm giá 50%.

4. Context Compaction cho các phiên làm việc dài

Ước tính chi phí hàng tháng

Trường hợp sử dụng	Số phiên/ngày	Mô hình	Chi phí hàng tháng
Lập trình viên cá nhân	20	Sonnet 4.6	~$360
Đội ngũ nhỏ (5 người)	100	Sonnet 4.6	~$1,800
Đội ngũ nhỏ (5 người)	100	Opus 4.6	~$9,000
Hệ thống AI agent	500	Sonnet 4.6	~$9,000
Hệ thống AI agent	500	Sonnet 4.6 (batch)	~$4,500

Sự khác biệt giữa Sonnet và Opus là $7,200/tháng cho một đội ngũ 5 người. Con số đó tương đương với lương của một nhân viên toàn thời gian.

Quy trình làm việc thực tế: Triển khai một tính năng với Sonnet 4.6

Dưới đây là cách triển khai một tính năng điển hình với Sonnet 4.6 trong Claude Code:

Bước 1: Mô tả tính năng

"Add a user notification preferences page. Users should be able to
toggle email, push, and in-app notifications for: new messages,
mentions, and weekly digest. Store preferences in the existing
user_settings table. Use our existing UI component library."

Bước 2: Sonnet 4.6 khám phá codebase

Khác với các phiên bản Sonnet trước, 4.6 sẽ:

Đọc thư viện component hiện tại của bạn để khớp với hệ thống thiết kế (design system).
Kiểm tra schema của bảng user_settings.
Xem cách cấu trúc của các trang cài đặt hiện có.
Xem lại cách triển khai hệ thống thông báo của bạn.

Bước 3: Triển khai

Sonnet 4.6 tạo ra:

Database migration cho các cột tùy chọn mới.
API endpoint để đọc/cập nhật tùy chọn.
React component sử dụng design system hiện tại của bạn.
Các bài test bao quát các luồng chính.

Bước 4: Review và Ship

Bước 5: Deploy

Đẩy lên pipeline triển khai của bạn. Nếu bạn đang sử dụng Y Build, việc triển khai, SEO và phân tích sẽ được xử lý tự động.

Tổng thời gian: 15-30 phút cho một tính năng mà bình thường sẽ mất một ngày để xây dựng thủ công.

Điều gì sẽ xảy ra tiếp theo

Sonnet 4.6 là bản phát hành lớn thứ hai của Anthropic trong vòng 11 ngày (sau Opus 4.6). Tốc độ này cho thấy:

1M context sẽ sớm chuyển từ beta sang phát hành rộng rãi (GA).
Độ tin cậy của Computer use sẽ tiếp tục được cải thiện (quỹ đạo từ 14.9% lên 72.5% trong 16 tháng là phi thường).
Model routing — tự động lựa chọn giữa Sonnet và Opus dựa trên độ phức tạp của tác vụ — có khả năng sẽ xuất hiện trên Claude Code.

Nguồn: