Claude Sonnet 4.6 untuk Pembangun: Panduan Praktikal

TL;DR

Claude Sonnet 4.6 adalah model terbaik untuk kebanyakan kerja pembangunan pada Februari 2026. Berikut adalah panduan praktikal:

Claude Code: Gunakan Sonnet 4.6 sebagai lalai (default). ~$0.60/sesi berbanding $3.00 dengan Opus. Perbezaan kualiti adalah kecil bagi 90% tugasan
Ejen penggunaan komputer: 72.5% OSWorld — sedia untuk pengeluaran. Bina automasi pelayar, pengisian borang, dan ejen pengujian pada harga Sonnet
Integrasi API: ID Model claude-sonnet-4-6-20250217. Harga sama seperti Sonnet 4.5 ($3/$15). Pengganti terus (drop-in replacement)
Bila perlu gunakan Opus: Refaktor skala pangkalan kod (codebase), koordinasi pelbagai ejen, penyelesaian masalah baharu
Konteks 1M (beta): Masukkan keseluruhan pangkalan kod. Digabungkan dengan pemadatan konteks untuk sesi yang lebih lama

Claude Code dengan Sonnet 4.6

Apa yang Berubah

Sonnet 4.6 adalah model lalai untuk Claude Code. Penambahbaikan berbanding Sonnet 4.5 dapat dilihat serta-merta:

Sebelum (tingkah laku Sonnet 4.5):

Kadangkala mengubah kod tanpa membaca konteks penuh
Kadangkala menduplikasi logik yang sudah sedia ada di tempat lain
Mendakwa "pepijat telah diperbaiki" walaupun pembaikan tidak lengkap
Menambah abstraksi yang tidak perlu "untuk fleksibiliti masa hadapan"
Hilang jejak tugasan berbilang langkah dalam sesi yang panjang

Selepas (tingkah laku Sonnet 4.6):

Membaca konteks kod sedia ada sebelum mengubah
Menyatukan logik dan bukannya menduplikasi
Kurang dakwaan kejayaan palsu — lebih jujur tentang apa yang tidak disiapkan
Kurang kejuruteraan berlebihan — melakukan apa yang diminta, tidak lebih
Tindakan susulan yang lebih baik merentasi sesi panjang dengan pemadatan konteks

Pembangun lebih mengutamakan Sonnet 4.6 berbanding Sonnet 4.5 sebanyak 70% kali dalam pengujian. Lebih mengejutkan, mereka lebih mengutamakannya berbanding Opus 4.5 (model perintis November) sebanyak 59% kali.

Impak Kos

Model	Kos sesi tipikal (100K masuk + 20K keluar)
Sonnet 4.6	$0.60
Sonnet 4.5	$0.60 (harga sama, kualiti lebih rendah)
Opus 4.6	$3.00

Anda mendapat hasil yang lebih baik secara material pada kos yang sama. Atau secara setara: tugasan yang dahulunya memerlukan Opus ($3.00/sesi) kini boleh dilakukan pada Sonnet ($0.60/sesi) — pengurangan kos sebanyak 80% dengan kehilangan kualiti yang minimal.

Bila Perlu Gunakan Opus

Kekalkan Opus 4.6 untuk:

Refaktor seluruh pangkalan kod — Opus mendapat skor 65.4% pada Terminal-Bench 2.0 berbanding Sonnet 59.1%. Apabila anda menyusun semula seni bina merentasi berpuluh-puluh fail, jurang 6.3% itu sangat penting.

Koordinasi pelbagai ejen — Opus mengendalikan orkestrasi kompleks dengan lebih baik apabila berbilang ejen AI perlu bekerjasama dalam satu tugasan.

Masalah baharu — ARC-AGI-2: Opus 68.8% berbanding Sonnet 58.3%. Jika anda menyelesaikan masalah yang benar-benar unik di mana model belum pernah melihat coraknya, Opus berfikir dengan lebih mendalam.

Penyelidikan web yang menyeluruh — BrowseComp: Opus 84.0% berbanding Sonnet 74.7%. Apabila anda memerlukan carian berasaskan ejen yang komprehensif merentasi banyak sumber.

Untuk segala-galanya yang lain — implementasi ciri, pembaikan pepijat, pengujian, dokumentasi, semakan kod — Sonnet 4.6 adalah pilihan yang tepat.

Tip Praktikal Claude Code

Gunakan tetingkap konteks 1M: Sonnet 4.6 menyokong 1M token dalam beta. Untuk pangkalan kod yang besar, ini bermakna kurang pertukaran konteks dan pemahaman merentas fail yang lebih baik. Pemadatan konteks (Context compaction): Sesi pengkodan yang panjang tidak lagi merosot kualitinya. Ciri pemadatan Sonnet 4.6 merumuskan segmen perbualan lama secara automatik, mengekalkan ketajaman konteks terkini walaupun selepas berjam-jam bekerja. Jadi spesifik, bukan meleret: Sonnet 4.6 mengikuti arahan dengan lebih baik daripada mana-mana Sonnet sebelumnya. Prom yang pendek dan jelas mengatasi penjelasan yang panjang:

# Bagus
"Tambah pengesahan input pada borang pendaftaran. Emel mestilah sah, kata laluan minimum 8 aksara. Paparkan ralat dalam baris (inline)."

# Tidak perlu
"Saya mahu anda menambah pengesahan input yang komprehensif pada komponen borang pendaftaran pengguna kami. Secara khusus, kami perlu mengesahkan bahawa alamat emel mengikut format RFC 5322 yang betul dan kata laluan memenuhi keperluan keselamatan minimum kami sekurang-kurangnya 8 aksara. Sila laksanakan mesej ralat dalam baris yang muncul di bawah setiap medan borang untuk memberikan maklum balas yang jelas kepada pengguna tentang apa yang perlu diperbetulkan."

Kedua-dua prom menghasilkan keputusan yang sama dengan Sonnet 4.6. Prom pertama lebih cepat dan lebih murah.

Membina Ejen Penggunaan Komputer

Mengapa Sonnet 4.6 Mengubah Keadaan

Penggunaan komputer (computer use) adalah keupayaan utama Sonnet 4.6:

Model	Skor OSWorld	Kos (setiap M token)
Sonnet 4.6	72.5%	$3/$15
Opus 4.6	72.7%	$15/$75
GPT-5.2	38.2%	$5/$15

Sonnet 4.6 menandingi Opus dalam penggunaan komputer pada 1/5 harga. GPT-5.2 tidak mencapainya sama sekali. Ini bermakna ejen penggunaan komputer kini berdaya maju secara ekonomi untuk beban kerja pengeluaran.

Apa yang Boleh Dilakukan oleh Ejen Penggunaan Komputer

Kes penggunaan dunia sebenar yang berfungsi dengan stabil menggunakan Sonnet 4.6:

Pengekstrakan data daripada sistem legasi:

Menavigasi panel admin berasaskan web
Mengisi borang carian, mengekstrak hasil
Mengeksport data yang tidak mempunyai API

Pengujian automatik:

Menelusuri aliran kerja pengguna dalam pelayar sebenar
Mengesahkan susun atur visual, elemen interaktif
Menguji borang, navigasi, status ralat

Pengisian borang pada skala besar:

Permohonan insurans (94% ketepatan dilaporkan oleh Pace)
Borang kerajaan
Dokumentasi kemasukan vendor (onboarding)

Automasi hamparan:

Menavigasi Excel/Google Sheets yang kompleks
Menggunakan formula, mencipta carta
Merujuk silang data merentasi helaian (sheets)

Membina Ejen Penggunaan Komputer

python

import anthropic

client = anthropic.Anthropic()

# Ejen penggunaan komputer asas
response = client.messages.create(
    model="claude-sonnet-4-6-20250217",
    max_tokens=4096,
    tools=[
        {
            "type": "computer_20250124",
            "name": "computer",
            "display_width_px": 1920,
            "display_height_px": 1080,
        }
    ],
    messages=[
        {
            "role": "user",
            "content": "Pergi ke papan pemuka admin kami di app.example.com, "
                       "navigasi ke bahagian Pengguna (Users), dan eksport "
                       "senarai pengguna yang mendaftar bulan ini sebagai CSV."
        }
    ],
)

Pertimbangan Keselamatan

Sonnet 4.6 menambah baik secara signifikan rintangan suntikan prom (prompt injection) untuk penggunaan komputer — setanding dengan tahap Opus 4.6. Ini sangat penting kerana ejen penggunaan komputer berinteraksi dengan kandungan web yang tidak dipercayai.

Amalan terbaik:

Letakkan ejen penggunaan komputer dalam persekitaran terasing (VM, kontena)

Jangan berikan ejen akses kepada kelayakan sensitif melainkan perlu

Log semua tindakan untuk jejak audit

Tetapkan had pada domain/aplikasi yang boleh berinteraksi dengan ejen

Integrasi API

Migrasi daripada Sonnet 4.5

Sonnet 4.6 adalah pengganti terus. Harga yang sama, struktur API yang sama, hasil yang lebih baik.

python

# Tukar ini:
model="claude-sonnet-4-5-20250514"
# Kepada ini:
model="claude-sonnet-4-6-20250217"

Tiada perubahan kod lain diperlukan.

Pemikiran Lanjutan (Extended Thinking)

Sonnet 4.6 menyokong pemikiran lanjutan, membolehkannya memperuntukkan lebih banyak pengiraan untuk masalah yang lebih sukar:

python

response = client.messages.create(
    model="claude-sonnet-4-6-20250217",
    max_tokens=16000,
    thinking={
        "type": "enabled",
        "budget_tokens": 10000  # token untuk "thinking"
    },
    messages=[{"role": "user", "content": "Tugasan penaakulan kompleks di sini"}],
)

Wawasan utama: Sonnet 4.6 menunjukkan prestasi yang baik walaupun tanpa pemikiran lanjutan. Gunakannya untuk tugasan penaakulan yang benar-benar sukar sahaja, bukan sebagai lalai — anda akan menjimatkan token dan kependaman (latency).

Pemprosesan Kelompok (Batch Processing)

Untuk beban kerja volum tinggi yang tidak segera:

python

# Hantar kelompok permintaan dengan diskaun 50%
batch = client.messages.batches.create(
    requests=[
        {
            "custom_id": f"request-{i}",
            "params": {
                "model": "claude-sonnet-4-6-20250217",
                "max_tokens": 1024,
                "messages": [{"role": "user", "content": prompt}],
            },
        }
        for i, prompt in enumerate(prompts)
    ]
)

Pemprosesan kelompok mengurangkan kos API sebanyak 50% lagi. Digabungkan dengan harga Sonnet 4.6 yang sedia rendah, ini menjadikan operasi AI skala besar sangat mampu milik.

Akses Platform Awan

Amazon Bedrock:

python

# ID Model untuk Bedrock
model_id = "anthropic.claude-sonnet-4-6-20250217-v1:0"

Google Vertex AI:

python

# ID Model untuk Vertex
model_id = "claude-sonnet-4-6@20250217"

Kedua-duanya tersedia dari hari pertama pelancaran.

Strategi Pengoptimuman Kos

1. Gunakan Sonnet sebagai Lalai, Tingkatkan ke Opus

Permintaan pengguna → Sonnet 4.6 (percubaan pertama)
                       ↓ jika keyakinan < ambang
                     Opus 4.6 (cuba semula)

Ini menangani 90% tugasan pada harga Sonnet. Hanya masalah yang benar-benar sukar akan menggunakan Opus.

2. Gunakan Caching Prom (Prompt Caching)

Claude menyokong caching prom — simpan prom sistem atau dokumen rujukan yang kerap digunakan dan gunakannya semula merentasi permintaan. Token input yang dicache berharga 90% lebih rendah.

python

response = client.messages.create(
    model="claude-sonnet-4-6-20250217",
    max_tokens=1024,
    system=[
        {
            "type": "text",
            "text": "Prom sistem anda yang panjang di sini...",
            "cache_control": {"type": "ephemeral"}
        }
    ],
    messages=[{"role": "user", "content": "Pertanyaan pengguna"}],
)

3. Kelompokkan Kerja Tidak Segera

Semakan kod, penghasilan dokumentasi, penulisan ujian — apa sahaja yang tidak memerlukan respons masa nyata boleh melalui pemprosesan kelompok dengan diskaun 50%.

4. Pemadatan Konteks untuk Sesi Panjang

Daripada memulakan sesi baharu apabila konteks menjadi panjang, biarkan ciri pemadatan Sonnet 4.6 mengendalikannya. Ini mengelakkan penghantaran semula prom sistem dan kehilangan konteks yang telah terkumpul.

Anggaran Kos Bulanan

Kes penggunaan	Sesi/hari	Model	Kos bulanan
Pembangun solo	20	Sonnet 4.6	~$360
Pasukan kecil (5 pembangun)	100	Sonnet 4.6	~$1,800
Pasukan kecil (5 pembangun)	100	Opus 4.6	~$9,000
Kumpulan ejen AI	500	Sonnet 4.6	~$9,000
Kumpulan ejen AI	500	Sonnet 4.6 (batch)	~$4,500

Perbezaan antara Sonnet dan Opus adalah $7,200/bulan untuk pasukan 5 orang. Itu adalah gaji seorang pekerja sepenuh masa.

Aliran Kerja Dunia Sebenar: Melancarkan Ciri dengan Sonnet 4.6

Berikut adalah rupa implementasi ciri tipikal dengan Sonnet 4.6 dalam Claude Code:

Langkah 1: Terangkan Ciri Tersebut

"Tambah halaman tetapan pemberitahuan pengguna. Pengguna sepatutnya boleh
togol e-mel, push, dan pemberitahuan dalam aplikasi untuk: mesej baharu,
sebutan (mentions), dan ringkasan mingguan. Simpan tetapan dalam jadual
user_settings sedia ada. Gunakan perpustakaan komponen UI sedia ada kami."

Langkah 2: Sonnet 4.6 Meneroka Pangkalan Kod

Berbeza dengan Sonnet sebelum ini, 4.6 akan:

Membaca perpustakaan komponen sedia ada anda untuk memadankan sistem reka bentuk
Menyemak skema jadual user_settings
Melihat bagaimana struktur halaman tetapan sedia ada
Menyemak implementasi sistem pemberitahuan anda

Langkah 3: Implementasi

Sonnet 4.6 menghasilkan:

Migrasi pangkalan data untuk lajur tetapan baharu
Titik akhir API untuk membaca/mengemas kini tetapan
Komponen React menggunakan sistem reka bentuk sedia ada anda
Ujian yang merangkumi aliran kerja utama

Langkah 4: Semak dan Lancar

Kod mengikut corak sedia ada anda kerana Sonnet 4.6 benar-benar membacanya. Kurang komunikasi ulang-alik, kurang pembetulan "sebenarnya, kami buat begini".

Langkah 5: Sebarkan (Deploy)

Tolak ke saluran penyebaran anda. Jika anda menggunakan Y Build, penyebaran, SEO, dan analitik dikendalikan secara automatik.

Jumlah masa: 15-30 minit untuk ciri yang biasanya mengambil masa sehari untuk dibina secara manual.

Apa yang Akan Datang

Sonnet 4.6 adalah pelancaran utama kedua Anthropic dalam masa 11 hari (selepas Opus 4.6). Kepantasan ini menunjukkan:

Konteks 1M akan keluar daripada beta ke ketersediaan umum tidak lama lagi
Kestabilan penggunaan komputer akan terus meningkat (trajektori daripada 14.9% ke 72.5% dalam masa 16 bulan adalah luar biasa)
Penghalaan model — memilih antara Sonnet dan Opus secara automatik berdasarkan kompleksiti tugasan — berkemungkinan akan datang ke Claude Code

Untuk pembangun, kesimpulan praktikalnya: tukar ke Sonnet 4.6 sekarang. Ia lebih baik, ia lebih murah (berbanding menggunakan Opus), dan ia adalah pilihan lalai.

Lancar lebih pantas dengan AI. Y Build berpasangan dengan Claude Code untuk pembangunan dibantu AI, kemudian mengendalikan selebihnya: penyebaran satu klik ke pengeluaran, Demo Cut untuk video demo produk, AI SEO untuk trafik organik, dan analitik untuk menjejak pertumbuhan. Daripada kod kepada pelanggan. Mula secara percuma.

Sumber:

TL;DR

Claude Sonnet 4.6 adalah model terbaik untuk kebanyakan kerja pembangunan pada Februari 2026. Berikut adalah panduan praktikal:

Claude Code: Gunakan Sonnet 4.6 sebagai lalai (default). ~$0.60/sesi berbanding $3.00 dengan Opus. Perbezaan kualiti adalah kecil bagi 90% tugasan
Ejen penggunaan komputer: 72.5% OSWorld — sedia untuk pengeluaran. Bina automasi pelayar, pengisian borang, dan ejen pengujian pada harga Sonnet
Integrasi API: ID Model claude-sonnet-4-6-20250217. Harga sama seperti Sonnet 4.5 ($3/$15). Pengganti terus (drop-in replacement)
Bila perlu gunakan Opus: Refaktor skala pangkalan kod (codebase), koordinasi pelbagai ejen, penyelesaian masalah baharu
Konteks 1M (beta): Masukkan keseluruhan pangkalan kod. Digabungkan dengan pemadatan konteks untuk sesi yang lebih lama

Claude Code dengan Sonnet 4.6

Apa yang Berubah

Sonnet 4.6 adalah model lalai untuk Claude Code. Penambahbaikan berbanding Sonnet 4.5 dapat dilihat serta-merta:

Sebelum (tingkah laku Sonnet 4.5):

Kadangkala mengubah kod tanpa membaca konteks penuh
Kadangkala menduplikasi logik yang sudah sedia ada di tempat lain
Mendakwa "pepijat telah diperbaiki" walaupun pembaikan tidak lengkap
Menambah abstraksi yang tidak perlu "untuk fleksibiliti masa hadapan"
Hilang jejak tugasan berbilang langkah dalam sesi yang panjang

Selepas (tingkah laku Sonnet 4.6):

Membaca konteks kod sedia ada sebelum mengubah
Menyatukan logik dan bukannya menduplikasi
Kurang dakwaan kejayaan palsu — lebih jujur tentang apa yang tidak disiapkan
Kurang kejuruteraan berlebihan — melakukan apa yang diminta, tidak lebih
Tindakan susulan yang lebih baik merentasi sesi panjang dengan pemadatan konteks

Impak Kos

Model	Kos sesi tipikal (100K masuk + 20K keluar)
Sonnet 4.6	$0.60
Sonnet 4.5	$0.60 (harga sama, kualiti lebih rendah)
Opus 4.6	$3.00

Bila Perlu Gunakan Opus

Kekalkan Opus 4.6 untuk:

Refaktor seluruh pangkalan kod — Opus mendapat skor 65.4% pada Terminal-Bench 2.0 berbanding Sonnet 59.1%. Apabila anda menyusun semula seni bina merentasi berpuluh-puluh fail, jurang 6.3% itu sangat penting.

Koordinasi pelbagai ejen — Opus mengendalikan orkestrasi kompleks dengan lebih baik apabila berbilang ejen AI perlu bekerjasama dalam satu tugasan.

Masalah baharu — ARC-AGI-2: Opus 68.8% berbanding Sonnet 58.3%. Jika anda menyelesaikan masalah yang benar-benar unik di mana model belum pernah melihat coraknya, Opus berfikir dengan lebih mendalam.

Penyelidikan web yang menyeluruh — BrowseComp: Opus 84.0% berbanding Sonnet 74.7%. Apabila anda memerlukan carian berasaskan ejen yang komprehensif merentasi banyak sumber.

Untuk segala-galanya yang lain — implementasi ciri, pembaikan pepijat, pengujian, dokumentasi, semakan kod — Sonnet 4.6 adalah pilihan yang tepat.

Tip Praktikal Claude Code

# Bagus
"Tambah pengesahan input pada borang pendaftaran. Emel mestilah sah, kata laluan minimum 8 aksara. Paparkan ralat dalam baris (inline)."

# Tidak perlu
"Saya mahu anda menambah pengesahan input yang komprehensif pada komponen borang pendaftaran pengguna kami. Secara khusus, kami perlu mengesahkan bahawa alamat emel mengikut format RFC 5322 yang betul dan kata laluan memenuhi keperluan keselamatan minimum kami sekurang-kurangnya 8 aksara. Sila laksanakan mesej ralat dalam baris yang muncul di bawah setiap medan borang untuk memberikan maklum balas yang jelas kepada pengguna tentang apa yang perlu diperbetulkan."

Kedua-dua prom menghasilkan keputusan yang sama dengan Sonnet 4.6. Prom pertama lebih cepat dan lebih murah.

Membina Ejen Penggunaan Komputer

Mengapa Sonnet 4.6 Mengubah Keadaan

Penggunaan komputer (computer use) adalah keupayaan utama Sonnet 4.6:

Model	Skor OSWorld	Kos (setiap M token)
Sonnet 4.6	72.5%	$3/$15
Opus 4.6	72.7%	$15/$75
GPT-5.2	38.2%	$5/$15

Apa yang Boleh Dilakukan oleh Ejen Penggunaan Komputer

Kes penggunaan dunia sebenar yang berfungsi dengan stabil menggunakan Sonnet 4.6:

Pengekstrakan data daripada sistem legasi:

Menavigasi panel admin berasaskan web
Mengisi borang carian, mengekstrak hasil
Mengeksport data yang tidak mempunyai API

Pengujian automatik:

Menelusuri aliran kerja pengguna dalam pelayar sebenar
Mengesahkan susun atur visual, elemen interaktif
Menguji borang, navigasi, status ralat

Pengisian borang pada skala besar:

Permohonan insurans (94% ketepatan dilaporkan oleh Pace)
Borang kerajaan
Dokumentasi kemasukan vendor (onboarding)

Automasi hamparan:

Menavigasi Excel/Google Sheets yang kompleks
Menggunakan formula, mencipta carta
Merujuk silang data merentasi helaian (sheets)

Membina Ejen Penggunaan Komputer

python

import anthropic

client = anthropic.Anthropic()

# Ejen penggunaan komputer asas
response = client.messages.create(
    model="claude-sonnet-4-6-20250217",
    max_tokens=4096,
    tools=[
        {
            "type": "computer_20250124",
            "name": "computer",
            "display_width_px": 1920,
            "display_height_px": 1080,
        }
    ],
    messages=[
        {
            "role": "user",
            "content": "Pergi ke papan pemuka admin kami di app.example.com, "
                       "navigasi ke bahagian Pengguna (Users), dan eksport "
                       "senarai pengguna yang mendaftar bulan ini sebagai CSV."
        }
    ],
)

Pertimbangan Keselamatan

Amalan terbaik:

Letakkan ejen penggunaan komputer dalam persekitaran terasing (VM, kontena)

Jangan berikan ejen akses kepada kelayakan sensitif melainkan perlu

Log semua tindakan untuk jejak audit

Tetapkan had pada domain/aplikasi yang boleh berinteraksi dengan ejen

Integrasi API

Migrasi daripada Sonnet 4.5

Sonnet 4.6 adalah pengganti terus. Harga yang sama, struktur API yang sama, hasil yang lebih baik.

python

# Tukar ini:
model="claude-sonnet-4-5-20250514"
# Kepada ini:
model="claude-sonnet-4-6-20250217"

Tiada perubahan kod lain diperlukan.

Pemikiran Lanjutan (Extended Thinking)

Sonnet 4.6 menyokong pemikiran lanjutan, membolehkannya memperuntukkan lebih banyak pengiraan untuk masalah yang lebih sukar:

python

response = client.messages.create(
    model="claude-sonnet-4-6-20250217",
    max_tokens=16000,
    thinking={
        "type": "enabled",
        "budget_tokens": 10000  # token untuk "thinking"
    },
    messages=[{"role": "user", "content": "Tugasan penaakulan kompleks di sini"}],
)

Pemprosesan Kelompok (Batch Processing)

Untuk beban kerja volum tinggi yang tidak segera:

python

# Hantar kelompok permintaan dengan diskaun 50%
batch = client.messages.batches.create(
    requests=[
        {
            "custom_id": f"request-{i}",
            "params": {
                "model": "claude-sonnet-4-6-20250217",
                "max_tokens": 1024,
                "messages": [{"role": "user", "content": prompt}],
            },
        }
        for i, prompt in enumerate(prompts)
    ]
)

Pemprosesan kelompok mengurangkan kos API sebanyak 50% lagi. Digabungkan dengan harga Sonnet 4.6 yang sedia rendah, ini menjadikan operasi AI skala besar sangat mampu milik.

Akses Platform Awan

Amazon Bedrock:

python

# ID Model untuk Bedrock
model_id = "anthropic.claude-sonnet-4-6-20250217-v1:0"

Google Vertex AI:

python

# ID Model untuk Vertex
model_id = "claude-sonnet-4-6@20250217"

Kedua-duanya tersedia dari hari pertama pelancaran.

Strategi Pengoptimuman Kos

1. Gunakan Sonnet sebagai Lalai, Tingkatkan ke Opus

Permintaan pengguna → Sonnet 4.6 (percubaan pertama)
                       ↓ jika keyakinan < ambang
                     Opus 4.6 (cuba semula)

Ini menangani 90% tugasan pada harga Sonnet. Hanya masalah yang benar-benar sukar akan menggunakan Opus.

2. Gunakan Caching Prom (Prompt Caching)

Claude menyokong caching prom — simpan prom sistem atau dokumen rujukan yang kerap digunakan dan gunakannya semula merentasi permintaan. Token input yang dicache berharga 90% lebih rendah.

python

response = client.messages.create(
    model="claude-sonnet-4-6-20250217",
    max_tokens=1024,
    system=[
        {
            "type": "text",
            "text": "Prom sistem anda yang panjang di sini...",
            "cache_control": {"type": "ephemeral"}
        }
    ],
    messages=[{"role": "user", "content": "Pertanyaan pengguna"}],
)

3. Kelompokkan Kerja Tidak Segera

Semakan kod, penghasilan dokumentasi, penulisan ujian — apa sahaja yang tidak memerlukan respons masa nyata boleh melalui pemprosesan kelompok dengan diskaun 50%.

4. Pemadatan Konteks untuk Sesi Panjang

Anggaran Kos Bulanan

Kes penggunaan	Sesi/hari	Model	Kos bulanan
Pembangun solo	20	Sonnet 4.6	~$360
Pasukan kecil (5 pembangun)	100	Sonnet 4.6	~$1,800
Pasukan kecil (5 pembangun)	100	Opus 4.6	~$9,000
Kumpulan ejen AI	500	Sonnet 4.6	~$9,000
Kumpulan ejen AI	500	Sonnet 4.6 (batch)	~$4,500

Perbezaan antara Sonnet dan Opus adalah $7,200/bulan untuk pasukan 5 orang. Itu adalah gaji seorang pekerja sepenuh masa.

Aliran Kerja Dunia Sebenar: Melancarkan Ciri dengan Sonnet 4.6

Berikut adalah rupa implementasi ciri tipikal dengan Sonnet 4.6 dalam Claude Code:

Langkah 1: Terangkan Ciri Tersebut

"Tambah halaman tetapan pemberitahuan pengguna. Pengguna sepatutnya boleh
togol e-mel, push, dan pemberitahuan dalam aplikasi untuk: mesej baharu,
sebutan (mentions), dan ringkasan mingguan. Simpan tetapan dalam jadual
user_settings sedia ada. Gunakan perpustakaan komponen UI sedia ada kami."

Langkah 2: Sonnet 4.6 Meneroka Pangkalan Kod

Berbeza dengan Sonnet sebelum ini, 4.6 akan:

Membaca perpustakaan komponen sedia ada anda untuk memadankan sistem reka bentuk
Menyemak skema jadual user_settings
Melihat bagaimana struktur halaman tetapan sedia ada
Menyemak implementasi sistem pemberitahuan anda

Langkah 3: Implementasi

Sonnet 4.6 menghasilkan:

Migrasi pangkalan data untuk lajur tetapan baharu
Titik akhir API untuk membaca/mengemas kini tetapan
Komponen React menggunakan sistem reka bentuk sedia ada anda
Ujian yang merangkumi aliran kerja utama

Langkah 4: Semak dan Lancar

Kod mengikut corak sedia ada anda kerana Sonnet 4.6 benar-benar membacanya. Kurang komunikasi ulang-alik, kurang pembetulan "sebenarnya, kami buat begini".

Langkah 5: Sebarkan (Deploy)

Tolak ke saluran penyebaran anda. Jika anda menggunakan Y Build, penyebaran, SEO, dan analitik dikendalikan secara automatik.

Jumlah masa: 15-30 minit untuk ciri yang biasanya mengambil masa sehari untuk dibina secara manual.

Apa yang Akan Datang

Sonnet 4.6 adalah pelancaran utama kedua Anthropic dalam masa 11 hari (selepas Opus 4.6). Kepantasan ini menunjukkan:

Konteks 1M akan keluar daripada beta ke ketersediaan umum tidak lama lagi
Kestabilan penggunaan komputer akan terus meningkat (trajektori daripada 14.9% ke 72.5% dalam masa 16 bulan adalah luar biasa)
Penghalaan model — memilih antara Sonnet dan Opus secara automatik berdasarkan kompleksiti tugasan — berkemungkinan akan datang ke Claude Code

Untuk pembangun, kesimpulan praktikalnya: tukar ke Sonnet 4.6 sekarang. Ia lebih baik, ia lebih murah (berbanding menggunakan Opus), dan ia adalah pilihan lalai.

Sumber: