Claude Sonnet 4.6: Sonnet 가격으로 누리는 Opus급 AI

TL;DR

Anthropic이 2026년 2월 17일에 Claude Sonnet 4.6을 출시했습니다. 핵심 요약은 다음과 같습니다:

79.6% SWE-bench — 실제 코딩 환경에서 Opus 4.6(80.8%)과 거의 동일한 성능
72.5% OSWorld — 컴퓨터 사용(computer use) 항목에서 Opus 4.6(72.7%)과 대등하며, GPT-5.2(38.2%)보다 2배 가까이 높은 수치
100만 토큰당 $3/$15 — Sonnet 4.5와 동일한 가격이며, Opus보다 5배 저렴함
1M 토큰 컨텍스트 윈도우 (베타) — 기존 200K에서 대폭 확장
현재 모든 Free 및 Pro Claude 사용자의 기본 모델로 설정됨

개발자들은 Claude Code에서 Sonnet 4.5보다 Sonnet 4.6을 70%의 비율로 선호했으며, 심지어 Opus 4.5보다도 59%의 비율로 선호했습니다.

Anthropic의 발표 내용

Claude Sonnet 4.6은 Anthropic이 2주도 채 되지 않아 발표한 두 번째 주요 모델입니다 (2월 6일 Opus 4.6 출시 이후). Anthropic은 블로그 포스트를 통해 이 모델을 "코딩, 컴퓨터 사용, 긴 컨텍스트 추론, 에이전트 계획, 지식 노동 및 디자인 전반에 걸친 모델 기술의 완전한 업그레이드"라고 설명했습니다.

핵심 주장은 다음과 같습니다: "이전에는 실무적이고 경제적 가치가 높은 사무 업무를 위해 Opus급 모델이 필요했던 성능을 이제 Sonnet 4.6에서 사용할 수 있게 되었습니다."

이는 매우 중요한 의미를 갖습니다. Anthropic은 사실상 대부분의 프로덕션 워크로드에서 더 이상 Opus 비용을 지불할 필요가 없다고 말하고 있는 것입니다.

전체 벤치마크 분석

Sonnet 4.6이 Opus와 대등하거나 능가하는 항목

벤치마크	테스트 항목	Sonnet 4.6	Opus 4.6	GPT-5.2
SWE-bench Verified	실제 코딩 환경	79.6%	80.8%	80.0%
OSWorld-Verified	컴퓨터 사용	72.5%	72.7%	38.2%
GDPval-AA (Elo)	사무 업무	1633	1606	1462
Finance Agent v1.1	금융 분석	63.3%	60.1%	59.0%
OfficeQA	문서 이해도	Opus와 대등	—	—

Sonnet 4.6은 경제적으로 유의미한 두 카테고리인 사무 업무와 금융 분석에서 실제로 선두를 달리고 있습니다.

Opus 4.6이 우위를 유지하는 항목

벤치마크	테스트 항목	Opus 4.6	Sonnet 4.6	격차
Terminal-Bench 2.0	에이전트 기반 터미널 코딩	65.4%	59.1%	6.3%
BrowseComp	에이전트 기반 웹 검색	84.0%	74.7%	9.3%
ARC-AGI-2	새로운 문제 해결 능력	68.8%	58.3%	10.5%
GPQA Diamond	대학원 수준의 추론	91.3%	89.9%	1.4%
MRCR v2 (8-needle 1M)	긴 컨텍스트 추론	76.0%	—	—

패턴은 명확합니다. Opus는 코드베이스 규모의 리팩토링, 다단계 연구, 그리고 모델이 이전에 보지 못한 문제들과 같이 가장 깊고 새로운 추론이 필요한 작업에서 승리합니다. 반면 Sonnet은 속도에 민감한 프로덕션 지원 작업에서 승리합니다.

컴퓨터 사용(Computer Use): 독보적인 개선 사항

컴퓨터 사용 수치는 특히 주목할 만합니다:

모델	OSWorld 점수	타임라인
Sonnet 3.5 (2024년 10월)	14.9%	첫 출시
Sonnet 4.5	61.4%	+46.5%
Sonnet 4.6	72.5%	+11.1%
Opus 4.6	72.7%	한계치
GPT-5.2	38.2%	비교용

16개월 만에 Sonnet의 컴퓨터 사용 능력은 14.9%에서 72.5%로 4.9배 향상되었습니다. 보험 기술 회사 Pace의 CEO인 Jamie Cuffe는 내부 컴퓨터 사용 벤치마크에서 Sonnet 4.6이 94%를 기록했다고 보고하며, "실패를 추론하고 이전에는 본 적 없는 방식으로 자가 수정을 수행한다"고 말했습니다.

Sonnet 4.5 대비 새로운 기능

1. 1M 토큰 컨텍스트 윈도우 (베타)

컨텍스트 윈도우가 200K에서 100만 토큰으로 확장되었습니다. 이는 전체 코드베이스, 긴 법률 문서 또는 수 시간 분량의 대화 기록을 단일 프롬프트에 넣을 수 있음을 의미합니다.

새로운 컨텍스트 압축(context compaction) 기능(베타)은 오래된 대화 세그먼트를 자동으로 요약하여 사용 가능한 컨텍스트를 더욱 효과적으로 확장합니다.

2. 지시 이행 능력 향상 및 환각 현상 감소

이는 개발자들이 가장 먼저 눈치챈 변화입니다. Claude Code 테스트 결과는 다음과 같습니다:

70%가 Sonnet 4.5보다 Sonnet 4.6을 선호
59%가 심지어 (2025년 11월의 최신 모델이었던) Opus 4.5보다도 선호

언급된 구체적인 개선 사항:

수정하기 전 기존 코드를 먼저 읽음 (추측하지 않음)
로직을 중복 생성하지 않고 통합함
성공에 대한 거짓 주장 감소 (실제로 해결하지 않았는데 "버그를 수정했습니다"라고 하는 현상)
과잉 엔지니어링 감소 — 불필요한 추상화를 추가하지 않음
다단계 작업에서의 더 나은 완수 능력

Cursor의 공동 창립자는 이를 "장기적인 작업과 더 어려운 문제를 포함하여 모든 면에서 Sonnet 4.5보다 눈에 띄게 개선된 모델"이라고 평가했습니다. GitHub는 복잡한 교차 코드베이스 수정 작업에서 "강력한 해결률과 개발자가 필요로 하는 일관성"을 보여주었다고 보고했습니다.

3. 컴퓨터 사용 기능의 프로덕션 준비 완료

OSWorld에서 61.4%에서 72.5%로의 도약은 임계값을 넘은 것입니다. 사용자들은 "복잡한 스프레드시트를 탐색하거나 다단계 웹 양식을 채우는 등의 작업에서 인간 수준의 능력"을 보여준다고 설명합니다.

또한 Sonnet 4.6은 컴퓨터 사용에 대한 프롬프트 인젝션 방어력을 Opus 4.6 수준으로 크게 향상시켰습니다. 이는 웹을 검색하거나 신뢰할 수 없는 입력을 처리하는 모든 에이전트에게 매우 중요합니다.

4. Extended Thinking + Adaptive Thinking

두 기능 모두 지원되어 모델이 더 어려운 문제에 더 많은 연산량을 할당할 수 있게 합니다. 특히 Sonnet 4.6은 Extended Thinking을 활성화하지 않아도 강력한 성능을 발휘합니다. 기본 모델 자체가 근본적으로 더 나아졌기 때문입니다.

5. 무료 티어 업그레이드

무료 Claude 사용자에게 이제 Sonnet 4.6이 기본으로 제공되며, 추가로 다음 기능들이 포함됩니다:

파일 생성 기능

커넥터 (외부 데이터와의 통합)

Skills (재사용 가능한 지침)

컨텍스트 압축

이는 현재 어떤 주요 공급업체보다 가장 뛰어난 무료 AI 티어입니다.

6. Excel 내 MCP 커넥터

Excel용 Claude는 이제 S&P Global, LSEG, Daloopa, PitchBook, Moody's 및 FactSet을 위한 커넥터를 지원하여, 실시간 금융 데이터를 스프레드시트로 직접 불러올 수 있습니다.

가격

Sonnet 4.5와 동일하게 유지됩니다:

요금제	가격
claude.ai Free	$0 (Sonnet 4.6 기본 제공, 사용량 제한)
claude.ai Pro	월 $20 (더 높은 제한, Opus 접근 권한)
API 입력	100만 토큰당 $3
API 출력	100만 토큰당 $15

비교 데이터:

Opus 4.6 API: 100만 토큰당 $15/$75 (5배 비쌈)

GPT-5.2 API: 100만 토큰당 $5/$15 (입력 비용 1.7배)

Gemini 3 Pro API: 100만 토큰당 $7/$21 (입력 비용 2.3배)

Claude Code 세션당 비용

일반적인 코딩 세션(입력 100K + 출력 20K 토큰) 기준:

모델	세션당 비용
Sonnet 4.6	$0.60
GPT-5.2	$0.80
Opus 4.6	$3.00

하루에 100번의 에이전트 세션을 실행하는 팀은 Opus 대신 Sonnet 4.6을 사용하여 하루 약 $240를 절약할 수 있습니다.

접속 방법

claude.ai

이미 기본값으로 설정되어 있습니다. claude.ai를 열면 바로 Sonnet 4.6을 사용하게 됩니다.

Claude Code

bash

claude  # 이제 Sonnet 4.6이 기본값입니다
claude --model claude-sonnet-4-6-20250217  # 명시적 선택 시

API

모델 ID: claude-sonnet-4-6-20250217

python

import anthropic

client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-sonnet-4-6-20250217",
    max_tokens=4096,
    messages=[{"role": "user", "content": "Your prompt here"}]
)

클라우드 플랫폼

출시 첫날부터 Amazon Bedrock 및 Google Cloud Vertex AI에서 사용할 수 있습니다.

업계 동향

Sonnet 4.6은 Anthropic이 11일 만에 발표한 두 번째 주요 릴리스입니다(2월 6일 Opus 4.6 출시 이후). CNBC는 이 속도를 "아찔할 정도로 빠른 AI 모델 출시의 연속"이라고 묘사했습니다. VentureBeat는 이를 "AI 업계의 지각 변동을 일으키는 가격 재책정 사건"이라고 불렀습니다.

더 넓은 트렌드는 성능의 하한선이 높아지고 있다는 것입니다. 6개월 전에는 $15/$75의 플래그십 모델이 필요했던 작업들을 이제 $3/$15의 가격으로 처리할 수 있습니다. AI 제품 빌더들에게 이는 다음을 의미합니다:

AI 기능 실행 비용이 5배 저렴해짐
컴퓨터 사용 에이전트의 대규모 경제적 타당성 확보
모델이 더 이상 병목 현상이 아님 — 이제는 실행력이 중요함

Claude Sonnet 4.6으로 제품을 만들고 계신가요? Y Build는 AI 기반 개발을 위해 Claude Code와 통합되며, 배포, Demo Cut 제품 영상, AI SEO 및 분석까지 코드에서 성장까지 전 과정을 처리합니다. 무료로 시작하세요.

출처: