Claude Opus 4.7: 새로운 기능, 벤치마크 및 전체 가이드 (2026)

Q: Opus 4.7 vs GPT-5.4: 어떤 것을 사용해야 할까요?

| 비교 차원 | Opus 4.7 | GPT-5.4 | |-----------|----------|---------| | 복잡한 코딩 | 우세 (다중 파일 리팩토링) | 강력하지만 뒤처짐 |

TL;DR

항목	Claude Opus 4.7
출시일	2026년 4월 16일
모델 ID	`claude-opus-4-7`
가격	1M 토큰당 $5/$25 (Opus 4.6과 동일)
컨텍스트 윈도우	1M 토큰
가용성	API, Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry
주요 개선 사항	코딩 성능 13% 향상, 비전 3배 강화, 새로운 노력 수준(effort levels)
SWE-bench Verified	~85-90% (80.8%에서 상승)
새로운 Claude Code 기능	`/ultrareview` — 멀티 에이전트 코드 리뷰

Claude Opus 4.7의 새로운 기능은 무엇인가요?

Claude Opus 4.7은 2026년 4월 16일에 출시된 Anthropic의 최신 범용 프론티어 모델입니다. Opus 4.6에서 점진적이지만 의미 있는 업그레이드가 이루어졌으며, 특히 소프트웨어 엔지니어링과 비전 분야에서 가장 큰 성과를 거두었습니다.

Anthropic이 사이버 보안 파트너에게만 제한적으로 공개했던 Claude Mythos Preview와 달리, Opus 4.7은 모든 Claude 제품과 API에서 공개적으로 사용 가능합니다.

벤치마크 결과

소프트웨어 엔지니어링

벤치마크	Opus 4.7	Opus 4.6	GPT-5.4	Mythos Preview
SWE-bench Verified	~85-90%	80.8%	~80%	93.9%
SWE-bench Pro	~45%	—	57.7%	77.8%
Terminal-Bench 2.0	65.4%	66.5%	75.1%	82%
내부 93개 과제 코딩	4.6 대비 +13%	기준점	—	—
Rakuten-SWE-Bench	해결 수 3배 증가	기준점	—	—

가장 큰 개선점은 어렵고 복잡한 다중 파일 작업에서 나타납니다. Anthropic은 특히 여러 파일에 대한 이해, 복잡한 리팩토링, 그리고 출력 결과 검증이 필요한 "가장 어려운 작업"에서 큰 진전이 있었다고 강조합니다.

기타 기능

영역	개선 사항
문서 추론	오류 21% 감소
공장 자동화	성능 10-15% 향상
비전	이미지 해상도 3배 증가 (최대 2,576px / 3.75MP)
긴 컨텍스트	1M 토큰 내 검색 및 추론 능력 향상
MCP 최적화	Opus 4.5 대비 토큰 오버헤드 30% 감소

비전 업그레이드: 3배 더 높은 해상도

Opus 4.7은 긴 쪽 기준 최대 2,576 픽셀(~3.75 메가픽셀)의 이미지를 수용하며, 이는 이전 용량의 3배가 넘는 수치입니다. 이는 다음과 같은 작업에 중요합니다:

기술 도표 — 아키텍처 차트, 회로도
화학 구조 — 출판물 품질의 분자 구조도
복잡한 스크린샷 — 코드, 대시보드, 스프레드시트의 전체 페이지 캡처
디자인 목업 — 고해상도 UI 디자인

그동안 상세한 시각 자료에 대한 Claude의 이미지 이해도에 답답함을 느꼈다면, 이번 업그레이드는 매우 큰 변화로 다가올 것입니다.

새로운 기능: "xhigh"를 통한 노력 제어

Opus 4.7은 "high"와 "max" 사이에 위치하는 새로운 노력 수준인 xhigh를 도입했습니다.

노력 수준	사용 사례	토큰 사용량
low	단순한 쿼리, 빠른 답변	최소
medium	일반적인 작업	보통
high	복잡한 추론	높음
xhigh	어려운 다단계 작업	매우 높음
max	가장 어려운 문제, 최고 품질	최대

xhigh 레벨은 "high"보다 더 깊은 추론 능력을 제공하면서도, "max"의 전체 토큰 비용보다는 저렴하여 실제 프로덕션 환경에서 실용적인 중간 지점을 제공합니다.

작업 예산 (퍼블릭 베타)

노력 제어와 함께 Anthropic은 작업 예산(task budgets) 기능을 도입합니다. 이는 개발자가 장시간 실행되는 작업에 대해 토큰 소비 한도를 설정할 수 있는 방법입니다. 이를 통해 각 API 호출을 일일이 관리하지 않고도 비용을 제어할 수 있습니다.

Claude Code 업데이트

/ultrareview — 멀티 에이전트 코드 리뷰

Claude Code의 주요 기능은 /ultrareview입니다. 이는 여러 서브 에이전트를 사용하여 코드를 분석하는 클라우드 기반 코드 리뷰 시스템입니다:

버그 탐지 단계: 코드베이스의 다양한 경로를 독립적으로 탐색하는 5~20개의 서브 에이전트를 생성합니다.
검증 단계: 별도의 서브 에이전트가 각 후보 버그를 검증하여 가짜 양성(오탐)을 걸러냅니다.

Pro 및 Max 사용자는 3회의 무료 ultrareview를 제공받습니다. 이는 현재 어떤 AI 코딩 도구에서도 볼 수 없는 가장 정교한 코드 리뷰 기능입니다.

Max 사용자를 위한 자동 모드(Auto Mode)

Claude Code가 확인 절차 없이 명령을 실행하고 수정 사항을 반영하는 자동 모드(Auto mode)가 이제 Max 구독자에게 제공됩니다.

Opus 4.7 vs GPT-5.4: 어떤 것을 사용해야 할까요?

비교 차원	Opus 4.7	GPT-5.4
복잡한 코딩	우세 (다중 파일 리팩토링)	강력하지만 뒤처짐
컴퓨터 사용	지원 안 함	우세 (75% OSWorld)
긴 컨텍스트	1M 토큰, 더 나은 추론	1.05M 토큰
비전	3.75MP, 기술 도표에 강함	우수하지만 해상도가 낮음
속도	느리지만 철저함	더 빠른 실행
가격	1M 토큰당 $5/$25	1M 토큰당 $2.50/$15
MCP 지원	네이티브 지원, 최적화됨	제한적임

Opus 4.7을 선택해야 하는 경우: 복잡한 소프트웨어 엔지니어링, 다중 파일 리팩토링, 긴 컨텍스트 분석, 기술 문서 추론, MCP를 활용한 에이전트 워크플로우. GPT-5.4를 선택해야 하는 경우: 컴퓨터 사용/자동화, 신속한 프로토타이핑, 비용 민감형 애플리케이션, 데스크톱 에이전트 작업.

토큰 사용량 주의사항

Opus 4.7은 텍스트를 다르게 처리하는 업데이트된 토크나이저를 사용합니다. 콘텐츠에 따라 동일한 입력이 1.0~1.35배 더 많은 토큰으로 매핑될 수 있습니다. 높은 노력 수준에서의 더 많은 출력 토큰 생성과 결합되어, 토큰당 가격은 변하지 않았더라도 실제 비용은 증가할 수 있습니다.

Opus 4.6에서 업그레이드하는 경우, 처음 며칠 동안 토큰 사용량을 모니터링하시기 바랍니다.

사이버 보안 안전장치

Mythos Preview 상황 이후, Anthropic은 Opus 4.7에 직접 사이버 보안 안전장치를 구축했습니다:

금지되거나 위험도가 높은 사이버 보안 요청에 대한 자동 탐지 및 차단
정당한 보안 연구원 및 모의 해킹 전문가를 위한 사이버 검증 프로그램(Cyber Verification Program)
사이버 분야에서 의도적으로 Mythos Preview보다 낮은 성능을 유지하여, Anthropic이 덜 강력한 모델에서 안전장치를 먼저 테스트할 수 있도록 함

접근 방법

bash

# API
curl https://api.anthropic.com/v1/messages \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "content-type: application/json" \
  -d '{"model": "claude-opus-4-7", "max_tokens": 1024, "messages": [{"role": "user", "content": "Hello"}]}'

# Claude Code
claude --model opus  # 최신 opus 모델로 기본 설정됨

또한 출시 첫날부터 Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry에서도 사용 가능합니다.

자주 묻는 질문 (FAQ)

Claude Opus 4.7의 가격은 얼마인가요?

입력 토큰 100만 개당 $5, 출력 토큰 100만 개당 $25로 Opus 4.6과 동일합니다. 하지만 업데이트된 토크나이저로 인해 동일한 콘텐츠에 대해 1.0~1.35배 더 많은 토큰이 발생할 수 있습니다.

Opus 4.7이 GPT-5.4보다 나은가요?

복잡한 소프트웨어 엔지니어링 및 다중 파일 코딩 작업의 경우 그렇습니다. 하지만 컴퓨터 사용, 데스크톱 자동화 및 비용 효율성 측면에서는 현재 GPT-5.4가 더 우수합니다. 두 모델은 서로 다른 영역에서 강점을 보입니다.

Claude Code의 /ultrareview 명령은 무엇인가요?

5~20개의 서브 에이전트를 생성하여 코드의 버그를 독립적으로 찾은 다음, 각 발견 사항을 검증하여 가짜 양성을 필터링하는 멀티 에이전트 코드 리뷰 시스템입니다. Pro 및 Max 사용자는 3회의 무료 ultrareview를 받을 수 있습니다.

Opus 4.7은 Claude Mythos Preview와 어떻게 다른가요?

Mythos Preview는 성능 면에서 훨씬 더 뛰어납니다 (SWE-bench 기준 93.9% vs ~85-90%). 하지만 일반 대중에게는 공개되지 않았습니다. Opus 4.7은 실제로 사용할 수 있는 가장 뛰어난 Claude 모델입니다.

Opus 4.6에서 업그레이드해야 할까요?

복잡한 코딩을 하거나 기술적인 이미지를 다루는 경우라면 그렇습니다. 13%의 코딩 성능 향상과 3배의 비전 해상도 증가는 매우 의미 있는 변화입니다. 다만 새로운 토크나이저로 인해 비용이 증가할 수 있으니 토큰 사용량을 주시하세요.

"xhigh" 노력 수준이란 무엇인가요?

"high"와 "max" 사이의 새로운 노력 설정으로, "max" 노력의 전체 토큰 비용을 들이지 않으면서도 더 깊은 추론 능력을 제공합니다. 품질은 원하지만 비용을 조절해야 하는 어려운 작업에 적합합니다.

요약

Opus 4.7은 혁명이라기보다는 견고한 업그레이드입니다. 코딩 성능 향상은 실질적이며, 비전 개선은 상당하고, /ultrareview는 진정으로 새로운 기능입니다. 하지만 가장 큰 뉴스는 이 모델이 Mythos Preview가 아니라는 점일지도 모릅니다. Anthropic의 공개 모델과 비공개 모델 간의 격차는 그 어느 때보다 넓어졌습니다.

개발자들에게 Opus 4.7은 현재 공개된 가장 뛰어난 Claude 모델이며 복잡한 엔지니어링 작업을 위한 강력한 선택지입니다. 모델과 인프라를 직접 관리하지 않고 AI 기반 제품을 빌드하고 싶다면, Y Build가 이를 대신 처리해 드립니다. 서버나 터미널 없이 제품을 출시하는 모바일 우선 AI 에이전트를 경험해 보세요.