Claude Opus 4.7: 新機能、ベンチマーク、完全ガイド (2026)
Claude Opus 4.7が登場 — コーディング性能が13%向上、ビジョン容量が3倍に、新しいxhighエフォートレベルを搭載。ベンチマーク、価格、GPT-5.4との比較を完全網羅。
TL;DR
| 詳細 | Claude Opus 4.7 |
|---|---|
| リリース日 | 2026年4月16日 |
| モデルID | claude-opus-4-7 |
| 価格 | 100万トークンあたり $5/$25 (Opus 4.6と同じ) |
| コンテキストウィンドウ | 100万トークン |
| 利用可能環境 | API, Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry |
| 主な改善点 | コーディングで13%向上、ビジョンが3倍、新しいエフォートレベル |
| SWE-bench Verified | ~85-90% (80.8%から向上) |
| Claude Codeの新機能 | /ultrareview — マルチエージェントによるコードレビュー |
Claude Opus 4.7の新機能
Claude Opus 4.7は、2026年4月16日にリリースされたAnthropicの最新の一般公開フロンティアモデルです。これはOpus 4.6からの漸進的ですが有意義なアップグレードであり、特にソフトウェアエンジニアリングとビジョンにおいて最大の進化を遂げています。
Claude Mythos Preview(Anthropicがサイバーセキュリティパートナー限定に制限しているモデル)とは異なり、Opus 4.7は一般公開されており、すべてのClaude製品およびAPIで利用可能です。
ベンチマーク結果
ソフトウェアエンジニアリング
| ベンチマーク | Opus 4.7 | Opus 4.6 | GPT-5.4 | Mythos Preview |
|---|---|---|---|---|
| SWE-bench Verified | ~85-90% | 80.8% | ~80% | 93.9% |
| SWE-bench Pro | ~45% | — | 57.7% | 77.8% |
| Terminal-Bench 2.0 | 65.4% | 66.5% | 75.1% | 82% |
| 内部93タスクコーディング | 4.6と比較して+13% | ベースライン | — | — |
| Rakuten-SWE-Bench | 解決数が3倍に | ベースライン | — | — |
最大の改善点は、難易度の高い複数ファイルにわたるタスクで見られます。Anthropicは、複数のファイルの理解、複雑なリファクタリング、および出力の検証を必要とする「最も困難なタスク」において特に成果が出ていると述べています。
その他の能力
| 領域 | 改善点 |
|---|---|
| ドキュメント推論 | エラーが21%減少 |
| 工場自動化 | 10-15%のパフォーマンス向上 |
| ビジョン | 画像解像度が3倍に(最大2,576px / 3.75MP) |
| ロングコンテキスト | 100万トークンにわたる検索と推論の向上 |
| MCP最適化 | Opus 4.5と比較してトークンオーバーヘッドが30%減少 |
ビジョンのアップグレード:解像度が3倍に
Opus 4.7は、長辺最大2,576ピクセル(約375万画素)の画像を受け入れることができます。これは以前の容量の3倍以上です。これは以下の用途で重要になります。
- 技術図面 — アーキテクチャ図、回路図
- 化学構造式 — 出版品質の分子構造図
- 高密度のスクリーンショット — コード、ダッシュボード、スプレッドシートのフルページキャプチャ
- デザインモックアップ — 高精細なUIデザイン
新機能: 「xhigh」によるエフォート制御
Opus 4.7では、新しいエフォートレベルとしてxhighが導入されました。これは「high」と「max」の中間に位置します。
| エフォートレベル | ユースケース | トークン使用量 |
|---|---|---|
| low | 単純なクエリ、迅速な回答 | 最小限 |
| medium | 標準的なタスク | 通常 |
| high | 複雑な推論 | 多め |
| xhigh | 困難な複数ステップのタスク | 多い |
| max | 最難関の問題、最高品質 | 最大 |
xhighレベルを使用すると、「high」よりも深い推論を、「max」のフルコストをかけずに実行できます。これはプロダクション環境のワークロードにおいて実用的な中間選択肢となります。
タスク予算(パブリックベータ)
エフォート制御と並行して、Anthropicはタスク予算(task budgets)を導入しています。これは、開発者が長時間実行される操作に対してトークン消費制限を設定する方法です。これにより、個々のAPIコールを細かく管理することなく、コストを制御できます。
Claude Codeのアップデート
/ultrareview — マルチエージェント・コードレビュー
Claude Codeの目玉機能は/ultrareviewです。これは、複数のサブエージェントを使用してコードを分析する、クラウド駆動型のコードレビューシステムです。
- バグ検出フェーズ: 5〜20個のサブエージェントを生成し、コードベース内の異なるパスを独立して探索します。
- 検証フェーズ: 別のサブエージェントが候補となった各バグを検証し、誤検知をフィルタリングします。
Maxユーザー向けAutoモード
Claude Codeが確認を求めずにコマンドを実行し、編集を行う「Autoモード」が、Maxサブスクライバー向けに提供開始されました。
Opus 4.7 vs GPT-5.4:どちらを使うべきか?
| 比較項目 | Opus 4.7 | GPT-5.4 |
|---|---|---|
| 複雑なコーディング | リード(複数ファイルのリファクタリング) | 強力だが一歩譲る |
| コンピュータ操作 | 未対応 | リード(75% OSWorld) |
| ロングコンテキスト | 100万トークン、より優れた推論 | 105万トークン |
| ビジョン | 3.75MP、技術図面に強い | 良好だが解像度は低め |
| 速度 | 低速だが徹底的 | 実行が高速 |
| 価格 | $5/$25 per MTok | $2.50/$15 per MTok |
| MCPサポート | ネイティブ、最適化済み | 制限あり |
トークン使用量に関する注意
Opus 4.7では、テキストを異なる方法で処理する更新されたトークナイザーが使用されています。コンテンツによっては、同じ入力でも1.0〜1.35倍多くのトークンとしてカウントされる場合があります。高いエフォートレベルでの出力トークンの増加と相まって、トークン単価は変わっていなくても、コストが増加する可能性があります。
Opus 4.6からアップグレードする場合は、最初の数日間のトークン使用量を監視してください。
サイバーセキュリティのセーフガード
Mythos Previewの一件を受け、AnthropicはサイバーセキュリティのセーフガードをOpus 4.7に直接組み込みました。
- 禁止されている、またはリスクの高いサイバーセキュリティリクエストの自動検出およびブロック
- 正当なセキュリティ研究者やペネトレーションテスターのためのCyber Verification Program(サイバー検証プログラム)
- サイバー分野では意図的にMythos Previewよりも能力を抑えており、Anthropicがより強力でないモデルでセーフガードをまずテストできるようにしています。
アクセス方法
# API
curl https://api.anthropic.com/v1/messages \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "content-type: application/json" \
-d '{"model": "claude-opus-4-7", "max_tokens": 1024, "messages": [{"role": "user", "content": "Hello"}]}'
# Claude Code
claude --model opus # デフォルトで最新のopusを使用
また、リリース初日からAmazon Bedrock、Google Cloud Vertex AI、Microsoft Foundryでも利用可能です。
よくある質問
Claude Opus 4.7の料金はいくらですか?
100万入力トークンあたり5ドル、100万出力トークンあたり25ドルです。これはOpus 4.6と同じです。ただし、更新されたトークナイザーにより、同じコンテンツでもトークン数が1.0〜1.35倍になる可能性があります。
Opus 4.7はGPT-5.4よりも優れていますか?
複雑なソフトウェアエンジニアリングや複数ファイルにわたるコーディングタスクについては「はい」です。コンピュータ操作、デスクトップ自動化、およびコスト効率については、現在のところGPT-5.4の方が優れています。それぞれ得意分野が異なります。
Claude Codeの/ultrareviewコマンドとは何ですか?
これはマルチエージェント・コードレビューシステムで、5〜20個のサブエージェントを生成してコード内のバグを独立して発見し、その後それぞれの発見内容を検証して誤検知を排除します。ProおよびMaxユーザーは3回無料で利用できます。
Opus 4.7はClaude Mythos Previewと比べてどうですか?
Mythos Previewの方が大幅に能力が高い(SWE-benchで93.9% vs ~85-90%)ですが、一般には公開されていません。Opus 4.7は、実際に利用可能な中で最高のClaudeモデルです。
Opus 4.6からアップグレードすべきですか?
複雑なコーディングを行ったり、技術的な画像を扱ったりする場合は「はい」です。13%のコーディング改善と3倍のビジョン解像度は有意義です。ただし、新しいトークナイザーによってコストが増加する可能性があるため、トークン使用量には注意してください。
「xhigh」エフォートレベルとは何ですか?
「high」と「max」の間に設定された新しいエフォート設定で、maxレベルほどのフルコストをかけずに、より深い推論を可能にします。品質は求めたいがコストも抑えたい困難なタスクに適しています。
結論
Opus 4.7は革命的な変化ではありませんが、堅実なアップグレードです。コーディングの向上は本物であり、ビジョンの改善も顕著です。そして/ultrareviewは真に新しい機能といえます。しかし、最も大きなニュースは「これが何でないか」かもしれません。これはMythos Previewではありません。Anthropicの公開モデルと非公開モデルの差は、かつてないほど広がっています。
開発者にとって、Opus 4.7は現在公開されている最高のClaudeモデルであり、複雑なエンジニアリング作業における強力な選択肢です。モデルやインフラの管理をせずにAI搭載製品を構築したい場合は、Y Buildがそれらを代行します。サーバーやターミナルを必要とせず、製品を出荷するモバイルファーストのAIエージェントと考えてください。