Claude Opus 4.7: มีอะไรใหม่, ผลการทดสอบ (Benchmarks) และคู่มือฉบับเต็ม (2026)
Claude Opus 4.7 มาแล้ว — เขียนโค้ดดีขึ้น 13%, ขีดความสามารถด้าน vision เพิ่มขึ้น 3 เท่า, ระดับความพยายามใหม่ xhigh พร้อมผลทดสอบฉบับเต็ม ราคา และการเปรียบเทียบกับ GPT-5.4
สรุปสั้นๆ (TL;DR)
| รายละเอียด | Claude Opus 4.7 |
|---|---|
| วันที่เปิดตัว | 16 เมษายน 2026 |
| Model ID | claude-opus-4-7 |
| ราคา | $5/$25 ต่อ MTok (เท่ากับ Opus 4.6) |
| Context window | 1 ล้าน tokens |
| การใช้งาน | API, Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry |
| การปรับปรุงที่สำคัญ | เขียนโค้ดดีขึ้น 13%, vision 3 เท่า, ระดับความพยายาม (effort levels) ใหม่ |
| SWE-bench Verified | ~85-90% (เพิ่มขึ้นจาก 80.8%) |
| ฟีเจอร์ใหม่ Claude Code | /ultrareview — การรีวิวโค้ดแบบ multi-agent |
มีอะไรใหม่ใน Claude Opus 4.7?
Claude Opus 4.7 เป็นโมเดลระดับ Frontier ล่าสุดจาก Anthropic ที่เปิดใช้งานทั่วไป (GA) เมื่อวันที่ 16 เมษายน 2026 ซึ่งเป็นการอัปเกรดแบบต่อเนื่องแต่มีความหมายจาก Opus 4.6 โดยมีประสิทธิภาพเพิ่มขึ้นสูงสุดในด้านวิศวกรรมซอฟต์แวร์ (software engineering) และ vision
ไม่เหมือนกับ Claude Mythos Preview (ซึ่ง Anthropic จำกัดให้เฉพาะพันธมิตรด้านความมั่นคงปลอดภัยทางไซเบอร์) Opus 4.7 เปิดให้ใช้งานแก่สาธารณะ ในทุกผลิตภัณฑ์ของ Claude และ API
ผลการทดสอบ (Benchmark Results)
วิศวกรรมซอฟต์แวร์ (Software Engineering)
| Benchmark | Opus 4.7 | Opus 4.6 | GPT-5.4 | Mythos Preview |
|---|---|---|---|---|
| SWE-bench Verified | ~85-90% | 80.8% | ~80% | 93.9% |
| SWE-bench Pro | ~45% | — | 57.7% | 77.8% |
| Terminal-Bench 2.0 | 65.4% | 66.5% | 75.1% | 82% |
| Internal 93-task coding | +13% เทียบกับ 4.6 | baseline | — | — |
| Rakuten-SWE-Bench | แก้ไขปัญหาได้มากขึ้น 3 เท่า | baseline | — | — |
การปรับปรุงที่ใหญ่ที่สุดคือในด้าน งานที่ยากและเกี่ยวข้องกับหลายไฟล์ (multi-file tasks) ทาง Anthropic ระบุเจาะจงถึงประสิทธิภาพที่เพิ่มขึ้นใน "งานที่ยากที่สุด" ซึ่งเป็นประเภทที่ต้องใช้ความเข้าใจไฟล์หลายไฟล์ การ Refactor ที่ซับซ้อน และการตรวจสอบผลลัพธ์
ความสามารถด้านอื่นๆ
| ด้านที่ทดสอบ | การปรับปรุง |
|---|---|
| การให้เหตุผลในเอกสาร | ข้อผิดพลาดลดลง 21% |
| ระบบอัตโนมัติในโรงงาน | ประสิทธิภาพเพิ่มขึ้น 10-15% |
| Vision | ความละเอียดภาพเพิ่มขึ้น 3 เท่า (สูงสุด 2,576px / 3.75MP) |
| Long context | ปรับปรุงการดึงข้อมูล (retrieval) และการให้เหตุผลใน 1 ล้าน tokens |
| การเพิ่มประสิทธิภาพ MCP | ลด token overhead ลง 30% เมื่อเทียบกับ Opus 4.5 |
อัปเกรด Vision: ความละเอียดเพิ่มขึ้น 3 เท่า
Opus 4.7 รองรับรูปภาพที่มีความละเอียดสูงสุดถึง 2,576 พิกเซลในด้านที่ยาวที่สุด (~3.75 megapixels) ซึ่งมากกว่าความสามารถเดิมถึง 3 เท่า สิ่งนี้สำคัญสำหรับ:
- แผนผังทางเทคนิค — แผนผังโครงสร้าง (architecture charts), ผังวงจรไฟฟ้า
- โครงสร้างทางเคมี — แผนภาพโมเลกุลที่มีความละเอียดระดับสิ่งพิมพ์
- ภาพหน้าจอที่มีข้อมูลหนาแน่น — การจับภาพหน้าจอโค้ดแบบเต็มหน้า, แดชบอร์ด, สเปรดชีต
- ม็อคอัพการออกแบบ — งานออกแบบ UI ที่มีความละเอียดสูง
ใหม่: การควบคุมความพยายามด้วย "xhigh"
Opus 4.7 แนะนำระดับความพยายาม (effort level) ใหม่: xhigh — ซึ่งอยู่ระหว่าง "high" และ "max"
| ระดับความพยายาม | กรณีการใช้งาน | การใช้ Token |
|---|---|---|
| low | คำถามง่ายๆ, คำตอบที่รวดเร็ว | น้อยมาก |
| medium | งานมาตรฐานทั่วไป | ปกติ |
| high | การให้เหตุผลที่ซับซ้อน | สูงขึ้น |
| xhigh | งานที่มีหลายขั้นตอนและยาก | สูง |
| max | ปัญหาที่ยากที่สุด, คุณภาพสูงสุด | สูงสุด |
ระดับ xhigh ช่วยให้คุณได้ความลึกในการให้เหตุผลมากกว่า "high" โดยไม่ต้องเสียค่า Token ทั้งหมดของ "max" ซึ่งเป็นจุดกึ่งกลางที่ใช้งานได้จริงสำหรับงานระดับ Production
งบประมาณสำหรับงาน (Task Budgets - Public Beta)
นอกจากการควบคุมความพยายามแล้ว Anthropic ยังเปิดตัว งบประมาณสำหรับงาน (task budgets) — วิธีสำหรับนักพัฒนาในการตั้งขีดจำกัดการใช้ Token สำหรับการทำงานที่ใช้เวลานาน สิ่งนี้ช่วยให้คุณควบคุมค่าใช้จ่ายได้โดยไม่ต้องคอยจัดการ API call แต่ละครั้งอย่างละเอียด
อัปเดต Claude Code
/ultrareview — การรีวิวโค้ดแบบ Multi-Agent
ฟีเจอร์เด่นของ Claude Code คือ /ultrareview — ระบบรีวิวโค้ดที่ขับเคลื่อนด้วยคลาวด์ ซึ่งใช้ sub-agents หลายตัว ในการวิเคราะห์โค้ดของคุณ:
- ขั้นตอนการตรวจหาบั๊ก (Bug Detection Phase): สร้าง sub-agents 5-20 ตัว เพื่อสำรวจเส้นทางต่างๆ ในซอร์สโค้ดของคุณอย่างอิสระ
- ขั้นตอนการตรวจสอบ (Verification Phase): sub-agents แยกต่างหากจะตรวจสอบบั๊กแต่ละตัวที่พบ เพื่อกรองผลบวกปลอม (false positives) ออกไป
โหมดอัตโนมัติ (Auto Mode) สำหรับผู้ใช้ Max
Auto mode — ซึ่ง Claude Code จะรันคำสั่งและแก้ไขโค้ดโดยไม่ต้องรอการยืนยัน — พร้อมใช้งานแล้วสำหรับสมาชิกระดับ Max
Opus 4.7 ปะทะ GPT-5.4: ควรเลือกใช้อันไหน?
| มิติการเปรียบเทียบ | Opus 4.7 | GPT-5.4 |
|---|---|---|
| การเขียนโค้ดที่ซับซ้อน | เป็นผู้นำ (การ Refactor หลายไฟล์) | แข็งแกร่งแต่ยังตามหลัง |
| การใช้งานคอมพิวเตอร์ | ยังไม่รองรับ | เป็นผู้นำ (75% OSWorld) |
| Long context | 1 ล้าน tokens, ให้เหตุผลได้ดีกว่า | 1.05 ล้าน tokens |
| Vision | 3.75MP, แผนผังทางเทคนิค | ดีแต่ความละเอียดน้อยกว่า |
| ความเร็ว | ช้ากว่า, รอบคอบกว่า | ทำงานเร็วกว่า |
| ราคา | $5/$25 ต่อ MTok | $2.50/$15 ต่อ MTok |
| การรองรับ MCP | รองรับตั้งแต่ต้น, ปรับแต่งมาดี | จำกัด |
คำเตือนเกี่ยวกับการใช้ Token
Opus 4.7 ใช้ tokenizer ตัวใหม่ ที่ประมวลผลข้อความแตกต่างออกไป อินพุตเดียวกันอาจถูกนับเป็น 1.0–1.35 เท่าของ token เดิม ขึ้นอยู่กับเนื้อหา เมื่อรวมกับ output token ที่มากขึ้นในระดับความพยายามที่สูงขึ้น ค่าใช้จ่ายของคุณอาจเพิ่มขึ้นแม้ว่าราคาต่อหน่วย token จะไม่เปลี่ยนแปลงก็ตาม
หากคุณอัปเกรดจาก Opus 4.6 ควรตรวจสอบการใช้งาน token ของคุณในช่วงสองสามวันแรก
มาตรการความปลอดภัยทางไซเบอร์
หลังจากสถานการณ์ของ Mythos Preview ทาง Anthropic ได้สร้างมาตรการความปลอดภัยทางไซเบอร์ลงใน Opus 4.7 โดยตรง:
- การตรวจจับและบล็อกอัตโนมัติ สำหรับคำขอทางไซเบอร์ที่ต้องห้ามหรือมีความเสี่ยงสูง
- โปรแกรมการตรวจสอบทางไซเบอร์ (Cyber Verification Program) สำหรับนักวิจัยด้านความปลอดภัยและ pen testers ที่ถูกกฎหมาย
- ตั้งใจทำให้มีความสามารถด้านไซเบอร์น้อยกว่า Mythos Preview เพื่อให้ Anthropic สามารถทดสอบมาตรการความปลอดภัยในโมเดลที่มีพลังน้อยกว่าก่อน
วิธีการเข้าใช้งาน
# API
curl https://api.anthropic.com/v1/messages \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "content-type: application/json" \
-d '{"model": "claude-opus-4-7", "max_tokens": 1024, "messages": [{"role": "user", "content": "Hello"}]}'
# Claude Code
claude --model opus # จะเลือกใช้ opus ตัวล่าสุดโดยปริยาย
นอกจากนี้ยังพร้อมใช้งานบน Amazon Bedrock, Google Cloud Vertex AI และ Microsoft Foundry ตั้งแต่วันแรก
คำถามที่พบบ่อย (Frequently Asked Questions)
Claude Opus 4.7 ราคาเท่าไหร่?
$5 ต่อ 1 ล้าน input tokens และ $25 ต่อ 1 ล้าน output tokens — เท่ากับ Opus 4.6 อย่างไรก็ตาม tokenizer ตัวใหม่อาจส่งผลให้จำนวน token เพิ่มขึ้น 1.0-1.35 เท่าสำหรับเนื้อหาเดียวกัน
Opus 4.7 ดีกว่า GPT-5.4 หรือไม่?
สำหรับงานวิศวกรรมซอฟต์แวร์ที่ซับซ้อนและการเขียนโค้ดแบบหลายไฟล์ คำตอบคือใช่ แต่สำหรับการใช้งานคอมพิวเตอร์ (computer use), ระบบอัตโนมัติบนเดสก์ท็อป และความคุ้มค่าด้านราคา GPT-5.4 ปัจจุบันยังทำได้ดีกว่า ทั้งคู่มีความโดดเด่นในด้านที่แตกต่างกัน
คำสั่ง /ultrareview ใน Claude Code คืออะไร?
มันคือระบบรีวิวโค้ดแบบ multi-agent ที่จะสร้าง sub-agents 5-20 ตัวเพื่อค้นหาบั๊กในโค้ดของคุณอย่างอิสระ จากนั้นจะตรวจสอบสิ่งที่พบแต่ละอย่างเพื่อกรอง false positives ออก ผู้ใช้ Pro และ Max จะได้รับ 3 ultrareviews ฟรี
Opus 4.7 เปรียบเทียบกับ Claude Mythos Preview อย่างไร?
Mythos Preview มีความสามารถสูงกว่าอย่างเห็นได้ชัด (93.9% เทียบกับ ~85-90% ใน SWE-bench) แต่ไม่ได้เปิดให้สาธารณะใช้งาน Opus 4.7 จึงเป็นโมเดล Claude ที่ดีที่สุดที่คุณสามารถใช้งานได้จริง
ฉันควรอัปเกรดจาก Opus 4.6 หรือไม่?
ควร หากคุณทำงานเขียนโค้ดที่ซับซ้อนหรือทำงานกับภาพทางเทคนิค การปรับปรุงด้านการเขียนโค้ด 13% และความละเอียด vision 3 เท่าเป็นสิ่งที่คุ้มค่า เพียงแค่ต้องคอยดูการใช้ token เพราะ tokenizer ใหม่อาจทำให้ค่าใช้จ่ายเพิ่มขึ้น
ระดับความพยายาม "xhigh" คืออะไร?
เป็นการตั้งค่าความพยายามใหม่ระหว่าง "high" และ "max" ที่ให้ความลึกในการให้เหตุผลมากขึ้นโดยไม่ต้องเสียค่า token สูงเท่ากับระดับ max เหมาะสำหรับงานยากที่คุณต้องการคุณภาพแต่ยังต้องการควบคุมค่าใช้จ่าย
บทสรุป
Opus 4.7 คือการอัปเกรดที่แข็งแกร่ง ไม่ใช่การปฏิวัติ ประสิทธิภาพการเขียนโค้ดที่เพิ่มขึ้นนั้นสัมผัสได้จริง การปรับปรุง vision มีความสำคัญ และ /ultrareview เป็นความสามารถใหม่ที่ใช้งานได้ดีเยี่ยม แต่ข่าวที่ใหญ่ที่สุดอาจจะเป็นสิ่งที่มันไม่ได้เป็น — นั่นคือมันไม่ใช่ Mythos Preview ช่องว่างระหว่างโมเดลสาธารณะและโมเดลส่วนตัวของ Anthropic ตอนนี้กว้างกว่าที่เคย
สำหรับนักพัฒนา Opus 4.7 เป็นโมเดล Claude สาธารณะที่ดีที่สุดและเป็นตัวเลือกที่แข็งแกร่งสำหรับงานวิศวกรรมที่ซับซ้อน หากคุณต้องการสร้างผลิตภัณฑ์ที่ขับเคลื่อนด้วย AI โดยไม่ต้องจัดการโมเดลและโครงสร้างพื้นฐานเอง Y Build จะจัดการสิ่งนั้นให้คุณ — คิดซะว่าเป็น AI agent แบบ mobile-first ที่ช่วยส่งมอบผลิตภัณฑ์โดยไม่ต้องใช้เซิร์ฟเวอร์หรือเทอร์มินัล