Claude Sonnet 4.6: ذكاء اصطناعي بمستوى Opus وبسعر Sonnet

TL;DR (ملخص سريع)

أصدرت Anthropic نموذج Claude Sonnet 4.6 في 17 فبراير 2026. الخلاصة الأساسية:

79.6% في SWE-bench — أداء متطابق تقريبًا مع Opus 4.6 (80.8%) في مهام البرمجة الواقعية.
72.5% في OSWorld — تعادل تقريبًا مع Opus 4.6 (72.7%) في خاصية computer use، وضعف أداء GPT-5.2 (38.2%) تقريبًا.
3 دولار / 15 دولار لكل مليون token — السعر لم يتغير عن Sonnet 4.5، وهو أرخص بـ 5 مرات من Opus.
نافذة سياق (context window) بحجم 1M token (نسخة تجريبية) — بزيادة عن 200K.
أصبح الآن النموذج الافتراضي لجميع مستخدمي Claude بنسختيه المجانية و Pro.

فضل المطورون Sonnet 4.6 على Sonnet 4.5 بنسبة 70% في Claude Code، بل وفضلوه حتى على Opus 4.5 بنسبة 59%.

ما أعلنته Anthropic

يعد Claude Sonnet 4.6 ثاني إصدار رئيسي للنماذج من Anthropic في أقل من أسبوعين (بعد إطلاق Opus 4.6 في 6 فبراير). في مقالهم على المدونة، تصفه Anthropic بأنه "ترقية كاملة لمهارات النموذج في البرمجة، واستخدام الكمبيوتر، والاستدلال في السياقات الطويلة، وتخطيط الوكلاء (agent planning)، والعمل المعرفي، والتصميم."

الادعاء الأساسي: "الأداء الذي كان يتطلب سابقًا اللجوء إلى نموذج من فئة Opus — بما في ذلك المهام المكتبية ذات القيمة الاقتصادية في العالم الحقيقي — متاح الآن مع Sonnet 4.6."

هذا تصريح قوي؛ حيث تقول Anthropic فعليًا: لمعظم أعباء العمل في مرحلة الإنتاج، لم تعد بحاجة للدفع مقابل Opus.

تحليل شامل للاختبارات المرجعية (Benchmarks)

أين يتساوى Sonnet 4.6 مع Opus أو يتفوق عليه

الاختبار المرجعي	ما يختبره	Sonnet 4.6	Opus 4.6	GPT-5.2
SWE-bench Verified	البرمجة في العالم الحقيقي	79.6%	80.8%	80.0%
OSWorld-Verified	استخدام الكمبيوتر	72.5%	72.7%	38.2%
GDPval-AA (Elo)	المهام المكتبية	1633	1606	1462
Finance Agent v1.1	التحليل المالي	63.3%	60.1%	59.0%
OfficeQA	فهم المستندات	يماثل Opus	—	—

يتصدر Sonnet 4.6 بالفعل في المهام المكتبية والتحليل المالي — وهما فئتان لهما أهمية اقتصادية كبيرة.

أين لا يزال Opus 4.6 يحتفظ بالصدارة

الاختبار المرجعي	ما يختبره	Opus 4.6	Sonnet 4.6	الفجوة
Terminal-Bench 2.0	البرمجة الوكيلية عبر terminal	65.4%	59.1%	6.3%
BrowseComp	البحث الويب الوكيلي	84.0%	74.7%	9.3%
ARC-AGI-2	حل المشكلات المبتكرة	68.8%	58.3%	10.5%
GPQA Diamond	الاستدلال بمستوى الدراسات العليا	91.3%	89.9%	1.4%
MRCR v2 (8-needle 1M)	الاستدلال في السياقات الطويلة	76.0%	—	—

النمط واضح: يتفوق Opus في المهام التي تتطلب أعمق وأحدث مستويات الاستدلال — مثل إعادة هيكلة الأكواد البرمجية الضخمة (codebase-scale refactoring)، والأبحاث متعددة الخطوات، والمشكلات التي لم يرها النموذج من قبل. بينما يتفوق Sonnet في المهام الجاهزة للإنتاج والتي تتطلب سرعة عالية.

استخدام الكمبيوتر (Computer Use): تحسن ملحوظ

أرقام ميزة "استخدام الكمبيوتر" تستحق اهتمامًا خاصًا:

النموذج	درجة OSWorld	الجدول الزمني
Sonnet 3.5 (أكتوبر 2024)	14.9%	الإطلاق الأول
Sonnet 4.5	61.4%	+46.5%
Sonnet 4.6	72.5%	+11.1%
Opus 4.6	72.7%	الحد الأقصى
GPT-5.2	38.2%	للمقارنة

في غضون 16 شهرًا، انتقل Sonnet من 14.9% إلى 72.5% في استخدام الكمبيوتر — أي تحسن بمقدار 4.9 ضعف. وأفاد جيمي كوفي، الرئيس التنفيذي لشركة Pace (شركة لتكنولوجيا التأمين)، أن Sonnet 4.6 حقق 94% في اختبار استخدام الكمبيوتر الداخلي الخاص بهم: "إنه يستنتج أسباب الفشل ويصحح نفسه بطرق لم نرها من قبل."

ما الجديد مقارنة بـ Sonnet 4.5

1. نافذة سياق بمليون Token (نسخة تجريبية)

توسعت نافذة السياق من 200 ألف إلى مليون token. وهذا يعني أن قواعد الأكواد البرمجية الكاملة، أو المستندات القانونية الطويلة، أو ساعات من سجل المحادثات يمكن أن تندرج ضمن prompt واحد.

ميزة context compaction الجديدة (أيضًا في المرحلة التجريبية) تقوم بتلخيص أجزاء المحادثة القديمة تلقائيًا، مما يوسع السياق القابل للاستخدام بشكل أكبر.

2. اتباع أفضل للتعليمات وهلوسة أقل

هذا ما لاحظه المطورون أولاً. في اختبارات Claude Code:

70% فضلوا Sonnet 4.6 على Sonnet 4.5.
59% فضلوا استخدامه حتى على Opus 4.5 (النموذج الرائد في نوفمبر 2025).

التحسينات المحددة المذكورة:

يقرأ الكود الموجود قبل تعديله (بدلاً من التخمين).
يدمج المنطق البرمجي بدلاً من تكراره.
ادعاءات كاذبة أقل بالنجاح (مثل قوله "لقد أصلحت الخطأ" بينما لم يفعل).
هندسة مفرطة أقل — لا يضيف تجريدات (abstractions) غير ضرورية.
متابعة أفضل للمهام متعددة الخطوات.

وصف المؤسس المشارك لـ Cursor النموذج بأنه "تحسن ملحوظ عن Sonnet 4.5 في جميع المجالات، بما في ذلك المهام ذات المدى الطويل والمشكلات الأكثر صعوبة." وأفاد GitHub بوجود "معدلات حل قوية ونوع الاتساق الذي يحتاجه المطورون" في الإصلاحات المعقدة عبر قواعد الأكواد المتعددة.

3. "استخدام الكمبيوتر" يصبح جاهزاً للإنتاج

القفزة من 61.4% إلى 72.5% في اختبار OSWorld تتجاوز عتبة هامة. يصف المستخدمون "قدرة بمستوى بشري في مهام مثل التنقل في جداول البيانات المعقدة أو ملء نماذج الويب متعددة الخطوات."

تحسن Sonnet 4.6 أيضًا بشكل كبير في مقاومة حقن الأوامر (prompt injection resistance) لميزة استخدام الكمبيوتر — حيث يعمل بمستويات تضاهي Opus 4.6. هذا أمر بالغ الأهمية لأي وكيل يتصفح الويب أو يعالج مدخلات غير موثوقة.

4. التفكير الممتد + التفكير التكيفي (Extended Thinking + Adaptive Thinking)

كلاهما مدعوم، مما يسمح للنموذج بتخصيص المزيد من العمليات الحسابية للمشكلات الصعبة. ولكن من الملاحظ أن Sonnet 4.6 يؤدي بقوة حتى بدون تفعيل التفكير الممتد — فالنموذج الأساسي أفضل من حيث المبدأ.

5. ترقية الفئة المجانية

يحصل مستخدمو Claude المجانيون الآن على Sonnet 4.6 كنموذج افتراضي، بالإضافة إلى:

إمكانيات إنشاء الملفات.

الموصلات (التكامل مع البيانات الخارجية).

المهارات (تعليمات قابلة لإعادة الاستخدام).

ميزة context compaction.

تعتبر هذه الفئة المجانية للذكاء الاصطناعي هي الأكثر قدرة حالياً بين جميع المزودين الرئيسيين.

6. موصلات MCP في Excel

يدعم Claude في Excel الآن موصلات لـ S&P Global و LSEG و Daloopa و PitchBook و Moody's و FactSet — مما يتيح سحب البيانات المالية الحية مباشرة إلى جداول البيانات.

الأسعار

لا يوجد تغيير في السعر عن Sonnet 4.5:

الخطة	السعر
claude.ai المجانية	0 دولار (Sonnet 4.6 افتراضي، مع حدود للاستخدام)
claude.ai Pro	20 دولار شهرياً (حدود أعلى، وصول لنموذج Opus)
API مدخلات	3 دولار لكل مليون token
API مخرجات	15 دولار لكل مليون token

للمقارنة:

Opus 4.6 API: يبلغ 15 دولار / 75 دولار لكل مليون token (أغلى بـ 5 مرات).

GPT-5.2 API: يبلغ 5 دولار / 15 دولار لكل مليون token (أغلى بـ 1.7 مرة في المدخلات).

Gemini 3 Pro API: يبلغ 7 دولار / 21 دولار لكل مليون token (أغلى بـ 2.3 مرة في المدخلات).

التكلفة لكل جلسة Claude Code

لجلسة برمجة نموجية (100 ألف token مدخلات + 20 ألف token مخرجات):

النموذج	التكلفة لكل جلسة
Sonnet 4.6	0.60 دولار
GPT-5.2	0.80 دولار
Opus 4.6	3.00 دولار

يوفر الفريق الذي يقوم بـ 100 جلسة وكيل يوميًا حوالي 240 دولارًا يوميًا باستخدام Sonnet 4.6 بدلاً من Opus.

كيفية الوصول للنموذج

claude.ai

هو النموذج الافتراضي بالفعل. افتح claude.ai ← أنت تستخدم Sonnet 4.6.

Claude Code

bash

claude  # أصبح Sonnet 4.6 هو الافتراضي الآن
claude --model claude-sonnet-4-6-20250217  # اختيار النموذج صراحة

API

معرف النموذج (Model ID): claude-sonnet-4-6-20250217

python

import anthropic

client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-sonnet-4-6-20250217",
    max_tokens=4096,
    messages=[{"role": "user", "content": "Your prompt here"}]
)

المنصات السحابية

متوفر على Amazon Bedrock و Google Cloud Vertex AI منذ اليوم الأول.

سياق الصناعة

يعد Sonnet 4.6 ثاني إصدار رئيسي لـ Anthropic في غضون 11 يومًا (بعد Opus 4.6 في 6 فبراير). وصفت CNBC هذه الوتيرة بأنها "استمرار للسرعة الفائقة في إصدارات نماذج الذكاء الاصطناعي." بينما وصفتها VentureBeat بأنها "حدث زلزالي في إعادة تسعير صناعة الذكاء الاصطناعي."

الاتجاه العام: الحد الأدنى للأداء في ارتفاع مستمر. فما كان يتطلب نموذجاً رائدًا بتكلفة 15 دولار / 75 دولار قبل ستة أشهر، أصبح متاحاً الآن بسعر 3 دولار / 15 دولار. بالنسبة لمطوري منتجات الذكاء الاصطناعي، هذا يعني:

تشغيل ميزات الذكاء الاصطناعي بتكلفة أقل بـ 5 مرات.
وكلاء استخدام الكمبيوتر أصبحوا مجديين اقتصاديًا على نطاق واسع.
لم يعد النموذج هو العائق — العائق الآن هو سرعة التنفيذ والإنتاج.

هل تبني مشروعك باستخدام Claude Sonnet 4.6؟ يتكامل Y Build مع Claude Code للتطوير بمساعدة الذكاء الاصطناعي، ثم يتولى عمليات النشر (deployment)، وفيديوهات منتجات Demo Cut، وتحسين محركات البحث بالذكاء الاصطناعي (AI SEO)، والتحليلات — الدورة الكاملة من الكود إلى النمو. ابدأ مجاناً.

المصادر: