Gemini 3.1 Pro API: دليل المطور مع أمثلة أكواد (2026)
دليل المطور الشامل لـ Gemini 3.1 Pro API. يغطي معرفات النماذج (gemini-3.1-pro-preview-customtools) والأسعار وأمثلة الأكواد بـ Python وJavaScript والأدوات المخصصة واستدعاء الدوال وكيفية التكامل مع تطبيقك.
ملخص سريع
| Gemini 3.1 Pro | |
|---|---|
| معرفات النموذج | gemini-3.1-pro، gemini-3.1-pro-preview-customtools |
| نافذة السياق | مليون رمز |
| سعر الإدخال | $2/مليون رمز |
| سعر الإخراج | $12/مليون رمز |
| الميزات الرئيسية | أدوات مخصصة، استدعاء الدوال، التأريض، متعدد الوسائط (نص + صورة + صوت + فيديو) |
| واجهة API | Google AI Studio / Vertex AI |
Gemini 3.1 Pro هو أحدث نموذج حدودي من Google، صدر في مارس 2026. إنه أرخص واجهة API حدودية لكل رمز، لديه سياق أصلي بمليون رمز، ويقدم الأدوات المخصصة — طريقة جديدة لمنح النموذج وصولاً لدوال خارجية بمخططات منظمة.
معرفات النموذج
تقدم Google نوعين من Gemini 3.1 Pro:
| معرف النموذج | الوصف | الحالة |
|---|---|---|
gemini-3.1-pro | إصدار مستقر، متاح للعموم | GA |
gemini-3.1-pro-preview-customtools | معاينة بدعم محسن للأدوات المخصصة | Preview |
متغير customtools المعاينة لديه موثوقية محسنة لسلاسل استدعاء الدوال المعقدة — استخدمه إذا كان تطبيقك يعتمد بشكل كبير على استدعاء الأدوات. للاستخدام العام، يُنصح بالمستقر gemini-3.1-pro.
# Google AI Studio
model = "gemini-3.1-pro"
# Vertex AI
model = "gemini-3.1-pro@001"
البدء السريع: Python
التثبيت
pip install google-genai
توليد النص الأساسي
from google import genai
client = genai.Client(api_key="YOUR_API_KEY")
response = client.models.generate_content(
model="gemini-3.1-pro",
contents="Explain quantum computing in 3 sentences."
)
print(response.text)
البث
for chunk in client.models.generate_content_stream(
model="gemini-3.1-pro",
contents="Write a Python function to merge two sorted arrays."
):
print(chunk.text, end="")
البدء السريع: JavaScript
التثبيت
npm install @google/genai
توليد النص الأساسي
import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({ apiKey: "YOUR_API_KEY" });
const response = await ai.models.generateContent({
model: "gemini-3.1-pro",
contents: "Explain quantum computing in 3 sentences.",
});
console.log(response.text);
البث
const stream = await ai.models.generateContentStream({
model: "gemini-3.1-pro",
contents: "Write a JavaScript function to merge two sorted arrays.",
});
for await (const chunk of stream) {
process.stdout.write(chunk.text);
}
Be first to build with AI
Y Build is the AI-era operating system for startups. Join the waitlist and get early access.
الأسعار
Gemini 3.1 Pro هو أرخص واجهة API لنموذج حدودي حتى مارس 2026.
| Gemini 3.1 Pro | GPT-5.2 | Claude Sonnet 4.6 | |
|---|---|---|---|
| الإدخال | $2/مليون | $5/مليون | $3/مليون |
| الإخراج | $12/مليون | $15/مليون | $15/مليون |
| السياق | مليون | 400K | مليون (تجريبي) |
| التكلفة لكل 100K إدخال + 20K إخراج | $0.44 | $0.80 | $0.60 |
على نطاق واسع، Gemini 3.1 Pro يكلف تقريباً 45% أقل من GPT-5.2 و27% أقل من Sonnet 4.6 لكل جلسة.
الطبقة المجانية
Google AI Studio تقدم طبقة مجانية:
- 60 طلب في الدقيقة
- مليون رمز في الدقيقة
- لا حاجة لبطاقة ائتمان
هذه أسخى طبقة مجانية لواجهة API بين المزودين الثلاثة الرئيسيين.
الميزات الرئيسية
نافذة سياق مليون رمز
Gemini 3.1 Pro يدعم أصلياً مليون رمز من السياق — كافية لـ:
- ~700,000 كلمة نص
- ~30,000 سطر كود
- ~ساعة واحدة من الفيديو
- ~11 ساعة من الصوت
على عكس النماذج المنافسة التي تقدم السياق الممتد كميزة تجريبية، سياق Gemini بمليون رمز متاح للعموم بالكامل وبنفس السعر كالسياق القياسي.
الأدوات المخصصة (استدعاء الدوال)
تتيح لك الأدوات المخصصة تعريف دوال خارجية يمكن لـ Gemini استدعاؤها أثناء التوليد. يقرر النموذج متى يستدعي أداة، ويهيكل المعاملات، ويدمج النتيجة في استجابته.
هذا ما تم تحسين متغير gemini-3.1-pro-preview-customtools من أجله.
التأريض بـ Google Search
يمكن لـ Gemini تأريض استجاباته بنتائج Google Search في الوقت الحقيقي. فعّل التأريض لتقليل الهلوسة وضمان استخدام النموذج لمعلومات حالية.
متعدد الوسائط أصلياً
معالجة النص والصور والصوت والفيديو في طلب واحد. لا حاجة لنماذج رؤية أو صوت منفصلة — Gemini يتعامل مع جميع الوسائط أصلياً.
مثال كود: الأدوات المخصصة / استدعاء الدوال
هذا المثال ينشئ أداة طقس يمكن لـ Gemini استدعاؤها للحصول على الأحوال الحالية.
Python
from google import genai
from google.genai import types
client = genai.Client(api_key="YOUR_API_KEY")
# Define the tool
weather_tool = types.Tool(
function_declarations=[
types.FunctionDeclaration(
name="get_weather",
description="Get the current weather for a city",
parameters=types.Schema(
type=types.Type.OBJECT,
properties={
"city": types.Schema(
type=types.Type.STRING,
description="City name, e.g. 'San Francisco'"
),
"unit": types.Schema(
type=types.Type.STRING,
enum=["celsius", "fahrenheit"],
description="Temperature unit"
),
},
required=["city"],
),
)
]
)
# Send request with tool
response = client.models.generate_content(
model="gemini-3.1-pro-preview-customtools",
contents="What's the weather like in Tokyo?",
config=types.GenerateContentConfig(
tools=[weather_tool],
),
)
# Check if the model wants to call a function
for part in response.candidates[0].content.parts:
if part.function_call:
print(f"Function: {part.function_call.name}")
print(f"Arguments: {part.function_call.args}")
# Output:
# Function: get_weather
# Arguments: {'city': 'Tokyo', 'unit': 'celsius'}
# In production, you'd call your actual weather API here,
# then send the result back to Gemini for a natural language response.
JavaScript
import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({ apiKey: "YOUR_API_KEY" });
const weatherTool = {
functionDeclarations: [
{
name: "get_weather",
description: "Get the current weather for a city",
parameters: {
type: "OBJECT",
properties: {
city: {
type: "STRING",
description: "City name, e.g. 'San Francisco'",
},
unit: {
type: "STRING",
enum: ["celsius", "fahrenheit"],
description: "Temperature unit",
},
},
required: ["city"],
},
},
],
};
const response = await ai.models.generateContent({
model: "gemini-3.1-pro-preview-customtools",
contents: "What's the weather like in Tokyo?",
config: {
tools: [weatherTool],
},
});
// Check for function calls in the response
for (const part of response.candidates[0].content.parts) {
if (part.functionCall) {
console.log(`Function: ${part.functionCall.name}`);
console.log(`Arguments:`, part.functionCall.args);
}
}
مثال كود: متعدد الوسائط (صورة + نص)
Python
from google import genai
from google.genai import types
import base64
client = genai.Client(api_key="YOUR_API_KEY")
# Read a local image
with open("screenshot.png", "rb") as f:
image_data = f.read()
response = client.models.generate_content(
model="gemini-3.1-pro",
contents=[
types.Content(
parts=[
types.Part(text="What's in this screenshot? Describe the UI elements."),
types.Part(
inline_data=types.Blob(
mime_type="image/png",
data=image_data,
)
),
]
)
],
)
print(response.text)
JavaScript
import { GoogleGenAI } from "@google/genai";
import fs from "fs";
const ai = new GoogleGenAI({ apiKey: "YOUR_API_KEY" });
const imageData = fs.readFileSync("screenshot.png");
const base64Image = imageData.toString("base64");
const response = await ai.models.generateContent({
model: "gemini-3.1-pro",
contents: [
{
parts: [
{ text: "What's in this screenshot? Describe the UI elements." },
{
inlineData: {
mimeType: "image/png",
data: base64Image,
},
},
],
},
],
});
console.log(response.text);
مقارنة واجهات API: Gemini 3.1 Pro مقابل GPT-5.2 مقابل Claude Sonnet 4.6
| الميزة | Gemini 3.1 Pro | GPT-5.2 | Claude Sonnet 4.6 |
|---|---|---|---|
| سعر الإدخال | $2/مليون | $5/مليون | $3/مليون |
| سعر الإخراج | $12/مليون | $15/مليون | $15/مليون |
| نافذة السياق | مليون (GA) | 400K | مليون (تجريبي) |
| استدعاء الدوال | نعم (أدوات مخصصة) | نعم | نعم (استخدام الأدوات) |
| متعدد الوسائط | نص + صورة + صوت + فيديو | نص + صورة + صوت | نص + صورة |
| التأريض | Google Search | تصفح الويب | لا تأريض أصلي |
| البث | نعم | نعم | نعم |
| واجهة Batch API | نعم | نعم | نعم |
| الطبقة المجانية | 60 طلب/دقيقة، مليون رمز/دقيقة | محدود | محدود |
| لغات SDK | Python، JS، Go، Dart، Swift | Python، JS | Python، JS |
| البرمجة (SWE-bench) | 76.8% | 80.0% | 79.6% |
| استخدام الكمبيوتر | غير متاح | 38.2% | 72.5% |
| الرياضيات (AIME) | ~88% | 100% | ~90% |
متى تختار كل واجهة API
اختر Gemini 3.1 Pro عندما:- التكلفة هي اهتمام أساسي (أرخص واجهة API حدودية)
- تحتاج معالجة فيديو أو صوت أصلية
- تحتاج سياق مليون رمز في الإنتاج (GA وليس تجريبي)
- تريد التأريض بـ Google Search
- تبني على Google Cloud
- الاستدلال الرياضي الثقيل ضروري
- أنت في نظام OpenAI
- تحتاج مخرجات منظمة بمخططات JSON مضمونة
- السرعة في الاستعلامات البسيطة هي الأهم
- البرمجة والمهام الوكيلية هي حالة الاستخدام الأساسية
- تحتاج استخدام الكمبيوتر / أتمتة المتصفح
- مهام إنتاجية المكتب (مستندات، جداول بيانات)
- مقاومة حقن الأوامر مهمة (سلامة الوكيل)
تكامل Gemini 3.1 Pro مع تطبيقك
الاستخدام مع Y Build
إذا كنت تبني منتجاً مع Y Build، يمكنك تكامل واجهة Gemini API مباشرة في الخلفية. مشاريع Y Build تُنشر على Cloudflare Workers، التي يمكنها استدعاء واجهة Gemini API بزمن استجابة منخفض.
// In a Y Build project (Cloudflare Worker)
export async function onRequest(context) {
const response = await fetch(
"https://generativelanguage.googleapis.com/v1beta/models/gemini-3.1-pro:generateContent",
{
method: "POST",
headers: {
"Content-Type": "application/json",
"x-goog-api-key": context.env.GEMINI_API_KEY,
},
body: JSON.stringify({
contents: [{ parts: [{ text: "Your prompt here" }] }],
}),
}
);
const data = await response.json();
return new Response(JSON.stringify(data));
}
حدود المعدل
| الطبقة | الطلبات/دقيقة | الرموز/دقيقة |
|---|---|---|
| مجاني | 60 | 1,000,000 |
| الدفع حسب الاستخدام | 1,000 | 4,000,000 |
| Enterprise | مخصص | مخصص |
الأسئلة الشائعة
ما هو gemini-3.1-pro-preview-customtools؟
إنه متغير معاينة من Gemini 3.1 Pro محسن للأدوات المخصصة واستدعاء الدوال. لديه موثوقية محسنة عندما يحتاج النموذج لسلسلة استدعاءات أدوات متعددة معاً. استخدمه إذا كان تطبيقك يعتمد بشكل كبير على استدعاء الدوال. لتوليد النص العام، استخدم معرف النموذج المستقر gemini-3.1-pro.
هل Gemini 3.1 Pro أفضل من GPT-5.2؟
يعتمد على المهمة. Gemini 3.1 Pro أرخص ولديه نافذة سياق أكبر ويدعم وسائط أكثر (فيديو، صوت). GPT-5.2 يحقق نتائج أعلى في معايير البرمجة والاستدلال الرياضي. لتطبيقات متعددة الوسائط بميزانية، Gemini يفوز. لمهام الاستدلال البحت، GPT-5.2 يتقدم.
كيف يقارن Gemini 3.1 Pro مع Claude Sonnet 4.6؟
Gemini أرخص ($2/$12 مقابل $3/$15 لكل مليون رمز) ولديه دعم أصلي للفيديو/الصوت. Claude Sonnet 4.6 أفضل في البرمجة (79.6% مقابل 76.8% في SWE-bench)، واستخدام الكمبيوتر (72.5% مقابل غير متاح)، ومهام المكتب. اختر Gemini للوسائط المتعددة والتكلفة. اختر Claude للبرمجة والوكلاء.
هل يمكنني استخدام Gemini 3.1 Pro مجاناً؟
نعم. Google AI Studio توفر طبقة مجانية بـ 60 طلب في الدقيقة ومليون رمز في الدقيقة. لا حاجة لبطاقة ائتمان. هذا كافٍ للتطوير والاختبار وتطبيقات الإنتاج منخفضة الحركة.
ما الفرق بين Google AI Studio وVertex AI؟
Google AI Studio هي واجهة API الأبسط الموجهة للمطورين — سجل بمفتاح API وابدأ في إجراء الاستدعاءات. Vertex AI هي منصة المؤسسات — تعمل على Google Cloud، وتقدم الضبط الدقيق ونشر النماذج والمراقبة واتفاقيات مستوى الخدمة. نفس النموذج، أغلفة مختلفة. ابدأ بـ AI Studio، وانتقل إلى Vertex AI عندما تحتاج ميزات المؤسسات.
الخلاصة
Gemini 3.1 Pro هو أفضل قيمة لواجهة API حدودية في مارس 2026. بسعر $2/$12 لكل مليون رمز، يكلف تقريباً نصف تكلفة GPT-5.2 وثلث أقل من Claude Sonnet 4.6 — مع سياق أصلي بمليون رمز وأوسع دعم للوسائط المتعددة.
للمطورين الذين يبنون منتجات مدعومة بالذكاء الاصطناعي، النصيحة العملية هي: استخدم Gemini للوسائط المتعددة والمهام الحساسة للتكلفة، وClaude للبرمجة والوكلاء، وGPT-5.2 للاستدلال الرياضي الثقيل. توجيه النماذج عبر الثلاثة يعطيك أفضل ما في كل منها.
تبني منتجاً مدعوماً بالذكاء الاصطناعي؟ Y Build يتعامل مع المجموعة الكاملة — برمجة بمساعدة الذكاء الاصطناعي، نشر بنقرة واحدة على Cloudflare، Demo Cut لمقاطع فيديو المنتج، سيو بالذكاء الاصطناعي، وتحليلات. ادمج واجهات Gemini أو Claude أو GPT API في تطبيقك وأطلق في ساعات. ابدأ مجاناً.
المصادر:
Be first to build with AI
Y Build is the AI-era operating system for startups. Join the waitlist and get early access.