غوغل تطلق Gemini-SQL2: قدرة Gemini 3.1 Pro على تحويل النص إلى

Cybersecurity Arab

حقق النظام الجديد دقة تنفيذ بلغت 80.04% في قائمة BIRD للنصوص إلى SQL (النموذج الفردي)، متفوقًا بذلك على نظام Gemini-SQL السابق، الذي كان يحتل المركز الأول.

Google Releases Gemini-SQL2: Gemini 3.1 Pro Text-to-SQL Scores 80.04% on BIRD Single-Model Leaderboard

ما هو نظام Gemini-SQL2؟

Gemini-SQL2 ليس نموذجًا مستقلاً، بل هو قدرة متخصصة في تحويل الأسئلة المكتوبة باللغة الطبيعية إلى استعلامات SQL جاهزة للتنفيذ. يعتمد النظام على نموذج Gemini 3.1 Pro، ويهدف إلى معالجة التحديات المتعلقة بتعقيدات البيانات والسياقات التجارية المعقدة عند تحويل النصوص إلى SQL.

"إن الدقة في فهم البيانات والسياقات التجارية المعقدة تجعل من الصعب للغاية تحويل الأسئلة الطبيعية إلى استعلامات SQL دقيقة."

وأشار الإعلان إلى أن تحسين فهم SQL يمكن أن يعزز مهارات اللغة الطبيعية عبر خدمات غوغل للبيانات، مثل BigQuery Studio وAlloyDB AI وCloud SQL Studio، التي تدعم بالفعل توليد SQL بناءً على نموذج Gemini.

صورة توضيحية من المقال
صورة توضيحية من المقال

ما هو معيار BIRD؟

BIRD (BIg Bench for LaRge-scale Database Grounded Text-to-SQL Evaluation) هو معيار صناعي رائد لتقييم قدرة الأنظمة على تحويل النصوص إلى SQL. يتضمن المعيار 12,751 زوجًا من الأسئلة والاستعلامات SQL عبر 95 قاعدة بيانات تغطي 37 مجالًا مهنيًا، بإجمالي حجم 33.4 جيجابايت. تتميز قواعد البيانات في BIRD بقيم فوضوية تتطلب معرفة خارجية، على عكس المعايير القديمة مثل Spider.

يقيس BIRD الدقة بناءً على التنفيذ (EX): يجب أن يعمل الاستعلام SQLGenerated ويعيد النتائج المطابقة للاستعلام المرجعي. أوضح غوغل ذلك بقوله:

صورة توضيحية من المقال
"وفقًا لمعيار BIRD، الذي يقيس الدقة المدققة بالتفيذ، فإن استعلامات SQL الخاصة بـ GeminiSQL-2 لا تبدو صحيحة فحسب، بل تعمل بنجاح أيضًا."

ينتمي Gemini-SQL2 إلى مسار النموذج المدرب الفردي، الذي يقيد استخدام المعالجة المسبقة أو استرجاع البيانات أو الأطر الذكية التي تعتمد عليها ensembles لتحسين الدرجات. ويهدف إلى قياس القدرة الأساسية للنموذج على تحويل النصوص إلى SQL.

أرقام قياسية مقارنة

سجل غوغل سابقًا 76.13% في هذا المسار في 15 نوفمبر 2025، بينما تصل الدقة البشرية إلى 92.96%، مما يترك فجوة قدرها 12.92 نقطة عن أداء Gemini-SQL2.

صورة توضيحية
صورة توضيحية

كيف يتصدر Gemini-SQL2 قائمة BIRD؟

أظهر الرسم البياني الذي نشره غوغل على منصة إكس أن Gemini-SQL2 يتصدر ثمانية منافسين محددين، بالإضافة إلى نقاط أخرى غير محددة. ويشير الموقع إلى أن Gemini-SQL2 وGemini-SQL يحتلان المركزين الأول والثاني بين الأنظمة المسماة، بينما تحتل عدة نماذج SQL المتخصصة بحجم 32 مليار معلمة مواقع متقدمة على بعض النماذج العامة الرائدة.

أمثلة استخدام عملية

التحليلات الذاتية

يمكن لمدير الإيرادات طرح سؤال مثل: "ما هو إجمالي الإيرادات الشهرية المتكررة حسب المنطقة، لحسابات توقفت عن الاشتراك خلال 90 يومًا من الترقية؟" يتطلب هذا الاستعلام استخدام عمليات الانضمام والمنطق النافذ وحساب التواريخ. تكمن أهمية الدقة في التنفيذ في أن النظام يكتشف الاستعلامات التي تعمل لكنها تعيد صفوفًا خاطئة.

مسودات هندسة البيانات

يمكن للمطورين كتابة مسودات تحويلات BigQuery من اللغة الإنجليزية، ثم مراجعتها بدلاً من كتابتها من الصفر. حددت أبحاث غوغل في نوفمبر 2025 أن فهم مخطط البيانات هو الجزء الأصعب، وتعكس الدرجات العالية في BIRD قدرة أفضل على التعامل مع الأعمدة الغامضة والقيم الفوضوية.

ميزات "اسأل بياناتك" المضمنة

لا تزال الفرق العاملة في SaaS بحاجة إلى مراجعة بشرية عند استخدام واجهات استعلام باللغة الطبيعية، حتى مع دقة 80%. قد تكون واحدة من كل خمس استعلامات خاطئة، لذا فإن الدقة لا تلغي الحاجة إلى المراجعة، بل تضع توقعات واضحة.

نمط التنفيذ في الإنتاج

لم تنشر غوغل بعد سلسلة نماذج Gemini-SQL2 أو واجهة برمجة التطبيقات الخاصة بها. يعمل النمط التالي القائم على مخطط البيانات مع نماذج Gemini الحالية عبر مكتبة google-genai SDK. يمكن استبدال سلسلة النموذج عند إطلاق Gemini-SQL2 رسميًا.

يجب على الأنظمة الإنتاجية إضافة تحقق من التنفيذ: تشغيل الاستعلام SQL، التقاط الأخطاء، وإعادة المحاولة مع إضافة رسالة الخطأ. يحاكي هذا Loop ما يكافئ عليه مقياس الدقة في BIRD.

ملخص الإنجازات

أعلن غوغل أن Gemini-SQL2 حقق دقة تنفيذ بلغت 80.04% في قائمة BIRD للنموذج الفردي، مدعومًا بنموذج Gemini 3.1 Pro، ويستهدف توليد SQL جاهز للتنفيذ وليس مجرد استعلامات تبدو صحيحة. يحتل Gemini-SQL2 وGemini-SQL المركزين الأول والثاني في الرسم البياني لغوغل، بينما تصل الدقة البشرية إلى 92.96%. لم تصدر غوغل بعد تفاصيل حول واجهة برمجة التطبيقات أو البطاقة الفنية أو تكامل المنتجات.

إرسال تعليق