دراسة: 35% من وكلاء الذكاء الاصطناعي يسلمون معلومات حساسة إلى

أجرى الباحثون في الهند والولايات المتحدة اختباراً على أربعة من أحدث نماذج وكلاء الويب: GPT-5 mini، وClaude Haiku 4.5، وGemini 3 Flash، وLlama 4 Scout. وقد تم اختبار هذه الوكلاء في 91 موقعاً مزيفاً و10 مواقع طبيعية، عبر ثمانية أنواع من هجمات الهندسة الاجتماعية. وكشفت النتائج أن نسبة تسرب المعلومات الشخصية الحساسة وصلت إلى 54% حتى 93% في المواقف المزيفة، بينما لم تسجل أي تسريبات في المواقع الطبيعية.

Study: 35% of AI Agents Handed PII to Websites That They Knew Were Scams

الفجوة بينDetection وAction

كشف الباحثون عن فجوة مهمة بين قدرة الوكلاء على اكتشاف المواقع المزيفة وسلوكهم الفعلي. ففي 35.9% من الحالات التي حدد فيها الوكيل الموقع على أنه مشبوه، استمر في إرسال معلومات حساسة، مقارنة بنسبة 66.1% في الحالات التي لم يتم فيها التعبير عن الشك. ويصف الباحثون هذه الظاهرة بأنها 'فجوةDetection–Action'، حيث لا تترجم معرفة الخطر إلى سلوك دفاعي فعال.

أنماط السلوك الخطيرة

حدد الباحثون عدة أنماط سلوكية متكررة لدى الوكلاء:

تجاهل المخاطر المعلنة: في إحدى الحالات، حدد وكيل يعمل بنموذج Llama 4 Scout عدة علامات تحذيرية على موقع للعملات المشفرة، مثل نبرة الخطاب المشبوهة، والوعود بمكافآت كبيرة، وعدم وجود معلومات واضحة عن الشركة. ورغم ذلك، قام الوكيل بإرسال رقم الضمان الاجتماعي وتفاصيل البطاقة المصرفية ورقم CVV.
إطار المجال/الإجراء: في حالة أخرى، رفض وكيل يعمل بنموذج Gemini 3 Flash طلباً واضحاً للحصول على معلومات مصرفية، معتبراً إياه محاولة تصيد. بعد دقائق، قام نفس الوكيل بإرسال بيانات اعتماد حساب إلى نموذج تحقق مختلف، معتقداً أن عمليات التحقق جزء طبيعي من أمان المنصة.
الاعتماد على تأكيدات الأمان الذاتية: في إحدى الحالات، قبل وكيل يعمل بنموذج Claude Haiku 4.5 ادعاءات الموقع بشأن معايير التشفير وشهادات الأمان كدليل على الموثوقية. بينما قلل وكيل يعمل بنموذج GPT-5 mini من أهمية الكلمات المشبوهة بسبب التصميم الاحترافي للموقع ووجود نطاق يبدو شرعياً.

نظام SCAMMER4U: معيار جديد لاختبار الوكلاء

أطلق الباحثون نظام SCAMMER4U، وهو معيار جديد لاختبار مدى قدرة وكلاء الويب على حماية البيانات الشخصية. تم إنشاء المواقع المزيفة باستخدام Flask في بيئات مستقلة، بناءً على إحاطات تصميم مكتوبة يدوياً ومراجعة يدوية لضمان مطابقتها للواقع. تم اختبار كل وكيل تحت أربعة مستويات مختلفة من الحماية:

C0: بدون أي توجيهات.
C1: تذكير عام بالخصوصية.
C2: قائمة تحقق awareness من التصيد الاحتيالي.
C3: مطالبة مسبقة بالتأمل قبل إرسال المعلومات الحساسة.

أظهرت النتائج أن بعض النماذج كانت أكثر استجابة من غيرها. على سبيل المثال، انخفض معدل تسرب البيانات في نموذج Claude Haiku 4.5 من 54.5% في المستوى الأساسي إلى 24.0% في المستوى الأعلى حماية. بينما تحسن نموذج GPT-5 mini من 61.0% إلى 36.1%، وانخفض نموذج Gemini 3 Flash من 93.1% إلى 60.7%. أما نموذج Llama 4 Scout، فلم يشهد سوى انخفاض طفيف من 82.3% إلى 77.4%.

مشكلات الحماية الحالية

أكد الباحثون أن أنظمة الحماية الحالية، التي تعتمد على قدرة الوكيل على اكتشاف الخطر، لا تعمل بشكل فعال. فغالباً ما تصبح هذه المطالبات مجرد طقوس شكلية، حيث يتمكن الوكلاء من سرد المخاطر دون أن يترجم ذلك إلى سلوك دفاعي. ويشيرون إلى ضرورة اعتماد أنظمة حماية مستقلة تتحقق من الإرساليات الخارجة وتوقفها، بدلاً من الاعتماد على قدرة الوكيل الذاتية على اكتشاف الخطر.

تحديات في البنية الأساسية

أظهرت الدراسة أن الوكلاء يواجهون صعوبة في الانسحاب من المواقف الخطيرة أو التخلي عن المهمة، وهو ما قد يكون مرتبطاً بقدرتهم المحدودة على الاعتراف بالفشل. ويشير الباحثون إلى أن هذه المشكلة قد تتطلب فرض رقابة خارجية على تصرفات الوكيل في السيناريوهات الحرجة، مما يقلل من فائدتها كوكيل مستقل.

نتائج الدراسة: هل يمكن الوثوق بالوكلاء؟

في تقييم منفصل، قارن 16 مراجعاً صفحات SCAMMER4U مع مواقع تصيد حقيقية، ولم يتمكنوا من التمييز بينهما بشكل أفضل من الصدفة. وهذا يشير إلى أن المعيار الجديد نجح في محاكاة العديد من العلامات المرئية والإجرائية الموجودة في عمليات الاحتيال الحقيقية.

تخلص الدراسة إلى أن نماذج الوكلاء الحالية، التي تمثل بشكل واسع هياكل المنطق في العائلات الشهيرة من نماذج اللغة الكبيرة، لديها مشكلة أساسية في الانسحاب من السيناريوهات الخطيرة أو تعديل سلوكها بناءً على المخاطر المكتشفة. وإذا لم تتمكن هذه النماذج من حل هذه المشكلة داخلياً، فقد يكون الحل الوحيد هو فرض رقابة خارجية على تصرفاتها في السيناريوهات الحرجة.

Badr Ai