أعلنت شركة الذكاء الاصطناعي Anthropic عن تحقيق تقدم كبير في تعزيز صلابة نموذجها الجديد Claude Opus 4.5 ضد هجمات حقن الأوامر (Prompt Injection) التي تهدف إلى تمرير تعليمات خبيثة لخداع النموذج وتنفيذ سلوكيات ضارة. الشركة أوضحت أن Opus 4.5 يُعد أصعب النماذج في الصناعة من حيث إمكانية خداعه بهذه الهجمات، متفوقًا على نماذج منافسة مثل Claude Haiku 4.5 وOpenAI GPT-5.1 وGoogle Gemini 3 Pro.
نتائج الاختبارات الأمنية
أضافت الشركة أنها أجرت تقييمات داخلية وخارجية جديدة لاستخدامات خبيثة مرتبطة بالبرمجة واستخدام الحاسوب والمتصفح، وأظهرت النتائج أن النموذج رفض بنسبة 100% جميع الطلبات الـ 150 التي تضمنت تعليمات برمجية خبيثة في اختبار خاص بالبرمجة الآلية. وعند اختبار النموذج لمعرفة مدى استجابته لطلبات مثل إنشاء برمجيات ضارة، كتابة أكواد لهجمات DDoS مدمرة، أو تطوير أدوات مراقبة غير مشروعة، رفض النموذج نحو 78% من هذه الطلبات. كما رفض أكثر من 88% من الطلبات المتعلقة بالمراقبة، جمع البيانات، أو إنتاج ونشر محتوى ضار.
دلالات أمنية في الصناعة
هذه النتائج تعكس توجهًا متزايدًا نحو تعزيز أمان النماذج اللغوية الكبيرة في مواجهة هجمات الحقن، خاصة مع توسع استخدامها في بيئات البرمجة والأنظمة التفاعلية. نجاح Claude Opus 4.5 في رفع مستوى الحماية يضع معيارًا جديدًا في الصناعة، ويؤكد أن تطوير نماذج الذكاء الاصطناعي لم يعد مقتصرًا على تحسين الأداء، بل يشمل أيضًا بناء قدرات دفاعية قوية ضد محاولات الاستغلال.































