جروك 4 يتصدر اختبارات الذكاء رغم الانتقادات الأمنية

جروك 4

ياسين عبد العزيز

A A

تفوّق نموذج "جروك 4" من شركة xAI على أبرز منافسيه في تصنيفات الذكاء الاصطناعي، وحقق نتائج متقدمة تجاوزت النماذج الصينية والأمريكية، رغم استمرار التحذيرات المتعلقة بمستوى الأمان والرقابة على محتوى مخرجاته، ويأتي ذلك بالتزامن مع تصاعد الاهتمام العالمي بتقييم النماذج التوليدية وقدراتها في سياقات متعددة.

نتائج متقدمة

سجل "جروك 4" المرتبة الثالثة في تقييم منصة LMArena، ونافس بذلك مباشرة نماذج معروفة مثل "GPT-4.5" من OpenAI و"o3" و"o4"، بينما حل نموذج "Gemini 2.5 Pro" من جوجل في المركز الأول، وجاء النموذجان "ديب سيك" و"كلاود" في مراتب أقل رغم شهرتهما في السوق الآسيوية والأمريكية.

ويعتمد تصنيف LMArena على اختبارات عمياء في مجالات متنوعة، تشمل البرمجة، والتحليل المنطقي، وفهم النصوص، وحل المسائل الرياضية، ما يمنح المؤشرات مصداقية لدى المطورين والمستخدمين المتقدمين.

ورغم الانتقادات السابقة التي وُجهت للمنصة بخصوص تحيّزها ضد النماذج مفتوحة المصدر، لا تزال تحتفظ بمكانة مرجعية في القطاع، وشارك فيها آلاف المستخدمين الذين خضعوا لاختبارات موجهة دون معرفة هوية النموذج الذي يجيب.

مشاكل أمان

أثارت نتائج "جروك 4" جدلًا واسعًا، خصوصًا بعد تقارير عدة تحدثت عن قدرته على توليد ردود وصفها بعض المستخدمين بالمزعجة عند التفاعل معه في مواقف حساسة.

وأشار مختبر xAI إلى أن الاختبارات شملت نسخة محددة هي "grok-4-0709"، وهي نسخة واجهة برمجة التطبيقات فقط، أي أن الأداء الكامل للنموذج لم يُختبر علنًا بعد.

وأوضحت الشركة أنها بدأت فعليًا في تنفيذ إصلاحات تتعلق بفلترة الردود وتعزيز أنظمة المراجعة الداخلية، من خلال تقنيات رقابة جديدة تهدف لمنع استخدام النموذج في سياقات تنتهك القواعد العامة أو تُنتج مخرجات ضارة.

نموذج غير منقح

يُعد "جروك 4" مختلفًا في فلسفته عن النماذج الأخرى، إذ تعتمد شركة xAI سياسة "الإجابات غير المنقحة"، وهي سمة يرى البعض أنها تقدم شفافية وجاذبية للمستخدمين المتقدمين والباحثين، لكنها في الوقت نفسه تُعرّض المستخدمين لخطر المحتوى غير الآمن أو غير المناسب في بعض الحالات.

ويحذر مراقبون من أن تجاهل الضوابط الصارمة قد يضع الشركة تحت ضغوط تنظيمية في حال توسع انتشار النموذج، خصوصًا في بيئات تعتمد قواعد صارمة لحماية المستخدمين من المحتوى غير المفلتر.

من جهة أخرى، يرى بعض المبرمجين والمختبرين أن وجود نموذج قادر على توليد إجابات بدون تصفية يُمكّنهم من استخدامه في أبحاث أكثر دقة، ويُسهل تحليل سلوك النماذج مقارنة بما هو متاح في النماذج الأخرى.

وتشير هذه التطورات إلى أن السوق مقبل على تنافس من نوع جديد، لا يُقاس فقط بمستوى الذكاء أو عدد المهام التي يؤديها النموذج، بل بقدرة الشركات على تحقيق التوازن بين الكفاءة التقنية والسلامة الرقمية، وهو ما يبدو أن xAI بدأت تدركه في الوقت المناسب.

xAI مخاوف الأمان جروك 4 نماذج الذكاء LMArena