الإثنين، 24 نوفمبر 2025

06:36 م

لغة غير متوقعة تتفوق على الإنجليزية والصينية في اختبارات الذكاء الاصطناعي الحديثة

الذكاء الاصطناعي

الذكاء الاصطناعي

ياسين عبد العزيز

A A

كشفت دراسة أكاديمية حديثة عن نتيجة غير متوقعة في عالم الذكاء الاصطناعي متعدد اللغات، إذ أثبتت اختبارات سياقية طويلة أن أداء النماذج اللغوية لا يعتمد فقط على حجم البيانات أو شهرة اللغة، بل يتأثر بصورة جوهرية بأسلوب الكتابة ونظام التقسيم النصي، وهو ما أدى إلى صعود لغة لم تكن في الحسبان إلى قمة الترتيب، فقد أظهرت الدراسة، التي جاءت ضمن ورقة بحثية منشورة في مؤتمر COLM 2025، أن اللغة البولندية حققت تفوقًا واضحًا على لغات عالمية كبرى مثل الإنجليزية والصينية، لتعيد رسم فهم الباحثين لكفاءة النماذج في معالجة المستندات الممتدة وإدارة النوافذ السياقية الواسعة.

أداء مفاجئ

ووفق المعايير التي استخدمها الباحثون في إطار منظومة OneRuler، شملت الاختبارات 26 لغة من أنظمة كتابية متعددة، وهدفت إلى قياس قدرة النماذج على الاسترجاع والدمج ضمن سياقات طويلة تمتد حتى 64 ألف رمز وأكثر. 

وقد أظهر الرسم البياني في الصفحة السادسة من الدراسة أن اللغة البولندية سجلت متوسط دقة بلغ 88% عند الحدود العليا للسياق، بينما تراجعت الإنجليزية إلى المركز السادس، في مفارقة لم تكن متوقعة للغة تعد الأكثر استخدامًا في التدريب والاختبارات، في حين جاءت الصينية ضمن أضعف أربع لغات، ما يسلط الضوء على تأثير المنظومة الكتابية على معالجة النماذج للنصوص الطويلة.

فجوة لغوية

وتشير النتائج إلى أن الفروق بين اللغات لا ترتبط مباشرة بحجم البيانات التي تعلّم عليها النموذج، وإنما تعتمد بدرجة أكبر على كفاءة أسلوب التقسيم النصي، فاللغات اللاتينية مثل البولندية والفرنسية والإسبانية استفادت من بساطة نظامها الكتابي، بينما تراجع أداء لغات ذات بنية كتابية معقدة مثل الصينية والكورية والتاميلية، خاصة عند زيادة طول السلسلة. 

وقد اتضح أن اتساع السياق يضاعف هذا التفاوت، إذ ارتفع الفارق بين أعلى وأدنى نتائج من 11% عند سياق 8 آلاف رمز إلى 34% عند بلوغ 128 ألف رمز، ما يعني أن اتساع النطاق يكشف ضعفًا كان مخفيًا ضمن السياقات القصيرة.

حساسية التعليمات

كما توضح الدراسة أن أداء النماذج يتأثر بدرجة لافتة بكيفية صياغة التعليمات، إذ انخفض أداء الإنجليزية بنسبة 32% عند طول سياق بلغ 128 ألف رمز بمجرد السماح للنموذج بالإجابة بكلمة “none” في حال غياب النص الصحيح، وهو ما يعكس حساسية النماذج للبنية التوجيهية، ويشير إلى أن دقة النتائج لا تعتمد على قوة اللغة فقط، بل تتأثر أيضًا باختيارات تصميم التجربة. 

وتعيد هذه النتائج طرح سؤال مهم حول مدى اعتماد الباحثين على الإنجليزية باعتبارها اللغة المعيارية في الاختبارات، فالدراسة تثبت أن تفوقها ليس مضمونًا دائمًا، وأن تجاهل الهياكل اللغوية المختلفة قد يقود إلى استنتاجات بعيدة عن الواقع الفعلي لأداء النماذج.

وتخلص الورقة إلى أن تقييم القدرات السياقية الطويلة لا يمكن اختزاله في أداء الإنجليزية وحدها، لأن المستندات كلما ازدادت طولًا ظهرت تأثيرات جديدة للغات لم تكن في دائرة المنافسة. 

كما تؤكد أن الأنظمة الكتابية المعقدة تفرض تحديات حقيقية على النماذج الحديثة، وأن تجاهل تلك الفوارق قد يؤدي إلى رؤى بحثية منقوصة، الأمر الذي يدفع المتخصصين لإعادة التفكير في تصميم المعايير واعتماد مقاييس أكثر شمولًا تأخذ في الاعتبار جميع الأنظمة اللغوية بدل التركيز على اللغة الأكثر انتشارًا فقط.

Short URL
استطلاع رأى

هل يتراجع عدد عملاء CIB خلال الفترة المقبلة بعد زيادة أسعار رسوم التحويل والخدمات؟

  • نعم

  • لا

  • غير مهتم

search

أكثر الكلمات انتشاراً