الأحد، 28 سبتمبر 2025

06:07 م

tru

Manzano.. نموذج ذكاء اصطناعي جديد لفهم الصور وتوليدها بقدرات هجينة متقدمة

Manzano

Manzano

ياسين عبد العزيز

A A

كشفت شركة آبل عن نموذج ذكاء اصطناعي جديد يحمل اسم Manzano، وهو ابتكار يركز على الجمع بين فهم الصور وتوليدها في آن واحد، وهو ما يُعد تحديًا معقدًا لطالما مثّل نقطة ضعف أمام النماذج مفتوحة المصدر مقارنة بالأنظمة التجارية الرائدة التي تطورها شركات مثل جوجل وOpenAI. 

النموذج الجديد، الذي يعني اسمه "شجرة التفاح" بالإسبانية، لم يُطرح بعد للاستخدام العام، حيث اكتفت آبل بالكشف عنه من خلال ورقة بحثية تضمنت عينات صور منخفضة الدقة واختبارات مقارنة مع أبرز النماذج المنافسة.

تصميم هجين

توضح آبل أن أبرز التحديات في هذا المجال تكمن في التوازن بين دقة تحليل الصور وجودة توليدها، إذ غالبًا ما ينجح النموذج في مهمة واحدة على حساب الأخرى. 

ويرجع ذلك إلى طبيعة البيانات، حيث يتطلب فهم الصور تدفقات مستمرة من الرموز، بينما يحتاج التوليد إلى تقسيم الصورة إلى رموز منفصلة، مما يولد تضاربًا داخل النموذج اللغوي. 

ولحل هذه المعضلة، اعتمدت آبل على تصميم هجين يجمع بين مُرمّز صور مشترك قادر على إنتاج رموز مستمرة لأغراض الفهم، وأخرى منفصلة للتوليد، ما يقلل من التضارب ويمنح النموذج مرونة أكبر في التعامل مع النصوص والرسوم المعقدة.

مكونات رئيسية

يتألف Manzano من ثلاثة مكونات محورية: المرمّز الهجين، ونموذج لغوي موحّد، إلى جانب مُفكك صور مستقل للإخراج النهائي. 

ووفق ما أعلنت آبل، فقد طُورت ثلاث نسخ من مُفكك الصور بأحجام مختلفة (0.9 و1.75 و3.52 مليارات معلمة)، قادرة على دعم دقة تبدأ من 256 بكسل وتصل حتى 2048 بكسل. 

وقد تم تدريب النموذج على نطاق واسع شمل نحو 2.3 مليار زوج من الصور والنصوص من مصادر عامة وداخلية، إضافة إلى مليار زوج من النصوص إلى الصور، ليصل إجمالي البيانات المستخدمة إلى 1.6 تريليون رمز، وهو ما يعكس حجم الاستثمار في تطوير قدراته.

نتائج أولية

أشارت اختبارات آبل إلى أن Manzano قدّم أداءً متفوقًا في اختبارات معيارية مثل ScienceQA وMMMU وMathVista، خصوصًا في المهام المعتمدة على النصوص كتحليل الوثائق والرسوم البيانية. 

وأوضحت النتائج أن أداء النموذج يتحسن بشكل ملحوظ مع زيادة عدد المعلمات، حيث يصل إلى مستوى قوي عند 30 مليار معلمة. 

ولم يقتصر التفوق على الفهم فحسب، بل شمل أيضًا قدرات توليدية بارزة، إذ أظهر النموذج مرونة في تنفيذ أوامر معقدة، ونقل الأنماط الفنية، وتنفيذ مهام مثل الإكمال (inpainting)، والتوسيع (outpainting)، وتقدير العمق.

ورغم هذا التقدم، أقرت آبل بأن نماذجها لا تزال متأخرة مقارنة بالمنافسين، ما يفسر اعتمادها مؤخرًا على GPT-5 من OpenAI في إطار تقنيات Apple Intelligence المدمجة في أنظمة مثل iOS 26. لكن الشركة تؤكد أن البنية المعيارية لـ Manzano تسمح بتطوير كل مكون على حدة، مما يفتح الباب أمام تحسينات متتالية قد تعزز موقعه في المستقبل.

تعتبر آبل هذا النموذج خطوة محورية في مسارها نحو تطوير أنظمة ذكاء اصطناعي متعددة الوسائط، حيث يهدف Manzano إلى تقليص اعتمادها على النماذج الخارجية وبناء أساس تقني متين خاص بها، غير أن الحكم النهائي على مدى نجاحه سيظل مرتبطًا بالتحديثات المستقبلية ومدى استجابة النموذج للتحديات الواقعية في الاستخدام اليومي.

Short URL
استطلاع رأى

هل يتراجع عدد عملاء CIB خلال الفترة المقبلة بعد زيادة أسعار رسوم التحويل والخدمات؟

  • نعم

  • لا

  • غير مهتم

search

أكثر الكلمات انتشاراً