الأربعاء، 07 مايو 2025

10:03 م

tru

أمازون تطلق Nova Sonic في سباق النماذج الصوتية الذكية

Nova Sonic

Nova Sonic

ياسين عبد العزيز

A A

كشفت شركة أمازون عن نموذجها الصوتي الجديد Nova Sonic الذي يعمل بتقنية الذكاء الاصطناعي التوليدي ويتيح محادثات أكثر واقعية وسلاسة بين الإنسان والآلة حيث صممت الشركة هذا النموذج لمنافسة أكثر النماذج تقدمًا في السوق مثل النماذج التي طورتها OpenAI وجوجل ويأتي ذلك بعد مراجعات متعددة قارنت قدرات Nova Sonic في التعرف على الكلام وسرعة الاستجابة وجودة المحادثة.

وأكدت أمازون أن Nova Sonic متاح الآن عبر منصة Bedrock الخاصة بها التي تتيح للمطورين بناء تطبيقات ذكاء اصطناعي باستخدام واجهة برمجة التطبيقات الجديدة التي تدعم البث الصوتي في الاتجاهين ما يسمح بتفاعلات آنية وقابلة للتطوير ضمن الأنظمة المؤسسية المختلفة.

وأشار روهيت براساد النائب الأول لرئيس أمازون وكبير علماء الذكاء الاصطناعي العام إلى أن مكونات Nova Sonic تعمل حاليًا في النسخة المحسّنة من أليكسا بلس حيث تقدم استجابات أسرع وأكثر وعيًا بسياق الحديث ومدة الصمت والمقاطعات.

أداء محسّن

بيّن براساد أن Nova Sonic يتفوق في فهم النوايا حتى في حال حديث المستخدم بصوت منخفض أو وسط ضجيج خارجي حيث يستطيع النموذج توليد نسخة مكتوبة بدقة عالية من كلام المستخدم ما يمنح المطورين مرونة في الاستخدام ضمن تطبيقات تحليل البيانات أو أدوات الإنتاج الصوتي.

أظهرت نتائج اختبارات معيار Multilingual LibriSpeech أن النموذج سجل معدل خطأ بنسبة 4.2٪ فقط عند العمل بعدة لغات منها الإنجليزية والفرنسية والألمانية والإسبانية والإيطالية وهذا يعكس قدرة النموذج على التعامل مع لهجات ولهجات متنوعة دون فقدان الدقة.

كما سجل Nova Sonic تفوقًا بنسبة 46.7٪ مقارنة بنموذج GPT-4o-transcribe عند اختباره ضمن بيئة محادثات متعددة الأطراف وصاخبة وذلك وفقًا لاختبار Augmented Multi Party Interaction الذي يُستخدم لتقييم قدرة النماذج على التعامل مع الحوارات المركبة.

ومن حيث سرعة الاستجابة سجل النموذج تأخيرًا متوسطًا قدره 1.09 ثانية فقط مقارنة بـ1.18 ثانية لنموذج Realtime API من OpenAI وذلك حسب اختبارات مؤسسة Artificial Analysis المتخصصة في تقييم أداء نماذج الذكاء الاصطناعي في الزمن الحقيقي.

تكلفة أقل

أوضحت أمازون في بيان رسمي أن Nova Sonic يُعد النموذج الأقل تكلفة في السوق حاليًا حيث تبلغ تكلفته التشغيلية نحو 20٪ فقط من تكلفة نموذج GPT-4o المنافس ما يجعله خيارًا جذابًا للشركات والمؤسسات التي تسعى لتطبيق حلول صوتية دون إنفاق ميزانيات كبيرة.

وترى الشركة أن Nova Sonic يمثل خطوة أولى في إطار إستراتيجية أوسع نحو تطوير أنظمة ذكاء اصطناعي عام AGI متعددة الوسائط قادرة على التفاعل مع الصور والفيديو والصوت وبيانات أخرى حسية في المستقبل مما يعزز من قدراتها في تقديم حلول واقعية لمشكلات الحياة اليومية.

وكشفت أمازون عن خططها لإطلاق نماذج أخرى ضمن هذه المنظومة المتكاملة منها نموذج Nova Act الذي يمكنه تنفيذ الأوامر عبر المتصفح ويستخدم حاليًا ضمن مساعد أليكسا بلس وخدمة "اشترِ نيابةً عني" التي تتيح للذكاء الاصطناعي تنفيذ عمليات الشراء تلقائيًا بناءً على تفضيلات المستخدمين بالإضافة إلى نموذج Nova Reel الجديد الذي يركّز على إنتاج الفيديو التوليدي.

هذا التوجه يعكس طموح أمازون في الحفاظ على موقعها ضمن سباق الذكاء الاصطناعي العالمي وتوسيع نطاق استخدام تقنياتها الصوتية في قطاعات تشمل التجارة الرقمية والرعاية الصحية والتعليم وخدمات العملاء.

search

أكثر الكلمات انتشاراً