الذكاء الاصطناعيعلم و تكنولوجيا

تكهنات حول اقتراب إطلاق نموذج “DeepSeek-R2” وسط اهتمام عالمي بقدراته الخارقة وتكلفته المنخفضة

صورة: q3tech

تصاعدت التكهنات على منصات التواصل الاجتماعي بشأن قرب إطلاق النموذج الجديد “R2” من شركة الذكاء الاصطناعي الصينية الناشئة ديب سيك (DeepSeek) وسط مزاعم بتحقيقه أداءً فائقًا وتكلفة تطوير منخفضة مما قد يشكل منعطفًا في سباق الذكاء الاصطناعي العالمي خاصة في ظل التوتر التكنولوجي بين الصين والولايات المتحدة.

ووفق منشورات تم تداولها على منصة Jiuyangongshe الصينية المعنية بالأسواق المالية، فإن نموذج DeepSeekR2 يعتمد على بنية مزيج الخبراء الهجينة (Hybrid Mixture-of-Experts – MoE) ويضم نحو 1.2 تريليون مُعامِل. وتشير التقديرات إلى أن تكلفة تطويره كانت أقل بنسبة 97.3٪ مقارنةً بنموذج GPT-4o من شركة OpenAI الأمريكية, بحسب ما أفاده موقع “SCMP“.

وتعتمد بنية MoE على تقسيم النموذج إلى “خبراء” متخصصين يتعامل كل منهم مع جزء معين من البيانات مما يساهم في تحسين الكفاءة وتقليل استهلاك الموارد خلال مراحل التدريب والتشغيل.

كما أُفيد بأن R2 تم تدريبه على خوادم مزودة بشرائح “Ascend 910B” من شركة هواوي والتي سجلت كفاءة تشغيل بلغت 91٪ مقارنةً بأنظمة تعتمد على شرائح Nvidia A100 ما يعزز من احتمالية اعتماد الصين على تقنيات محلية بعيدًا عن سلاسل التوريد الغربية.

وتداولت حسابات على منصة X (تويتر سابقاً) مزاعم أخرى بأن R2 يتفوق على سابقه R1 من حيث قدرات الرؤية الحاسوبية إذ كان R1 يفتقر لتلك الخاصية. واعتبر خبراء أن ذلك يمثل تطورًا كبيرًا في إمكانيات النماذج الصينية مفتوحة المصدر.

وفي تغريدة لاقت رواجًا واسعًا، وصف دييدي داس، الشريك في شركة Menlo Ventures الأمريكية، النموذج الجديد بأنه “خطوة استراتيجية لفك الارتباط مع سلاسل التوريد الأمريكية” مشيرًا إلى اعتماد المشروع على بنية تحتية صينية بالكامل.

Web Desk

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى

أنت تستخدم إضافة Adblock

برجاء تعطيل حاجب الإعلانات للاستمرار في استخدام موقعنا