علم و تكنولوجيا

دراسة تكشف: فصاحة ChatGPT لا تعكس دقة استنتاجاته العلمية

Shutterstock

كشفت دراسة حديثة أجراها باحثون في Washington State University عن محدودية أداء روبوتات الدردشة المعتمدة على الذكاء الاصطناعي في مهام الاستدلال العلمي، رغم تفوقها في إنتاج النصوص.

واعتمدت الدراسة على اختبار قدرة النظام على تقييم أكثر من 700 فرضية علمية عبر تحديد صحتها بإجابات مباشرة. وأظهرت النتائج أن دقة الإجابات، رغم وصولها إلى 76.5% في عام 2024 و80% في عام 2025، تنخفض إلى نحو 60% فقط عند مقارنتها بمستوى التخمين العشوائي.

ووفقًا لتقرير نشره موقع Tech Xplore، واجه النظام صعوبة واضحة في التعرف على الفرضيات غير الصحيحة حيث لم تتجاوز دقة الإجابة عليها 16.4% كما سجلت الاختبارات تباينًا كبيرًا في النتائج عند تكرار نفس الأسئلة ما يعكس ضعف الاتساق في الأداء.

وأُجريت التجربة الأولى باستخدام إصدار ChatGPT-3.5 بينما شملت التجربة الثانية إصدار ChatGPT-5 mini وكلاهما ضمن النسخ المجانية المتاحة.

وتشير هذه النتائج إلى فجوة بين القدرات اللغوية للنماذج التوليدية وقدرتها على التحليل المنطقي ما يفرض ضرورة التحقق من مخرجاتها قبل الاعتماد عليها في المهام الحساسة.

ويرى الباحثون أن هذه المؤشرات تستدعي حذرًا أكبر من قبل الشركات والمستخدمين خاصة مع تزايد الاعتماد على أدوات الذكاء الاصطناعي في مجالات تتطلب دقة عالية.

Web Desk

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى