كشفت دراسة حديثة نُشرت في دورية الجمعية الطبية البريطانية «BMJ»، أن النماذج اللغوية الكبيرة، المعروفة باسم «الشات بوت»، تظهر علامات مشابهة للضعف الإدراكي البشري الخفيف عند خضوعها لاختبارات تُستخدم عادةً للكشف عن العلامات المبكرة لخرف الشيخوخة.
وأشارت النتائج إلى أن الإصدارات الأقدم من هذه النماذج ذات الذكاء الاصطناعي تحقق أداءً أسوأ، مما يفتح نقاشًا حول مدى قدرتها على محاكاة الذكاء البشري بفاعلية.
التدهور الإدراكي لنماذج الذكاء الاصطناعي خطر غير مُتوقع
وأحد المخاوف البارزة هو احتمالية تعرض النماذج اللغوية لضعف إدراكي مشابه للبشر، وتشير الدراسة إلى أن هذا الجانب لم يحظَ باهتمام كافٍ حتى الآن، رغم الاعتماد المتزايد على هذه النماذج في اتخاذ القرارات الطبية.
وفي الطب، تُستخدم اختبارات التقييم الإدراكي للكشف عن التدهور العقلي لدى المرضى، خاصة كبار السن. لكن ما يثير الاهتمام أن نفس الاختبارات عندما طُبقت على نماذج لغوية مثل ChatGPT وGemini، أظهرت نتائج تُظهر قصوراً في القدرات التنفيذية والتجريد البصري.
أداء النماذج في الاختبارات
وطبّق الباحثون اختبارات متنوعة، منها:
- اختبار التركيز: أظهرت النماذج تفاوتاً في القدرة على التمييز بين التفاصيل.
- اختبار ستروب: قيّم سرعة استجابة النماذج عند مواجهة معلومات متضاربة.
- اختبار الرسم البصري: فشلت معظم النماذج في أداء مهام مثل رسم الساعة أو نسخ المكعب، حيث ظهرت أخطاء مشابهة لتلك التي تحدث لدى مرضى الخرف.
وأظهرت النماذج اللغوية أداءً جيداً في اختبارات اللغة والانتباه، لكن الأداء انخفض بشكل ملحوظ في المهام التي تتطلب التجريد البصري والوظائف التنفيذية.
نماذج ذكاء اصطناعي بخصائص بشرية؟
وأوضحت النتائج أن النماذج الأحدث مثل GPT4o حققت أداءً أفضل مقارنة بالإصدارات الأخرى، بينما سجل نموذج Gemini درجات أقل، ما يعكس ضعفاً إدراكياً أكبر.
وفي مهام مثل «التذكر المؤجل»، كان أداء النماذج متبايناً؛ إذ نجح بعضها في التذكر مع التلميح، بينما فشل البعض الآخر كلياً.
هل يمكن الاعتماد الكامل على الذكاء الاصطناعي؟
ورغم الإمكانيات الكبيرة التي تقدمها هذه النماذج، فإن الدراسة تؤكد ضرورة إجراء تقييمات شاملة لنقاط ضعفها قبل الاعتماد الكامل عليها في المجالات الحساسة، مثل الطب، كما تبرز أهمية الإشراف البشري لضمان دقة القرارات وتقليل الأخطاء.
واختتم الباحثون دراستهم بالإشارة إلى أن الذكاء الاصطناعي قد يخلق تحديات جديدة تتطلب من الأطباء معالجة «مرضى افتراضيين» يتمثلون في نماذج لغوية تعاني من ضعف إدراكي. وبينما لا يبدو أن الذكاء الاصطناعي سيحل محل الأطباء في المستقبل القريب، إلا أن الحاجة قائمة لتطويره لتجنب مثل هذه المشكلات.