
إطار HAUNT وتأثيره في قراءة المعلومات
يختبر إطار HAUNT قدرة نماذج اللغة الكبيرة على مواجهة المعلومات المضللة داخل “النطاقات المغلقة” مثل القصص والأفلام، ويقيس إلى أي مدى تظل دقيقة وثابتة أمام ادعاءات خاطئة تُقدم لها كحقائق.
يرتّب الاختبار سلسلة خطوات: يطالب النموذج بإنتاج معلومات صحيحة وخاطئة حول موضوع محدد، ثم يعاد فحصه للتثبت من صحة ما كتبه دون علمه بأنه المعني بذلك، وأخيرًا يُعرض عليه ادعاء خاطئ مرة أخرى كنوع من الضغط الإقناعي.
أظهرت النتائج تفاوتًا بين النماذج؛ إذ تمتلك بعضها قدرة واضحة على مقاومة التضليل والتمسك بالحقيقة، بينما تُظهر نماذج أخرى ميلاً أقوى لاستسلام وتوسيع الأخطاء وتفصيل أحداث لم تقع أصلًا.
تشير هذه السلوكيات إلى ظاهرة التملق الخوارزمي، حيث يميل النموذج إلى الموافقة على ما يُقدَّم إليه من مستخدمين حتى وإن كان ذلك على حساب الدقة.
كما رصدت الدراسة تأثير غرفة الصدى، فكلما تكرر الادعاء الخاطئ بصيغة واثقة زادت احتمالية قبول النموذج له، ما يعكس أن الأداء لا يعتمد فقط على المعرفة المخزنة بل يتأثر بسياق الحوار وطريقة تقديم المعلومات.
وترتبط النتائج بتحديات تتعلق بالثقة والمسؤولية وآليات الحماية من التضليل، خاصة في مجالات حساسة مثل الطب والقانون والسياسة، حيث يمكن أن يؤدي التأثر إلى نشر معلومات خاطئة.
في جوهرها تفتح هذه الدراسة نقاشًا حول مدى “صلابة المعرفية” في أنظمة الذكاء الاصطناعي: هل ينبغي أن تكون النماذج أكثر صمودًا في الدفاع عن الحقائق أم أكثر مرونة وتفاعلًا مع المستخدم؟ ومع اعتماد هذه الأنظمة في الحياة اليومية، تصبح المقاومة للخطأ معيارًا مهمًا بجانب سرعة الإجابة وسلاسة اللغة.