منوعات

صدمة تقنية: وكلاء الذكاء الاصطناعي يفشلون في أداء مهام العمل بنسبة 76%

نتائج صادمة لتقييم Apex-Agents في وظائف الياقات البيضاء

كشفَت نتائج اختبار Apex-Agents، وهو معيار عالمي لقياس قدرة وكلاء الذكاء الاصطناعي، عن أداء صادم في تنفيذ مهام الياقات البيضاء في قطاعات مثل البنوك والاستشارات والقانون.

أظهرت الاختبارات أن أفضل النماذج المتاحة، بما فيها Gemini من Google، حققت أقصى نسبة نجاح لم تتجاوز 24% في إتمام المهام المطلوبة، ما يضع وعود الأتمتة الشاملة للشركات تحت مجهر النقد العلمي والتقني.

أسباب ضعف الوكلاء

تبرز الأسباب الجوهرية لضعف الوكلاء في عدم قدرتهم على التعامل مع المعلومات المشتتة عبر منصات متعددة مثل Slack وGoogle Drive، ما يؤدي إلى فقدان السياق أثناء الانتقال بين هذه الأدوات.

أوضح الباحثون أن فقدان السياق ينتج عنه أخطاء فادحة في اتخاذ القرار أو في تنفيذ الأوامر الإدارية، وهو ما يجعل الاعتماد على الوكلاء في بيئة العمل أمراً بعيداً عن المتناول في الوقت الراهن.

التحديات والموثوقية في بيئات العمل المعقدة

أفادت تقارير AI Agent Store بأن 52% من قادة الشركات يعتبرون الأمن والامتثال العائق الأكبر أمام نشر هؤلاء الوكلاء، وتشدد على الحاجة إلى وجود رقابة بشرية كاملة على قرارات الذكاء الاصطناعي لضمان سلامة العمليات.

تشير التحديات في بيئات العمل المعقدة إلى صعوبة تنظيم مهام متعددة تتطلب فهماً دلالياً متغيراً، مما يجعل مهام حساسة مثل مراجعة العقود القانونية أو التحليلات البنكية مخاطرة تقنية غير محسوبة النتائج حالياً.

أولوية الحوكمة على القدرات الخام

تؤكد الحوكمة والموثوقية أنها أهم من القدرات الحسابية الخام، حيث يحتاج بناء وكلاء ناجحين إلى إعادة تصميم العمليات التشغيلية للمؤسسات بدلاً من الاكتفاء بأتمتة الإجراءات القائمة لضمان أعلى مستويات الدقة والأمان الرقمي.

يعزز ذلك ضرورة إعادة ترتيب الأولويات التنظيمية والاستثمار في الحوكمة وتدابير الرقابة، وليس فقط في تعزيز القدرات الحسابية.

google.com, pub-7984506988189976, DIRECT, f08c47fec0942fa0

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى