
ذراع روبوتية تنجز 1000 مهمة خلال يوم واحد باستخدام تقنية تعلم مبتكرة
اكتشاف MT3 وتدريب الذراع الروبوتية
نجح فريق من العلماء في إمبريال كوليدج لندن في تدريب ذراع روبوتية من طراز Sawyer على تنفيذ 1000 مهمة مختلفة خلال يوم واحد فقط، بعد فترة تدريب لم تتجاوز ثماني ساعات، باستخدام أسلوب تعلم جديد يُعرف باسم MT3 (Multi-Task Trajectory Transfer).
يعتمد MT3 على التعلم عبر المحاكاة من عرض واحد فقط للمهمة، حيث يشاهد الروبوت مهمة يؤديها إنسان مرة واحدة ثم يحلل الحركة إلى مراحل قابلة لإعادة استخدامها وتكييفها مع مهام وأجسام جديدة، وهو ما يقلل الوقت والموارد اللازمة لتدريب الروبوتات.
تُطبّق التجربة على الذراع Sawyer لتأدية مهام متعددة مثل استخدام الأدوات والتقاط ورفع أشياء عدة في آن واحد والتعامل مع أوضاع مختلفة للأجسام، دون الحاجة لإعادة تدريب شاملة أو الاعتماد على مجموعات بيانات ضخمة.
كيف يعمل MT3
يقسم MT3 كل مهمة إلى مرحلتين أساسيتين: مرحلة المحاذاة (Alignment) حيث يتعلم الروبوت الاقتراب من الجسم بالشكل الصحيح، ومرحلة التفاعل (Interaction) حيث ينفذ الحركة المطلوبة مثل الإمساك أو النقل أو الاستخدام.
يستخدم النظام آلية استرجاع ذكية للذاكرة تتيح له اختيار أقرب عرض تدريبي سابق يتناسب مع المهمة الجديدة بناءً على وصف المهمة وإدراك البيئة المحيطة، ما يمنح الروبوت مرونة عالية في التكيّف مع مواقف جديدة دون أخطاء سلوكية.
سلوك قابل للفهم وتفسير
لا يعتمد MT3 على نماذج التعلم العميقة “الصندوق الأسود” الشائعة، بل يوفر سلوكًا واضحًا وقابلًا للتفسير، مما يجعل تصرفات الروبوت أكثر موثوقية في البيئات الحساسة مثل الرعاية الصحية وخطوط الإنتاج.
كفاءة وتعميم
أظهرت التجارب أن الروбот تعلم مهام جديدة بسرعة عبر التكيّف الحركي باستخدام تقدير الوضع والتخطيط الحركي، ما مكنها من تنفيذ عمليات التقاط ونقل مختلفة بدقة حتى عند تغير شكل أو موضع الأجسام. وتبين تفوق MT3 على أساليب مثل Behavioral Cloning في التعميم داخل فئة واحدة من المهام.
المستقبل والتطبيقات
يتوقع الباحثون أن تسهم التحسينات المستقبلية في تمكين الروبوتات من تعديل مساراتها الحركية للتعامل مع أشياء غير مألوفة تمامًا، ما يقلل أوقات التدريب وتكاليفه ويدفع نحو استخدام أوسع في بيئات واقعية مثل المصانع والمستودعات والمنازل.