منوعات

جوجل تُحسّن أداء نموذجها المُحدَّث Gemini 3 Deep Think ويتفوق على GPT-5.2

تحديث Gemini 3 Deep Think

أعلنت جوجل عن تحديث رئيسي لنموذج Gemini 3 Deep Think يمكّنه من مواجهة تحديات حديثة في مجالات العلوم والبحث والهندسة، ولا يزال متاحًا لمشتركي Google AI Ultra، لكن يمكن لمجموعة مختارة من الباحثين والشركات الوصول إليه عبر واجهة برمجة التطبيقات API.

أكدت الشركة أن التحديث يعزز الأداء في جميع المعايير الأساسية، ويرفع قدرة النموذج على العمل في بيئات واقعية، مع إشادة بالعمل المشترك الوثيق مع العلماء والباحثين.

أعلنت جوجل أن Gemini 3 Deep Think حقق 84.6% في معيار ARC-AGI-2، وهو مقياس يقيس قدرة النماذج على الاستدلال، وتلقت النتيجة تأكيدًا من ARC Prize Foundation.

وأعلنت أن النموذج سجل 48.4% في Humanity’s Last Exam بدون أدوات، وهو أحد أصعب الاختبارات القياسية المعرفة حتى الآن.

زعمَت جوجل أن Gemini 3 Deep Think حقق Elo بمقدار 3455 على منصة Codeforces، مع ادعاء تفوقه في هذه الاختبارات على نماذج رائدة من OpenAI وAnthropic.

وأوضحت جوجل كيف يُستخدم النموذج في حل مسائل علمية واقعية، مثل أن عالمة الرياضيات ليزا كاربون من جامعة روترغز استخدمت Gemini 3 Deep Think لمراجعة ورقة بحث رياضية متقدمة، ولاحظت أن النموذج كشف خللاً منطقياً دقيقًا لم يُكتشف خلال مراجعة الأقران البشرية.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى