
من الهند إلى العالم: Sarvam نموذج محلي يهز ChatGPT وGemini
أدوات SARVAM AI التي أشعلت الجدل: Vision وBulbul
أطلقت Sarvam AI أداتين جديدتين هما Sarvam Vision وBulbul V3، وتستهدفان مهام محددة بدقة عالية، وهو ما مكّن الشركة من التفوق في اختبارات ومعايير عالمية متخصصة.
سجّل Sarvam Vision نتائج غير مسبوقة في اختبار olmOCR-Bench، وهو معيار عالمي يقيس قدرات نماذج الذكاء الاصطناعي في التعرف الضوئي على الحروف، حيث بلغت دقته 84.3% وتفوّق على ChatGPT من OpenAI وGemini 3 Pro من Google وDeepSeek OCR v2، كما حقق 93.28% في OmniDocBench v1.5 خاصة في التخطيطات والجداول والمعادلات.
يرتكز السر الحقيقي في تفوق Sarvam Vision على تركيزه العميق على اللغات والنصوص الهندية، حيث تم تدريبه على أنماط الكتابة الهندية والخطوط المعقدة واللغات الإقليمية المختلفة، وهذا يمنحه أفضلية في التعامل مع المستندات الممسوحة ضوئيًا والنصوص متعددة اللغات ونماذج الدولة.
تفوقت Bulbul V3 في تحويل النص إلى صوت بنكهة هندية، وتفوقت في الاختبارات المقارنة مع ElevenLabs في السياق الهندي بفضل تدريبه على اللهجات الهندية ونطق اللغات المحلية ومحاكاة الإيقاع الطبيعي للكلام.
لماذا لا تُعد SARVAM AI بديلًا للنماذج العامة؟
تُعد Sarvam AI نموذجًا عامًا للذكاء الاصطناعي مثل ChatGPT أو Gemini، لكنها مصممة لأداء وظائف محدودة بدقة عالية ولا تدعم المحادثات الطويلة أو إنتاج محتوى إبداعي متنوع ولا تعالج مسائل معقدة تمتد عبر مجالات متعددة.
الفرق في الحجم والتحديات التقنية
يمتلك Sarvam Vision نحو 3 مليارات باراميتر، في حين يُشاع أن Gemini 3 يحتوي على نحو 2 تريليون باراميتر، وهذا الفارق الكبير يعكس فروقات في الموارد اللازمة للتدريب والتشغيل، إذ تتطلب النماذج الضخمة بنية تحتية هائلة ووحدات GPU ضخمة ومراكز بيانات متقدمة.
إنجازٌ هندِي يستحق الاحتفاء
يُعَد هذا الإنجاز الهندي دليلاً على قدرة الشركات المحلية على تطوير أدوات عالمية المستوى، وهو يعزز فكرة أن التحدي الحقيقي في الهند ليس الكفاءة البشرية فحسب، بل البنية التحتية والقدرات الحاسوبية اللازمة لدفع مشروع الذكاء الاصطناعي للأمام.
تشير أمثلة Vision وBulbul إلى إمكانية إثبات المفاهيم عندما يُركز الجهد على مهام محددة وتتحقق نتائج عالية الدقة، وهذا يعزز الاحتفاء بالإنجازات الهندية في مجال الذكاء الاصطناعي كدلالة على إمكانات تطوير حلول عالمية المستوى محليًا.