
من الهند إلى العالم.. Sarvam: نموذج محلي يزلزل ChatGPT وGemini
أطلقت Sarvam AI أداتين جديدتين هما Sarvam Vision وBulbul V3، مستهدفتين مهام محددة بدقة عالية ما مكّن الشركة من التفوق في اختبارات ومعايير عالمية متخصصة.
أدوات SARVAM AI: Vision وBulbul
تستهدف Sarvam Vision مهام تعرف الحروف والكتابة من الصور وتحليل المستندات الممسوحة ضوئيًا، حيث حقق نموذج Vision نتائج غير مسبوقة في اختبارات olmOCR-Bench بمقدار 84.3% وتفوق على نماذج عالمية مثل ChatGPT وGemini 3 Pro وDeepSeek OCR v2، كما وصل إلى 93.28% في OmniDocBench v1.5 مع التعامل مع التخطيطات المعقدة والجداول والصيغ.
يرتكز التفوق على تركيزه العميق على اللغات والنصوص الهندية، حيث تم تدريب النموذج على أنماط كتابة محلية وخطوط هندية وإتاحة فهم أفضل لللغات الإقليمية المختلفة، بينما تظل نماذج كـChatGPT وGemini قوية في OCR لكنها ليست محسّنة بذات الدرجة للنصوص الهندية، وهو ما يمنح Vision ميزة نسبية للشركات والمؤسسات الهندية في التعامل مع مستندات رسمية ومحتوى متعدد اللغات ووثائق مكتوبة بخط اليد.
Bulbul V3، نموذج تحويل نص إلى صوت مصمم خصيصًا للهجات الهندية ونطق اللغات المحلية، تفوق في الاختبارات على ElevenLabs في السياق الهندي، بفضل تدريبه على النطق والإيقاع المحلي مما يجعل الصوت الناتج أقرب إلى الواقعية للمستخدمين الهنديين.
لماذا لا تعتبر SARVAM AI بديلاً عامًا لـ CHATGPT و Gemini
لا تعتبر Sarvam AI بديلاً عامًا لـChatGPT أو Gemini، إذ تُصمم نماذج Vision وBulbul لأداء وظائف محددة بدقة عالية دون دعم المحادثات الطويلة أو معالجة مسائل متعددة المجالات أو إنتاج محتوى إبداعي مفتوح، بينما يمكن لـGemini إعداد اختبارات مثل امتحان JEE ومرافقة المستخدم خطوة بخطوة، ويستطيع ChatGPT تحليل صور الأشعة الطبية وتقديم تصور مبدئي، وهي استخدامات خارج نطاق Sarvam في الحاضر.
الفرق في الحجم يظهر في أن Sarvam Vision يضم نحو 3 مليارات باراميتر فقط، بينما يرد ذكر أن Gemini 3 قد يحتوي على نحو 2 تريليون باراميتر، وهو ما يفرض تكاليف بنى تحتية ضخمة وتدريب على مستوى مراكز بيانات هائلة، وهو ما لا يتوفر حاليًا بنفس النطاق داخل الهند.
تبقى الإنجازات الهندية محل احتفاء، فهذه النماذج لا تدّعي إحداث ثورة في الذكاء الاصطناعي العام، لكنها دليل عملي على أن شركات الهند يمكنها بناء أدوات عالمية المستوى وتُبرز أن التحدي الأكبر أمام الهند ليس الكفاءة البشرية فحسب بل البنية التحتية والقدرات الحاسوبية، وتُعد Vision وBulbul بمثابة إثبات مفهوم يبيّن إمكانية التفوق في مهام محددة حين يكون التركيز ذكيًا ومحددًا.