The Lallantop
Advertisement

देसी Sarvam AI ने Google Gemini और ChatGPT को चित तो कर दिया, लेकिन एक पेच है

Sarvam AI एक स्टार्ट अप है जिसे भारत सरकार ने देसी Large Language Model (LLM) डेवलप करने के लिए चुना है. कहा जा रहा है कि इसके दो नए टूल Vision और Bulbul ने काम करने के मामले में दिग्गजों (Sarvam AI beats Google Gemini and ChatGPT) को पछाड़ दिया है. क्या वाकई ऐसा है? जवाब हां भी है और और नहीं भी.

Advertisement
Sarvam AI beats Google Gemini and ChatGPT
Sarvam AI देसी स्टार्ट अप है. (तस्वीरें- Unsplash.com और Sarvam AI)
pic
सूर्यकांत मिश्रा
10 फ़रवरी 2026 (अपडेटेड: 10 फ़रवरी 2026, 04:17 PM IST)
font-size
Small
Medium
Large
font-size
Small
Medium
Large
whatsapp share

AI के मैदान में अमेरिकन कंपनियों का दबदबा है. Google Gemini से लेकर ChatGPT और Meta AI का रौला सभी को पता है. ऐसे में अगर कोई देसी AI टूल इनको पीछे छोड़ दे तो उसके बारे में 'Chat' करना बनता है. बात इंडियन Sarvam AI की करेंगे, जिसने पिछले कुछ दिनों से भौकाल मचाया हुआ है. कहा जा रहा है कि इसके दो नए टूल Vision और Bulbul ने काम करने के मामले में दिग्गजों (Sarvam AI beats Google Gemini and ChatGPT) को पछाड़ दिया है. 

क्या वाकई ऐसा है? जवाब हां भी है और और नहीं भी. पहले जरा Sarvam AI से राब्ता कर लेते हैं.

क्या है Sarvam AI?

एक इंडियन स्टार्ट अप जिसे भारत सरकार ने देसी Large Language Model (LLM) डेवलप करने के लिए चुना है. Sarvam AI जिसे भारत सरकार ने अपना चैट जीपीटी बनाने के लिए चुना है. केन्द्रीय मंत्री Ashwini Vaishnaw ने अप्रैल 2025 में इसकी घोषणा की थी. ‘सर्वम’ को सरकार की तरफ से तगड़े कंप्यूटिंग डिवाइस और बाकी सपोर्ट भी है. Pratyush Kumar इसके को-फाउंडर हैं.  

सर्वम वाकई सर्वेसर्वा है क्या?

‘सर्वम’ के सुपर स्टार बनने की बात तब से स्टार्ट हुई जब इसके फाउंडर ने अपने लेटेस्ट olmOCR-Bench मॉडल Sarvam Vision को लॉन्च किया. यह एक AI मॉडल है जो optical character recognition (OCR) पर काम करता है. माने तस्वीरों को समझ कर, डॉक्युमेंट्स स्कैन या हाथ से लिखी बात को समझकर कई कठिन काम कर सकता है. जैसे, अगर इसे कागज पर लिखे किसी गणित के सवाल को सुलझाने के लिए कहेंगे तो वो उसका जवाब बता देगा.

Pratyush ने अपनी पोस्ट में बताया कि उनका मॉडल 84.3 एक्यूरेसी पर काम करता है. माने 100 में से 84 बार सही जवाब देता है. उनके मुताबिक Sarvam Vision कठिन काम करने में Google Gemini और GPT 4 से 'आगे' है. वो दावा करते हैं कि OCR-Bench में गूगल की एक्यूरेसी 77.50 फीसदी और जीपीटी की 69.80 है. ठीक बात.

Pratyush का पोस्ट
Pratyush का पोस्ट

Pratyush जो कह रहे वो एकदम सही है, मगर वो नहीं कह रहे जो वाकई में कहना चाहिए. उनका मॉडल फर्स्ट डिवीजन में पास तो हो रहा, मगर Indic scripts में. Indic scripts मतलब ऐसा मॉडल जो इंडियन लैंग्वेज और इंडियन लिखने के तरीके में एक्सपर्ट है. ऐसा मॉडल जो भारतीय भाषाओं के साथ ट्रेनिंग लिया है. 

आसान भाषा में कहें तो इसकी पहली भाषा हिन्दी या गुजराती या मराठी है. वहीं गूगल और जीपीटी को अंग्रेजी बेस बनाकर तैयार किया गया है. जाहिर सी बात है अपनी भाषा पर Sarvam Vision की पकड़ मजबूत होगी. 

Bulbul V3 का क्या हाल

Bulbul V3 भी एक नया मॉडल है जो text-to-speech में काम करता है. माने आपके लिखे को अलग-अलग जुबानों में ट्रांसलेट करता है. इंग्लिश से लेकर कई भारतीय भाषाओं में यह काम करता है. Pratyush की पोस्ट के मुताबिक उनका मॉडल इस मॉडल के ग्लोबल लीडर Elevenlabs से आगे है. मगर बात वही है, यह मॉडल भी भारतीय भाषाओं पर काम करके आया है. ऐसे में वो अंग्रेजी बेस वाले मॉडल से आगे होगा.

लेकिन अगर बड़े स्केल पर देखें तो Gemini आज की तारीख में JEE का पूरा टेस्ट पेपर आपके लिए बना सकता है तो ChatGPT आपकी X-ray फिल्म को देखकर बीमारी का अंदाजा भी लगा सकता है. हालांकि 100 फीसदी कोई भी मॉडल सही नहीं है. लेकिन कहने को कह सकते हैं कि Sarvam AI कुछ फील्ड में Google Gemini और ChatGPT से आगे तो है, मगर अभी उसे ग्लोबल पटल पर टॉप करने में टाइम लगेगा.

वीडियो: T20 विश्वकप में भारत बनाम पाकिस्तान मैच होगा, PCB और ICC के बीच क्या बात हुई?

Advertisement

Advertisement

()