The Lallantop

देसी Sarvam AI ने Google Gemini और ChatGPT को चित तो कर दिया, लेकिन एक पेच है

Sarvam AI एक स्टार्ट अप है जिसे भारत सरकार ने देसी Large Language Model (LLM) डेवलप करने के लिए चुना है. कहा जा रहा है कि इसके दो नए टूल Vision और Bulbul ने काम करने के मामले में दिग्गजों (Sarvam AI beats Google Gemini and ChatGPT) को पछाड़ दिया है. क्या वाकई ऐसा है? जवाब हां भी है और और नहीं भी.

Advertisement
post-main-image
Sarvam AI देसी स्टार्ट अप है. (तस्वीरें- Unsplash.com और Sarvam AI)

AI के मैदान में अमेरिकन कंपनियों का दबदबा है. Google Gemini से लेकर ChatGPT और Meta AI का रौला सभी को पता है. ऐसे में अगर कोई देसी AI टूल इनको पीछे छोड़ दे तो उसके बारे में 'Chat' करना बनता है. बात इंडियन Sarvam AI की करेंगे, जिसने पिछले कुछ दिनों से भौकाल मचाया हुआ है. कहा जा रहा है कि इसके दो नए टूल Vision और Bulbul ने काम करने के मामले में दिग्गजों (Sarvam AI beats Google Gemini and ChatGPT) को पछाड़ दिया है. 

Add Lallantop as a Trusted Sourcegoogle-icon
Advertisement

क्या वाकई ऐसा है? जवाब हां भी है और और नहीं भी. पहले जरा Sarvam AI से राब्ता कर लेते हैं.

क्या है Sarvam AI?

एक इंडियन स्टार्ट अप जिसे भारत सरकार ने देसी Large Language Model (LLM) डेवलप करने के लिए चुना है. Sarvam AI जिसे भारत सरकार ने अपना चैट जीपीटी बनाने के लिए चुना है. केन्द्रीय मंत्री Ashwini Vaishnaw ने अप्रैल 2025 में इसकी घोषणा की थी. ‘सर्वम’ को सरकार की तरफ से तगड़े कंप्यूटिंग डिवाइस और बाकी सपोर्ट भी है. Pratyush Kumar इसके को-फाउंडर हैं.  

Advertisement
सर्वम वाकई सर्वेसर्वा है क्या?

‘सर्वम’ के सुपर स्टार बनने की बात तब से स्टार्ट हुई जब इसके फाउंडर ने अपने लेटेस्ट olmOCR-Bench मॉडल Sarvam Vision को लॉन्च किया. यह एक AI मॉडल है जो optical character recognition (OCR) पर काम करता है. माने तस्वीरों को समझ कर, डॉक्युमेंट्स स्कैन या हाथ से लिखी बात को समझकर कई कठिन काम कर सकता है. जैसे, अगर इसे कागज पर लिखे किसी गणित के सवाल को सुलझाने के लिए कहेंगे तो वो उसका जवाब बता देगा.

Pratyush ने अपनी पोस्ट में बताया कि उनका मॉडल 84.3 एक्यूरेसी पर काम करता है. माने 100 में से 84 बार सही जवाब देता है. उनके मुताबिक Sarvam Vision कठिन काम करने में Google Gemini और GPT 4 से 'आगे' है. वो दावा करते हैं कि OCR-Bench में गूगल की एक्यूरेसी 77.50 फीसदी और जीपीटी की 69.80 है. ठीक बात.

Pratyush का पोस्ट
Pratyush का पोस्ट

Pratyush जो कह रहे वो एकदम सही है, मगर वो नहीं कह रहे जो वाकई में कहना चाहिए. उनका मॉडल फर्स्ट डिवीजन में पास तो हो रहा, मगर Indic scripts में. Indic scripts मतलब ऐसा मॉडल जो इंडियन लैंग्वेज और इंडियन लिखने के तरीके में एक्सपर्ट है. ऐसा मॉडल जो भारतीय भाषाओं के साथ ट्रेनिंग लिया है. 

Advertisement

आसान भाषा में कहें तो इसकी पहली भाषा हिन्दी या गुजराती या मराठी है. वहीं गूगल और जीपीटी को अंग्रेजी बेस बनाकर तैयार किया गया है. जाहिर सी बात है अपनी भाषा पर Sarvam Vision की पकड़ मजबूत होगी. 

Bulbul V3 का क्या हाल

Bulbul V3 भी एक नया मॉडल है जो text-to-speech में काम करता है. माने आपके लिखे को अलग-अलग जुबानों में ट्रांसलेट करता है. इंग्लिश से लेकर कई भारतीय भाषाओं में यह काम करता है. Pratyush की पोस्ट के मुताबिक उनका मॉडल इस मॉडल के ग्लोबल लीडर Elevenlabs से आगे है. मगर बात वही है, यह मॉडल भी भारतीय भाषाओं पर काम करके आया है. ऐसे में वो अंग्रेजी बेस वाले मॉडल से आगे होगा.

लेकिन अगर बड़े स्केल पर देखें तो Gemini आज की तारीख में JEE का पूरा टेस्ट पेपर आपके लिए बना सकता है तो ChatGPT आपकी X-ray फिल्म को देखकर बीमारी का अंदाजा भी लगा सकता है. हालांकि 100 फीसदी कोई भी मॉडल सही नहीं है. लेकिन कहने को कह सकते हैं कि Sarvam AI कुछ फील्ड में Google Gemini और ChatGPT से आगे तो है, मगर अभी उसे ग्लोबल पटल पर टॉप करने में टाइम लगेगा.

वीडियो: T20 विश्वकप में भारत बनाम पाकिस्तान मैच होगा, PCB और ICC के बीच क्या बात हुई?

Advertisement