देसी Sarvam AI ने Google Gemini और ChatGPT को चित तो कर दिया, लेकिन एक पेच है
Sarvam AI एक स्टार्ट अप है जिसे भारत सरकार ने देसी Large Language Model (LLM) डेवलप करने के लिए चुना है. कहा जा रहा है कि इसके दो नए टूल Vision और Bulbul ने काम करने के मामले में दिग्गजों (Sarvam AI beats Google Gemini and ChatGPT) को पछाड़ दिया है. क्या वाकई ऐसा है? जवाब हां भी है और और नहीं भी.

AI के मैदान में अमेरिकन कंपनियों का दबदबा है. Google Gemini से लेकर ChatGPT और Meta AI का रौला सभी को पता है. ऐसे में अगर कोई देसी AI टूल इनको पीछे छोड़ दे तो उसके बारे में 'Chat' करना बनता है. बात इंडियन Sarvam AI की करेंगे, जिसने पिछले कुछ दिनों से भौकाल मचाया हुआ है. कहा जा रहा है कि इसके दो नए टूल Vision और Bulbul ने काम करने के मामले में दिग्गजों (Sarvam AI beats Google Gemini and ChatGPT) को पछाड़ दिया है.
क्या वाकई ऐसा है? जवाब हां भी है और और नहीं भी. पहले जरा Sarvam AI से राब्ता कर लेते हैं.
क्या है Sarvam AI?एक इंडियन स्टार्ट अप जिसे भारत सरकार ने देसी Large Language Model (LLM) डेवलप करने के लिए चुना है. Sarvam AI जिसे भारत सरकार ने अपना चैट जीपीटी बनाने के लिए चुना है. केन्द्रीय मंत्री Ashwini Vaishnaw ने अप्रैल 2025 में इसकी घोषणा की थी. ‘सर्वम’ को सरकार की तरफ से तगड़े कंप्यूटिंग डिवाइस और बाकी सपोर्ट भी है. Pratyush Kumar इसके को-फाउंडर हैं.
सर्वम वाकई सर्वेसर्वा है क्या?‘सर्वम’ के सुपर स्टार बनने की बात तब से स्टार्ट हुई जब इसके फाउंडर ने अपने लेटेस्ट olmOCR-Bench मॉडल Sarvam Vision को लॉन्च किया. यह एक AI मॉडल है जो optical character recognition (OCR) पर काम करता है. माने तस्वीरों को समझ कर, डॉक्युमेंट्स स्कैन या हाथ से लिखी बात को समझकर कई कठिन काम कर सकता है. जैसे, अगर इसे कागज पर लिखे किसी गणित के सवाल को सुलझाने के लिए कहेंगे तो वो उसका जवाब बता देगा.
Pratyush ने अपनी पोस्ट में बताया कि उनका मॉडल 84.3 एक्यूरेसी पर काम करता है. माने 100 में से 84 बार सही जवाब देता है. उनके मुताबिक Sarvam Vision कठिन काम करने में Google Gemini और GPT 4 से 'आगे' है. वो दावा करते हैं कि OCR-Bench में गूगल की एक्यूरेसी 77.50 फीसदी और जीपीटी की 69.80 है. ठीक बात.

Pratyush जो कह रहे वो एकदम सही है, मगर वो नहीं कह रहे जो वाकई में कहना चाहिए. उनका मॉडल फर्स्ट डिवीजन में पास तो हो रहा, मगर Indic scripts में. Indic scripts मतलब ऐसा मॉडल जो इंडियन लैंग्वेज और इंडियन लिखने के तरीके में एक्सपर्ट है. ऐसा मॉडल जो भारतीय भाषाओं के साथ ट्रेनिंग लिया है.
आसान भाषा में कहें तो इसकी पहली भाषा हिन्दी या गुजराती या मराठी है. वहीं गूगल और जीपीटी को अंग्रेजी बेस बनाकर तैयार किया गया है. जाहिर सी बात है अपनी भाषा पर Sarvam Vision की पकड़ मजबूत होगी.
Bulbul V3 का क्या हालBulbul V3 भी एक नया मॉडल है जो text-to-speech में काम करता है. माने आपके लिखे को अलग-अलग जुबानों में ट्रांसलेट करता है. इंग्लिश से लेकर कई भारतीय भाषाओं में यह काम करता है. Pratyush की पोस्ट के मुताबिक उनका मॉडल इस मॉडल के ग्लोबल लीडर Elevenlabs से आगे है. मगर बात वही है, यह मॉडल भी भारतीय भाषाओं पर काम करके आया है. ऐसे में वो अंग्रेजी बेस वाले मॉडल से आगे होगा.
लेकिन अगर बड़े स्केल पर देखें तो Gemini आज की तारीख में JEE का पूरा टेस्ट पेपर आपके लिए बना सकता है तो ChatGPT आपकी X-ray फिल्म को देखकर बीमारी का अंदाजा भी लगा सकता है. हालांकि 100 फीसदी कोई भी मॉडल सही नहीं है. लेकिन कहने को कह सकते हैं कि Sarvam AI कुछ फील्ड में Google Gemini और ChatGPT से आगे तो है, मगर अभी उसे ग्लोबल पटल पर टॉप करने में टाइम लगेगा.
वीडियो: T20 विश्वकप में भारत बनाम पाकिस्तान मैच होगा, PCB और ICC के बीच क्या बात हुई?

.webp?width=60)

