The Lallantop

ChatGPT के सामने DeepSeek का भौकाल, चीन का ये वार सब चैट बॉट को धराशायी कर देगा?

Chinese AI lab DeepSeek ने इसी महीने में अपने दो AI मॉडल दुनिया के सामने उतारे हैं. DeepSeek-R1 और DeepSeek-V3. रिपोर्ट के मुताबिक इसको बनाने में महज 5.6 मिलियन डॉलर (50 करोड़ के अल्ले-पल्ले) का खर्च आया है. जबकि ChatGPT को बनाने में हजारों करोड़ रुपये लगे थे.

post-main-image
DeepSeek

Artificial Intelligence की बैक बोन माने जाने वाली कंपनी NVIDIA के स्टॉक 3 फीसदी गिर गए हैं. सिलिकॉन वैली की टॉप टेक कंपनियां हिली हुई हैं. ChatGPT से लेकर Meta AI और दूसरे सारे चैट बॉट चिंता में आ गए हैं. क्योंकि DeepSeek लॉन्च हो गया है. चीन का अपना ‘ChatGPT’ जिसका गूगल प्ले स्टोर और iOS पर भौकाल है. ‘चैट’ है कि इसके आते ही AI में अमेरिकी कंपनियों की बादशाहत खत्म हो गई है. वगैरा-वगैरा-वगैरा. एक वगैरा इसलिए ज्यादा लगाया क्योंकि कुछ ज्यादा ही ‘Deep’ हो गया. अब वाकई में ऐसा है क्या, चलिए पता करते हैं.

दरअसल Chinese AI lab DeepSeek ने इसी महीने में अपने दो AI मॉडल दुनिया के सामने उतारे हैं. DeepSeek-R1 और DeepSeek-V3. रिपोर्ट के मुताबिक इसको बनाने में महज 5.6 मिलियन डॉलर (50 करोड़ के अल्ले-पल्ले) का खर्च आया है. जबकि ChatGPT को बनाने में हजारों करोड़ रुपये लगे थे. क्या हुआ है?

ChatGPT किफायती प्रो मैक्स 

DeepSeek के फाउंडर हैं Liang Wenfeng जो एक मशहूर AI एक्सपर्ट हैं. महानुभाव ने साल 2023 में DeepSeek को स्टार्ट किया था. DeepSeek LLM कंपनी का पहला प्रोडक्ट था जिसने चर्चा बटोरी. ये मॉडल 67 अरब पैरामीटर्स पर काम करता था. इसके बाद आया DeepSeek-V2 और फिर DeepSeek-Coder-V2 जो 236 अरब पैरामीटर्स पर काम करता था. 

DeepSeek-V3 and DeepSeek-R1 में पैरामीटर्स बढ़कर 671 बिलियन हो गए. DeepSeek एक बार में 1 लाख 28 हज़ार टोकन (जवाब) जनरेट कर सकता है. मतलब जो इससे आपने बतियाना चालू किया तो आप भले थक जाएं ये नहीं थकेगा. चैट जीपीटी का लेटेस्ट वर्जन भी इतने ही टोकन जनरेट कर सकता है.

मोटा-माटी इतना परिचय काफी है क्योंकि काम ये भी वही करता है जो ChatGPT और दूसरे चैट बॉट करते हैं. मगर असल फ़र्क इसके डिजाइन में है. जहां अमेरिकी कंपनियां अपने मॉडल को ट्रेंड करने के लिए NVIDIA H100 Tensor Core GPU का इस्तेमाल करती हैं, वहीं DeepSeek अपेक्षाकृत पुराने और कमजोर मॉडल H800 (GPU) पर काम करता है. ये मॉडल साल 2021 का है जब ChatGPT अपने डेवलपर्स वर्जन में था. Graphics Processing Unit के बारे में जानने के लिए नीचे लिंक पर क्लिक कर सकते हैं. 

ये भी पढ़ें: ये कंपनी 3 महीने में बनी दुनिया की तीसरी सबसे बड़ी कंपनी, 'अलादीन का चिराग' जो इसके पास है 

फोर्ब्स के मुताबिक Liang Wenfeng ने इस पुराने मॉडल के तकरीबन 50 हजार GPU खरीदे और उनको काम पर लगा दिया. DeepSeek को चलाने का खर्च भी बहुत कम है. मतलब अगर इसे आपको अपने सिस्टम में लगाना है तो 10 लाख इनपुट के लिए $0.14 (12 रुपये) और आउटपुट के लिए $0.28 (24 रुपये) ही खर्च करने होंगे. जबकि इसी काम के लिए चैट जीपीटी में 86 पैसे हर इनपुट के लिए लगेंगे. मतलब 10 लाख इनपुट पर 12 लाख का खर्च. जाहिर सी बात है कि ऐसे में DeepSeek का इंपेक्ट 'डीप' होना ही था. इसकी वजह से खुद कई चाइनीज कंपनियों, जैसे ByteDance, Tencent, Baidu और Alibaba, को अपने चैट बॉट के दाम कम रखने पड़े हैं. तो क्या DeepSeek सब को गहरे में डुबो देगा?

DeepSeek
DeepSeek
थोड़ा ठंड रखते हैं

अभी कुछ भी कहना जल्दबाजी होगी. क्योंकि जब ChatGPT आया था तब भी कई बातें हुई थीं, मगर अभी भी ये मॉडल पूरी तरह परिपक्व नहीं है. DeepSeek के साथ भी ऐसा ही है. हमने जब इससे Lallantop को लेकर कुछ सवाल पूछे तो जवाब सही नहीं थे. हालांकि ठीक-ठाक कह सकते हैं. 

DeepSeek
DeepSeek

मगर जब मैंने अपने बारे में पूछा तो सारे ही जवाब एकदम गलत थे. ऐसा ही जवाब मुझे Meta AI से भी मिला था. मतलब इनको अभी बहुत बहुत ट्रेनिंग की जरूरत है. इसके पास जानकारी भी अक्टूबर 2023 तक की ही है. हालांकि ऐसा होने से इसकी ताकत कमजोर नहीं हो जाती, मगर चावल का एक दाना ही काफी है उसके पके होने के सबूत के लिए.

DeepSeek
DeepSeek

इस बात में कोई संदेह नहीं कि चीन ने अपनी परंपरा, प्रतिष्ठा और अनुशासन को बरकरार रखते हुए कम पैसे में प्रोडक्ट निकाल दिया है. अब दुनिया इससे 'मोहब्बत' करेगी या नहीं वो वक्त बताएगा.  

वीडियो: सेहतः क्या हैं सुपरबग्स, जिससे मारे जा सकते हैं 4 करोड़ लोग!