दीपसेक की आश्चर्यजनक रूप से लागत प्रभावी एआई मॉडल चुनौतियां उद्योग के दिग्गजों को चुनौती देती हैं। केवल 2048 जीपीयू का उपयोग करते हुए, डीपसेक वी 3 के लिए कंपनी की स्व-घोषित $ 6 मिलियन प्रशिक्षण लागत, शुरू में क्रांतिकारी लग रहा था। हालांकि, एक नज़दीकी नज़र से बहुत बड़े निवेश का पता चलता है।
छवि: ensigame.com
दीपसेक वी 3 अभिनव प्रौद्योगिकियों का लाभ उठाता है: मल्टी-टोकन भविष्यवाणी (एमटीपी) बढ़ी हुई सटीकता और दक्षता के लिए; विशेषज्ञों का मिश्रण (एमओई) , 256 तंत्रिका नेटवर्क (प्रति टोकन सक्रिय आठ सक्रिय) का उपयोग करना; और मल्टी-हेड लेटेंट ध्यान (एमएलए) बेहतर सूचना निष्कर्षण के लिए। ये प्रगति मॉडल के प्रतिस्पर्धी प्रदर्शन में योगदान करती हैं।
छवि: ensigame.com
प्रारंभिक दावों के विपरीत, सेमियालिसिस ने डीपसेक के लगभग 50,000 एनवीडिया जीपीयू के उपयोग का खुलासा किया, जिसमें H800, H100 और H20 यूनिट शामिल हैं, जो कई डेटा केंद्रों में फैले हुए हैं। यह बुनियादी ढांचा लगभग $ 1.6 बिलियन के पर्याप्त निवेश का प्रतिनिधित्व करता है, जिसमें परिचालन खर्च $ 944 मिलियन का अनुमान है।
छवि: ensigame.com
हाई-फ्लायर की सहायक कंपनी दीपसेक अपने डेटा सेंटरों का मालिक है, जो नियंत्रण प्रदान करती है और नवाचार को तेज करती है। इसकी स्व-वित्त पोषित प्रकृति चपलता को बढ़ावा देती है। उच्च वेतन, कुछ शोधकर्ताओं के लिए सालाना $ 1.3 मिलियन से अधिक, चीनी विश्वविद्यालयों से शीर्ष प्रतिभा को आकर्षित करता है।
$ 6 मिलियन का आंकड़ा केवल पूर्व-प्रशिक्षण GPU लागतों को दर्शाता है, अनुसंधान, शोधन, डेटा प्रसंस्करण और बुनियादी ढांचे को छोड़कर। दीपसेक का कुल एआई निवेश $ 500 मिलियन से अधिक है। इसके बावजूद, इसकी सुव्यवस्थित संरचना कुशल नवाचार को सक्षम करती है।
छवि: ensigame.com
जबकि दीपसेक की सफलता अच्छी तरह से वित्त पोषित स्वतंत्र एआई कंपनियों की क्षमता को प्रदर्शित करती है, "बजट के अनुकूल" कथा भ्रामक है। निवेश, तकनीकी सफलता और एक कुशल टीम में अरबों प्रमुख कारक हैं। हालांकि, इन पर्याप्त संसाधनों के साथ भी, डीपसेक की लागत प्रतियोगियों की तुलना में काफी कम है, जैसे कि आर 1 के लिए डीपसेक के 5 मिलियन डॉलर की तुलना में Chatgpt4o पर खर्च किए गए $ 100 मिलियन की रिपोर्ट की गई। महत्वपूर्ण समग्र निवेश के बावजूद, असमानता दीपसेक की सापेक्ष दक्षता पर प्रकाश डालती है।