Deepseeks überraschend kostengünstige KI-Modell stellt die Branchenriesen heraus. Die selbsternannten Schulungskosten des Unternehmens für Deepseek V3 im Wert von 6 Millionen US-Dollar, die nur 2048 GPUs verwendet, schien zunächst revolutionär zu sein. Ein genauerer Blick zeigt jedoch eine viel größere Investition.
Bild: Ensigame.com
Deepseek V3 nutzt innovative Technologien: Multi-Tooken-Vorhersage (MTP) für verbesserte Genauigkeit und Effizienz; Mischung von Experten (MOE) unter Verwendung von 256 neuronalen Netzwerken (acht aktiviert pro Token); und Multi-Head Latent Achtung (MLA) für eine verbesserte Informationsextraktion. Diese Fortschritte tragen zur Wettbewerbsleistung des Modells bei.
Bild: Ensigame.com
Im Gegensatz zu anfänglichen Behauptungen ergab die semianalyse die Verwendung von ungefähr 50.000 NVIDIA -GPUs, einschließlich H800-, H100- und H20 -Einheiten, die sich auf mehrere Rechenzentren ausbreiten. Diese Infrastruktur entspricht einer erheblichen Investition von rund 1,6 Milliarden US -Dollar, wobei die Betriebskosten auf 944 Mio. USD geschätzt werden.
Bild: Ensigame.com
Deepseek, eine Tochtergesellschaft von High-Flyer, besitzt seine Rechenzentren und bietet Kontrolle und beschleunigte Innovationen. Seine selbstfinanzierte Natur fördert die Beweglichkeit. Hohe Gehälter von mehr als 1,3 Millionen US -Dollar pro Jahr für einige Forscher ziehen Top -Talente von chinesischen Universitäten an.
Die 6-Millionen-Dollar-Zahl spiegelt nur die GPU-Kosten vor der Training wider, ohne Forschung, Verfeinerung, Datenverarbeitung und Infrastruktur. Deepseeks Gesamtinvestition von KI übertrifft 500 Millionen US -Dollar. Trotzdem ermöglicht seine optimierte Struktur effiziente Innovation.
Bild: Ensigame.com
Während Deepseeks Erfolg das Potenzial gut finanzierter unabhängiger KI-Unternehmen zeigt, ist die "budgetfreundliche" Erzählung irreführend. Milliarden an Investitionen, technologischen Durchbrüchen und ein qualifiziertes Team sind Schlüsselfaktoren. Trotz dieser erheblichen Ressourcen bleiben die Kosten von Deepseek jedoch deutlich niedriger als die Konkurrenten, wie die gemeldeten 100 Millionen US -Dollar, die für ChatGPT4O ausgegeben wurden, im Vergleich zu 5 Millionen US -Dollar von Deepseek für R1. Die Ungleichheit unterstreicht die relative Effizienz von Deepseek trotz der erheblichen Gesamtinvestition.