Il modello di intelligenza artificiale sorprendentemente conveniente di Deepseek sfida i giganti del settore. Il costo autoproclamato di $ 6 milioni dell'azienda per DeepSeek V3, utilizzando solo 2048 GPU, inizialmente sembrava rivoluzionario. Tuttavia, uno sguardo più attento rivela un investimento molto più grande.
Immagine: Ensigame.com
DeepSeek V3 sfrutta le tecnologie innovative: Previsione multi-token (MTP) per una maggiore precisione ed efficienza; Mixture di esperti (MOE) , utilizzando 256 reti neurali (otto attivate per token); e Attenzione latente multi-testa (MLA) per una migliore estrazione di informazioni. Questi progressi contribuiscono alle prestazioni competitive del modello.
Immagine: Ensigame.com
Contrariamente alle affermazioni iniziali, la seminalisi ha rivelato l'uso da parte di DeepSeek di circa 50.000 GPU NVIDIA, tra cui unità H800, H100 e H20, diffuse su più data center. Questa infrastruttura rappresenta un investimento sostanziale di circa $ 1,6 miliardi, con spese operative stimate in $ 944 milioni.
Immagine: Ensigame.com
DeepSeek, una consociata di High-Flyer, possiede i suoi data center, fornendo controllo e accelerando l'innovazione. La sua natura autofinanziata promuove l'agilità. Gli alti salari, superiori a $ 1,3 milioni all'anno per alcuni ricercatori, attirano i migliori talenti dalle università cinesi.
La cifra di 6 milioni di dollari riflette solo i costi di pre-allenamento GPU, esclusa la ricerca, la raffinatezza, l'elaborazione dei dati e l'infrastruttura. L'investimento totale di intelligenza artificiale di Deepseek supera $ 500 milioni. Nonostante ciò, la sua struttura semplificata consente un'efficace innovazione.
Immagine: Ensigame.com
Mentre il successo di Deepseek mette in mostra il potenziale di società di intelligenza artificiale indipendenti ben finanziate, la narrazione "a misura di budget" è fuorviante. Miliardi di investimenti, scoperte tecnologiche e un team qualificato sono fattori chiave. Tuttavia, anche con queste risorse sostanziali, i costi di DeepSeek rimangono significativamente più bassi rispetto ai concorrenti, come i $ 100 milioni segnalati spesi su Chatgpt4o rispetto ai $ 5 milioni di DeepSeek per R1. La disparità evidenzia l'efficienza relativa di DeepSeek, nonostante il significativo investimento complessivo.