O modelo surpreendentemente econômico de Deepseek desafia os gigantes da indústria. O autoproclamado custo de treinamento de US $ 6 milhões da empresa para o DeepSeek V3, usando apenas 2048 GPUs, parecia inicialmente revolucionário. No entanto, um olhar mais próximo revela um investimento muito maior.
Imagem: Ensigame.com
A Deepseek V3 aproveita as tecnologias inovadoras: Previsão com vários toques (MTP) para maior precisão e eficiência; Mistura de especialistas (MOE) , utilizando 256 redes neurais (oito ativadas por token); e atenção latente de várias cabeças (MLA) para melhorar a extração de informações. Esses avanços contribuem para o desempenho competitivo do modelo.
Imagem: Ensigame.com
Ao contrário das reivindicações iniciais, a semiânica revelou o uso da Deepseek de aproximadamente 50.000 GPUs NVIDIA, incluindo H800, H100 e H20, espalhadas por vários data centers. Essa infraestrutura representa um investimento substancial de aproximadamente US $ 1,6 bilhão, com despesas operacionais estimadas em US $ 944 milhões.
Imagem: Ensigame.com
A Deepseek, uma subsidiária da High-Flyer, possui seus data centers, fornecendo controle e acelerando a inovação. Sua natureza autofinanciada promove a agilidade. Altos salários, excedendo US $ 1,3 milhão anualmente para alguns pesquisadores, atraem os melhores talentos das universidades chinesas.
O número de US $ 6 milhões reflete apenas os custos de GPU pré-treinamento, excluindo pesquisas, refinamento, processamento de dados e infraestrutura. O investimento total da AI da Deepseek ultrapassa US $ 500 milhões. Apesar disso, sua estrutura simplificada permite inovação eficiente.
Imagem: Ensigame.com
Embora o sucesso de Deepseek mostre o potencial de empresas independentes de IA bem financiadas, a narrativa "orçamentária" é enganosa. Bilhões em investimento, avanços tecnológicos e uma equipe qualificada são fatores -chave. No entanto, mesmo com esses recursos substanciais, os custos da Deepseek permanecem significativamente menores que os concorrentes, como os US $ 100 milhões gastos em ChatGPT4O em comparação com os US $ 5 milhões da Deepseek em R1. A disparidade destaca a eficiência relativa de Deepseek, apesar do investimento geral significativo.