Удивительно экономически эффективные ИИ модели ИИ бросают вызов гигантам отрасли. Самопровозглашенная стоимость обучения компании для Deepseek V3 в 6 миллионов долларов, используя только 2048 графических процессоров, первоначально казался революционным. Тем не менее, более пристальный взгляд показывает гораздо большую инвестицию.
Изображение: Ensigame.com
DeepSeek V3 использует инновационные технологии: Multi-Token Production (MTP) для повышения точности и эффективности; Смесь экспертов (MOE) , используя 256 нейронных сетей (восемь активированных на токен); и Многополосное скрытое внимание (MLA) для улучшения извлечения информации. Эти достижения способствуют конкурентной производительности модели.
Изображение: Ensigame.com
В отличие от первоначальных претензий, полуанализ выявил использование Deepseek примерно 50 000 графических процессоров Nvidia, включая H800, H100 и H20, распространяющиеся по нескольким центрам обработки обработки данных. Эта инфраструктура представляет собой существенные инвестиции в размере примерно 1,6 млрд. Долл. США, а эксплуатационные расходы оцениваются в 944 млн. Долл. США.
Изображение: Ensigame.com
Deepseek, дочерняя компания High-Flyer, владеет своими центрами обработки данных, обеспечивая контроль и ускоряет инновации. Его самофинансируемая природа способствует ловкости. Высокая заработная плата, превышающая 1,3 миллиона долларов в год для некоторых исследователей, привлекает лучших талантов из китайских университетов.
Цифра в 6 миллионов долларов отражает только предварительные затраты на GPU, исключая исследования, уточнение, обработку данных и инфраструктуру. Общее количество инвестиций в AI DeepSeek превышает 500 миллионов долларов. Несмотря на это, его упорядоченная структура обеспечивает эффективные инновации.
Изображение: Ensigame.com
В то время как успех DeepSeek демонстрирует потенциал хорошо финансируемых независимых компаний искусственного интеллекта, «Бюджетный» повествование вводит в заблуждение. Миллиарды инвестиций, технологических прорывов и квалифицированная команда являются ключевыми факторами. Тем не менее, даже с этими существенными ресурсами, затраты DeepSeek остаются значительно ниже, чем конкуренты, такие как сообщаемые 100 миллионов долларов, потраченные на CHATGPT4O, по сравнению с 5 миллионами долларов США за R1. Неравенство подчеркивает относительную эффективность Deepseek, несмотря на значительные общие инвестиции.