Gate News сообщение, 25 апреля — DeepSeek выпустила предварительные версии V4-Pro и V4-Flash 24 апреля; обе — модели с открытыми весами и контекстным окном на один миллион токенов. V4-Pro включает 1,6 трлн общих параметров, но активирует только 49 млрд за один проход инференса, используя архитектуру Mixture-of-Experts. V4-Flash включает 284 млрд общих параметров с 13 млрд активными.
Цены заметно ниже, чем у конкурентов: V4-Pro стоит $1.74 за миллион токенов входных данных и $3.48 за миллион токенов выходных данных — примерно на 98% меньше, чем OpenAI GPT-5.5 Pro ($30 input, $180 output), и примерно в одну двадцатую раза дешевле, чем Claude Opus 4.7. V4-Flash стоит $0.14 на вход и $0.28 на выход за миллион токенов. Обе модели — с открытым исходным кодом по лицензии MIT, и их можно бесплатно запускать локально.
DeepSeek добилась прироста эффективности за счет двух новых механизмов внимания: Compressed Sparse Attention и Heavily Compressed Attention, которые снижают вычислительные затраты до 27% от предшественника V4-Pro (V3.2) и до 10% для V4-Flash. Компания частично обучала V4 на чипах Huawei Ascend, обходя ограничения США на экспорт продвинутых процессоров Nvidia. DeepSeek заявила, что после запуска 950 новых суперузлов в конце 2026 года цены снизятся еще сильнее.
По результатам тестов на производительность, V4-Pro-Max занимает первое место на Codeforces в конкурентном программировании (3,206 балла, располагаясь примерно на 23-м месте среди участников-людей) и набирая 90.2% на задачах математики Apex Shortlist против 85.9% у Claude Opus 4.6. Однако на тестах на многозадачность он уступает: MMLU-Pro (87.5% против 91.0% у Gemini-3.1-Pro) и Humanity’s Last Exam (37.7% против 44.4%). В задачах с длинным контекстом V4-Pro лидирует среди моделей с открытым исходным кодом, но уступает Claude Opus 4.6 в тестах извлечения MRCR.
V4-Pro вводит «interleaved thinking» («перемежающееся мышление»), позволяя агентским сценариям сохранять контекст рассуждений в процессе множества вызовов инструментов без «сброса» между шагами. Обе модели поддерживают интеграции для кодинга с Claude Code и OpenCode. Согласно опросу разработчиков DeepSeek среди 85 пользователей, 52% заявили, что V4-Pro готов быть их агентом по умолчанию для написания кода, а 39% склоняются к внедрению. Старые endpoints deepseek-chat и deepseek-reasoner будут сняты 24 июля 2026 года.
Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к
Отказу от ответственности.
Связанные статьи
Маск рассматривал идею объединить OpenAI с Tesla в конце 2017 года, суд заслушал показания
Согласно показаниям на федеральном суде в Окленде, Калифорния, Илон Маск в конце 2017 года и в начале 2018 года рассматривал вариант объединить OpenAI с Tesla — об этом заявила Шивон Зилис, руководитель Neuralink и бывший член совета директоров OpenAI. Зилис показала, что Маск изучал возможность предложить Сэму Альтману место в совете директоров Tesla
GateNews8м назад
Рост пользователей Gemini и Claude ускоряется в апреле, тогда как рост ChatGPT замедляется до 30% год к году
Согласно последнему отчёту Bank of America, Gemini и Claude в апреле показали сильный рост числа пользователей, в то время как расширение ChatGPT замедлилось. В США по веб-посещениям ChatGPT вырос на 30% год к году до 34 миллионов посещений (что эквивалентно 6% трафика Google), тогда как Claude взлетел на 715% год к году до 7,1 миллионов.
GateNews15м назад
OpenAI запускает протокол MRC вместе с AMD, Broadcom, Intel, Microsoft и Nvidia
OpenAI объявила, что сотрудничает с AMD, Broadcom, Intel, Microsoft и Nvidia, чтобы запустить Multipath Reliable Connection (MRC) — открытый сетевой протокол. MRC предназначен для ускорения кластеров для масштабного обучения ИИ, повышения надежности и существенного снижения простоев GPU
GateNews18м назад
Выручка SK Telecom от ИИ-ЦОД выросла на 89% в 1 квартале 2026 года
Согласно SK Telecom, бизнес по центрам обработки данных с искусственным интеллектом южнокорейского телекоммуникационного оператора принёс 131,4 млрд вон (89,4 млн долларов США) выручки за первый квартал 2026 года, что на 89,3% больше в годовом выражении. Компания объяснила рост более высокой загрузкой центров обработки данных и
GateNews28м назад
Арм предупреждает о слабостях смартфонов, рассчитывая на рост чипов для ИИ, чтобы компенсировать
Arm Holdings предупредила, что слабость рынка смартфонов сжимает ключевой источник выручки компании по проектированию чипов, при этом рост бизнеса чипов для ИИ, как ожидается, компенсирует влияние, заявил CEO Рене Хаас на звонке по итогам квартала. В предыдущем квартале поставки телефонов снизились, при этом убытки были сосредоточены в
CryptoFrontier38м назад
DeepSeek привлекает финансирование при оценке $45B на фоне конкуренции в сфере ИИ
Китайская ИИ-лаборатория DeepSeek ведёт переговоры о привлечении первого раунда финансирования при оценке, о которой сообщает TechCrunch, на уровне 45 миллиардов долларов США. Эта оценка значительно выросла по сравнению с оценкой в 20 миллиардов долларов США, о которой сообщалось всего несколько недель назад, после того как внимание привлекли ИИ-модели компании для
CryptoFrontier57м назад