Публичный релиз DeepSeek R1 в январе 2025 года значительно изменил ландшафт ИИ. Но сегодня я расскажу о следующем шаге в эволюции DeepSeek и, возможно, о следующем большом скачке вперед в технологии ИИ, какой мы ее знаем: DeepSeek R2 .
Последние достижения DeepSeek

Это определенно немного осталось незамеченным, но исследовательская группа DeepSeek недавно провела мероприятие под названием Open-Source Week. В ходе этого мероприятия команда DeepSeek выпустила пять репозиториев с открытым исходным кодом, чтобы продемонстрировать недавний прогресс и достижения в области ИИ, которых они достигли.
Три наиболее примечательных из этих инструментов:
- FlashMLA : это эффективное ядро декодирования MLA для графических процессоров Hopper.
- DeepEP : первая в истории коммуникационная библиотека для обучения и вывода моделей MoE.
- DeepGEMM : библиотека FP8 GEMM, которая работает как с плотными, так и с MoE GEMM.

Так что же все это на самом деле означает?
Ну, все эти инструменты предназначены для того, чтобы сделать разработку и оптимизацию будущих моделей и продуктов ИИ проще и эффективнее. И это плавно подводит меня к главной теме обсуждения: DeepSeek R2.
DeepSeek R2: следующая эволюция искусственного интеллекта

Мероприятие DeepSeek Open-Source Week и представленные на нем продукты тесно связаны с предстоящим выпуском нашумевшей модели Reasoning 2 или R2, которая, как ожидается, станет серьезным обновлением по сравнению с предыдущей моделью DeepSeek R1.
Для тех, кто не следит за новостями и релизами, связанными с DeepSeek, я расскажу вам основы:
DeepSeek R1 был разработан в Китае и запущен в начале 2025 года. Это было крупное событие в сфере ИИ, и оно частично привело к продаже более 1 триллиона долларов на мировом рынке акций. Почему? Потому что R1 была такой продвинутой, революционной моделью, более чем способной конкурировать с лучшими моделями ИИ от крупных западных брендов.

Тестирование показало, что во многих областях он эквивалентен или превосходит такие препараты, как:
- Claude
- GPT-4o
- OpenAI-o1-mini
- И многие другие
Ему удалось сделать все это, будучи открытым исходным кодом и бесплатным для доступа. В то время это было новаторским, и я был одним из многих энтузиастов ИИ по всему миру, которых поразила эта история: небольшой китайский стартап сумел достичь того же уровня технологического совершенства, что и огромные многомиллиардные бренды вроде OpenAI.
Но прошло совсем немного времени после выхода R1, и я, как и многие другие, задался вопросом: «Что дальше?»

Ну, недавно вышел отчет Reuters, в котором говорится, что команда разработчиков DeepSeek спешит выпустить модель R2 к маю. Так что мы можем получить ее очень скоро, и я могу сказать вам наверняка: эта новая модель изменит ландшафт ИИ еще более радикально, чем R1.
Влияние R2
Вот чего я ожидаю от R2:
- Это будет очень дешево, как R1.
- Он будет соответствовать или даже превосходить ведущие модели, такие как o3-full или o3-high от OpenAI.
- Он превзойдет почти все другие модели на рынке.
И это произойдет очень скоро, если верить последним сообщениям. Команда из Ханчжоу, работающая над DeepSeek, кажется, действительно горит желанием выпустить его, и мой личный прогноз таков: мы можем увидеть его релиз сразу после китайского праздника Цинмин, который приходится на 6 мая, так что следите за своими календарями.
Говорят, что команда DeepSeek также сосредоточилась на создании лучшего кода, чем раньше, и лучшей производительности на ряде языков, а не только на английском и китайском, которые были основными фокусами и параметрами по умолчанию в R1. Это имеет смысл, поскольку DeepSeek R1 оказался популярным во всем мире, и люди захотят взаимодействовать с R2 на испанском, французском, русском и т. д.
И нам нужно только оглянуться назад на то, какое влияние оказал R1 на прогнозирование того, как R2 может повлиять на мировые рынки. Выпуск R1 привел к резкому падению фондового рынка, и такие акции, как NVIDIA, криптовалюты и мировые акции, упали в течение нескольких дней после его выпуска. Это поразило меня в то время, потому что мы почти никогда не видели ничего подобного раньше.

Почему это произошло, на самом деле? Ну, отчасти потому, что R1 был построен с использованием менее мощных, старых чипов NVIDIA, а не новейших, поэтому это сделало новейшие технологии NVIDIA менее ценными и впечатляющими с этой точки зрения. Это также создало большую конкуренцию крупным западным гигантам технологий ИИ, что привело к снижению их стоимости и их продуктов.
Запуск R2 может иметь схожие последствия. Он может подорвать доминирование крупных фирм ИИ, таких как OpenAI и Google, снова встряхнув ландшафт и доказав, что вам не обязательно использовать самые передовые, новейшие и лучшие чипы и другие части оборудования, чтобы создавать невероятные модели ИИ.

Секрет успеха DeepSeek
К этому моменту вы, возможно, задаетесь вопросом: «В чем секрет невероятного успеха DeepSeek?» Что ж, я думаю, у меня есть ответ. Ключ к успеху DeepSeek был в том, как быстро они внедряли инновации в разработку ИИ, осмеливаясь мыслить нестандартно и делать вещи не так, как крупные, устоявшиеся фирмы.
Инновации в технологиях
Значительную часть этого составили крупные инвестиции в вычисления. Материнская компания DeepSeek вложила много денег в покупку вычислительного оборудования, например, современных суперкомпьютерных кластеров, таких как Firefly, которые используют тысячи чипов NVIDIA 800 по гораздо более низкой цене, чем новейшие чипы, что позволило DeepSeek создать потрясающий ИИ при относительно небольшом бюджете.
На самом деле, за этим стоит довольно интересная история. Компания, стоящая за DeepSeek , потратила около 1,2 млрд юаней на два таких суперкомпьютерных кластера ИИ в 2020 и 2021 годах. Эти кластеры состояли примерно из 10 000 чипов NVIDIA 800, и эти покупки привлекли внимание некоторых крупных регулирующих органов в Китае.

Эти органы спросили DeepSeek , почему они покупают так много чипов, и команде пришлось объяснить, над чем они работают. В конце концов, они получили «все чисто» от регулирующих органов, что позволило им двигаться дальше. Тем временем западные ИИ-фирмы используют еще больше — до 50 000 — высокопроизводительных чипов NVIDIA, которые буквально были запрещены к экспорту в Китай.
Итак, DeepSeek пришлось иметь дело с чипами худшего качества, но все же заставить их работать, сосредоточившись на эффективности, а не на пиковой производительности, и извлекая как можно больше ценности из доступных компонентов. Это также означает более низкие вычислительные затраты и накладные расходы, которые перекладываются на конечных пользователей — таких людей, как я и вы.
Устанавливая стандарт
После того, как DeepSeek создала эту начальную инфраструктуру, они смогли продвинуться вперед со своими инновациями, масштабируя свою работу и экономически эффективно разрабатывая различные модели и системы ИИ. Они даже достигли точки, когда их модель находится всего в 4,5 баллах от официального лучшего в мире результата в тестах на производительность.

Это для меня ошеломляет, и это еще больше воодушевляет меня в отношении R2. Потому что если R1 так близок к тому, чтобы стать лучшим в своем деле, R2 почти наверняка поднимется намного выше и достигнет гораздо большего. Будет очень интересно посмотреть, насколько он впечатляет, когда R2 выйдет, как он покажет себя по сравнению с другими моделями и как другим фирмам придется догонять DeepSeek.
Справедливые цены
Есть еще фактор цены. DeepSeek был доступен и доступен по значительно более низким ценам, чем любая другая крупная модель ИИ на рынке. Я сравнил графики цен на момент выпуска R1, и разница была ошеломляющей. И многие люди быстро отказались от своих подписок OpenAI и перешли на DeepSeek , когда увидели, насколько он хорош и дешев.
Мы даже увидели, что OpenAI пришлось быстро снизить свои ценовые планы, потому что DeepSeek был в 40 раз дешевле, чем OpenAI в то время, и это до сих пор поражает меня, когда я вспоминаю об этом.

Конечно, мы пока не знаем многого о ценах R2, но я не ожидаю, что DeepSeek слишком сильно изменит тактику с новой моделью. Это все еще должен быть доступный вариант, предоставляющий как можно большему количеству людей доступ к передовым технологиям ИИ, не заставляя их тратить огромные суммы на ежемесячные платежи.
Плюс, с выпуском DeepSeek этих новых инструментов на своем мероприятии Open-Source, порог входа в разработку ИИ стал еще ниже и доступнее. Так что вполне возможно, что R2 может быть даже дешевле оригинальной модели R1, которая действительно пошлет сейсмические волны по всему миру ИИ и за его пределами.
Приготовьтесь к выпуску DeepSeek R2
В целом, я очень рад предстоящему релизу R2 от DeepSeek. Все признаки положительные, предполагая, что эта новая модель с открытым исходным кодом будет даже лучше, чем не только R1, но и любая другая модель ИИ, которую мы видели до сих пор. Она будет быстрее, умнее и превосходить во всех отношениях, и мы даже можем получить за нее лучшую цену. Оставайтесь с нами для дальнейших обновлений.