Publiczna premiera DeepSeek R1 w styczniu 2025 r. ogromnie zmieniła krajobraz AI. Ale dziś opowiem o kolejnym kroku w ewolucji DeepSeek i być może o kolejnym wielkim skoku naprzód w technologii AI, jaką znamy: DeepSeek R2 .
Najnowsze osiągnięcia DeepSeek

To zdecydowanie umknęło uwadze, ale zespół badawczy DeepSeek niedawno zorganizował wydarzenie o nazwie Open-Source Week. Podczas tego wydarzenia zespół DeepSeek opublikował pięć repozytoriów open-source, aby pokazać ostatnie postępy i osiągnięcia w dziedzinie sztucznej inteligencji.
Trzy najważniejsze narzędzia to:
- FlashMLA : To wydajne jądro dekodujące MLA dla procesorów graficznych Hopper.
- DeepEP : Pierwsza na świecie biblioteka komunikacyjna do trenowania i wnioskowania w modelu MoE.
- DeepGEMM : biblioteka FP8 GEMM, która współpracuje zarówno z gęstymi, jak i MoE GEMM-ami.

Co to wszystko właściwie oznacza?
Cóż, wszystkie te narzędzia są zaprojektowane tak, aby ułatwić i usprawnić opracowywanie i usprawnianie przyszłych modeli i produktów AI. I to prowadzi mnie zgrabnie do głównego tematu dyskusji: DeepSeek R2.
DeepSeek R2: Następna ewolucja w dziedzinie sztucznej inteligencji

Wydarzenie Open-Source Week firmy DeepSeek oraz prezentowane tam produkty doskonale wpisują się w nadchodzącą premierę długo wyczekiwanego modelu Reasoning 2 lub R2, który ma być znaczącą modernizacją poprzedniego modelu DeepSeek R1.
Dla tych, którzy nie śledzą wiadomości i publikacji związanych z DeepSeek, przedstawię podstawowe informacje:
DeepSeek R1 został opracowany w Chinach i wprowadzony na rynek na początku 2025 r. Było to ważne wydarzenie w sferze AI i częściowo doprowadziło do sprzedaży ponad 1 biliona dolarów z globalnego rynku akcji. Dlaczego? Ponieważ R1 był tak zaawansowanym, rewolucyjnym modelem, który był w stanie konkurować z najlepszymi modelami AI dużych zachodnich marek.

Testy wykazały, że pod wieloma względami jest on równy lub lepszy od następujących produktów:
- Claude
- GPT-4o
- OpenAI-o1-mini
- I wiele innych
Udało się to wszystko zrobić, będąc jednocześnie open-source i darmowym. W tamtym czasie było to przełomowe, a ja byłem jednym z wielu entuzjastów AI na całym świecie, których ta historia zdumiała: mały chiński startup osiągnął ten sam poziom doskonałości technologicznej, co wielkie, warte miliardy dolarów marki, takie jak OpenAI.
Ale nie minęło dużo czasu od premiery R1, zanim ja i wielu innych zaczęło się zastanawiać: „Co dalej?”.

Cóż, niedawno ukazał się raport Reutersa, ujawniający, że zespół programistów DeepSeek spieszy się, aby model R2 został wprowadzony do maja. Więc możemy go otrzymać bardzo szybko i mogę powiedzieć na pewno: ten nowy model zmieni krajobraz AI jeszcze bardziej dramatycznie niż R1.
Wpływ R2
Oto czego oczekuję od R2:
- Będzie niezwykle tani, tak jak R1
- Będzie dorównywać, a nawet przewyższać wiodące modele, takie jak o3-full lub o3-high firmy OpenAI
- Będzie miał lepsze parametry od niemal wszystkich innych modeli dostępnych na rynku
I nadchodzi naprawdę niedługo, jeśli wierzyć najnowszym doniesieniom. Zespół pracujący nad DeepSeek w Hangzhou wydaje się bardzo chętny, aby to wydać, a moim osobistym przewidywaniem jest, że możemy zobaczyć wydanie tuż po chińskim święcie Qingming, które przypada 6 maja, więc miejcie oko na swoje kalendarze.
Zespół DeepSeek ma się również skupić na tworzeniu lepszego kodu niż wcześniej i lepszej wydajności w wielu językach, nie tylko angielskim i chińskim, które były głównymi celami i domyślnymi opcjami w R1. Ma to sens, ponieważ DeepSeek R1 okazał się popularny na całym świecie, a ludzie będą chcieli wchodzić w interakcje z R2 w języku hiszpańskim, francuskim, rosyjskim itd.
Wystarczy spojrzeć wstecz na wpływ, jaki R1 miał, aby przewidzieć, jak R2 może wpłynąć na rynki globalne. Wydanie R1 doprowadziło do ogromnego spadku na giełdzie, a akcje NVIDIA, kryptowaluty i akcje globalne spadły w dniach następujących po wydaniu. To mnie wtedy zachwyciło, ponieważ prawie nigdy wcześniej nie widzieliśmy czegoś takiego.

Dlaczego tak się stało? Cóż, częściowo dlatego, że R1 został zbudowany przy użyciu mniej wydajnych, starszych chipów NVIDIA, a nie najnowszych, więc najnowsza technologia NVIDIA stała się mniej wartościowa i imponująca z tego punktu widzenia. Przyniosła również dużą konkurencję głównym zachodnim gigantom technologii AI, co doprowadziło do niższych wycen dla nich i ich produktów.
Wprowadzenie R2 może mieć podobny wpływ. Może zakłócić dominację dużych firm AI, takich jak OpenAI i Google, wstrząsając krajobrazem po raz kolejny i udowadniając, że niekoniecznie trzeba używać absolutnie najnowocześniejszych, najnowszych i najlepszych chipów i innych elementów sprzętu, aby tworzyć niesamowite modele AI.

Sekret sukcesu DeepSeek
W tym momencie możesz się zastanawiać „Jaki jest sekret niesamowitej historii sukcesu DeepSeek?” Cóż, myślę, że mam odpowiedź. Kluczem do sukcesu DeepSeek było to, jak szybko wprowadzali innowacje w rozwoju AI, odważnie myśląc nieszablonowo i robiąc rzeczy inaczej niż duże, ugruntowane firmy.
Innowacje w technologii
Dużą częścią tego była duża inwestycja w komputery. Firma macierzysta DeepSeek włożyła dużo pieniędzy w zakup sprzętu komputerowego, takiego jak najnowocześniejsze klastry superkomputerowe, takie jak Firefly, które wykorzystują tysiące chipów NVIDIA 800 po znacznie niższych kosztach niż najnowsze chipy, co pozwoliło DeepSeek na zbudowanie niesamowitej AI przy stosunkowo niewielkim budżecie.
W rzeczywistości kryje się za tym całkiem ciekawa historia. Firma stojąca za DeepSeek wydała około 1,2 miliarda juanów na dwa z tych klastrów superkomputerowych AI w 2020 i 2021 roku. Klastry te składały się z około 10 000 chipów NVIDIA 800, a te zakupy przyciągnęły uwagę niektórych dużych organów regulacyjnych w Chinach.

Te organy zapytały DeepSeek , dlaczego kupują tak wiele chipów, a zespół musiał wyjaśnić, nad czym pracują. W końcu otrzymali „całkowite oczyszczenie” od organów regulacyjnych, co pozwoliło im kontynuować. Tymczasem zachodnie firmy AI używają jeszcze więcej – nawet 50 000 – high-endowych chipów NVIDIA, których eksport do Chin został dosłownie zakazany.
DeepSeek musiał więc radzić sobie z układami o niższej jakości, ale mimo to działał, skupiając się na wydajności, a nie na szczytowej wydajności, i wydobywając jak najwięcej wartości z dostępnych komponentów. Oznacza to również niższe koszty obliczeniowe i narzuty, które są przerzucane na użytkowników końcowych – ludzi takich jak ja i ty.
Ustanawianie standardu
Gdy DeepSeek miał już tę początkową infrastrukturę, mógł kontynuować swoje innowacje, skalować swoją pracę i ekonomicznie rozwijać różne modele i systemy AI. Osiągnęli nawet punkt, w którym ich model jest zaledwie 4,5 punktu od bycia oficjalnie najlepszym na świecie w testach porównawczych.

To dla mnie oszałamiające i jeszcze bardziej ekscytuje mnie R2. Ponieważ jeśli R1 jest tak blisko bycia najlepszym w branży, R2 prawie na pewno będzie pchać się o wiele wyżej i osiągnie o wiele więcej. Będzie bardzo ekscytujące zobaczyć, jak imponujący jest R2, jak wypada w porównaniu z innymi modelami i jak inne firmy będą musiały nadrobić zaległości z DeepSeek, gdy zostanie wydany.
Uczciwe ceny
Jest też czynnik cenowy. DeepSeek był dostępny i osiągalny w znacznie niższych cenach niż jakikolwiek inny główny model AI na rynku. Porównałem wykresy cenowe w momencie premiery R1 i różnica była oszałamiająca. A wiele osób szybko porzuciło swoje subskrypcje OpenAI i zaczęło masowo korzystać z DeepSeek , gdy zobaczyło, jak dobry i tani jest.
Widzieliśmy nawet, że OpenAI musiało szybko obniżyć ceny swoich pakietów, ponieważ DeepSeek była nawet 40 razy tańsza od tej, którą pobierało wówczas OpenAI , co do dziś mnie zadziwia, gdy o tym myślę.

Oczywiście, na razie niewiele wiemy o cenie R2, ale nie spodziewam się, że DeepSeek zmieni taktykę za bardzo wraz z nowym modelem. Nadal powinna to być niedroga opcja, dająca jak największej liczbie osób dostęp do zaawansowanej technologii AI bez zmuszania ich do wydawania ogromnych kwot na miesięczne opłaty.
Ponadto, wraz z udostępnieniem tych nowych narzędzi przez DeepSeek na swoim wydarzeniu Open-Source, poprzeczka wejścia do rozwoju AI stała się jeszcze niższa i bardziej przystępna cenowo. Możliwe więc, że R2 może być jeszcze tańszy niż oryginalny model R1, co naprawdę wywołałoby fale sejsmiczne w całym świecie AI i nie tylko.
Przygotuj się na wydanie DeepSeek R2
Ogólnie rzecz biorąc, jestem naprawdę podekscytowany nadchodzącą wersją R2 od DeepSeek. Wszystkie znaki są pozytywne, sugerując, że ten nowy model open-source będzie jeszcze lepszy nie tylko od R1, ale od każdego innego modelu AI, jaki widzieliśmy do tej pory. Będzie szybszy, mądrzejszy i lepszy pod każdym względem, a może nawet dostaniemy za niego lepszą cenę. Bądźcie czujni, aby otrzymywać dalsze aktualizacje.