Il rilascio pubblico di DeepSeek R1 nel gennaio 2025 ha cambiato radicalmente il panorama dell'intelligenza artificiale. Ma oggi parlerò del passo successivo nell'evoluzione di DeepSeek, e forse del prossimo grande balzo in avanti nella tecnologia dell'intelligenza artificiale così come la conosciamo: DeepSeek R2 .
Recenti progressi di DeepSeek

La questione è sicuramente passata un po' inosservata, ma il team di ricerca di DeepSeek ha recentemente organizzato un evento chiamato Open-Source Week. Durante l'evento, il team DeepSeek ha rilasciato cinque repository open source per mostrare i recenti progressi e le innovazioni nell'intelligenza artificiale.
I tre più noti di questi strumenti sono:
- FlashMLA : si tratta di un kernel di decodifica MLA efficiente per GPU Hopper.
- DeepEP : la prima libreria di comunicazione per l'addestramento e l'inferenza di modelli MoE.
- DeepGEMM : una libreria GEMM FP8 che funziona sia con GEMM densi che MoE.

Quindi, cosa significa esattamente tutto questo?
Bene, tutti questi strumenti sono progettati per semplificare ed efficientemente lo sviluppo e la semplificazione di futuri modelli e prodotti di intelligenza artificiale. E questo mi porta direttamente all'argomento principale della discussione: DeepSeek R2.
DeepSeek R2: la prossima evoluzione dell'intelligenza artificiale

L'evento Open-Source Week di DeepSeek e i prodotti presentati in quell'occasione si collegano perfettamente all'imminente rilascio del tanto pubblicizzato modello Reasoning 2 o R2 dell'azienda, che si preannuncia come un importante aggiornamento rispetto al precedente modello DeepSeek R1.
Per chi non ha seguito le novità e le uscite relative a DeepSeek, ecco un breve riassunto delle nozioni di base:
DeepSeek R1 è stato sviluppato in Cina e lanciato all'inizio del 2025. È stato un evento importante nel settore dell'intelligenza artificiale e ha portato in parte alla vendita di oltre 1.000 miliardi di dollari sul mercato azionario globale. Perché? Perché R1 era un modello così avanzato e rivoluzionario, più che in grado di competere con i migliori modelli di intelligenza artificiale dei grandi marchi occidentali.

I test hanno dimostrato che, in molti ambiti, è equivalente o migliore di prodotti come:
- Claude
- GPT-4o
- OpenAI-o1-mini
- E molti altri
Riuscì a fare tutto questo pur essendo open source e di libero accesso. All'epoca fu un'iniziativa rivoluzionaria, e io fui uno dei tanti appassionati di intelligenza artificiale in tutto il mondo a rimanere sbalordito dalla storia: una piccola startup cinese era riuscita a raggiungere lo stesso livello di eccellenza tecnologica di enormi marchi multimiliardari come OpenAI.
Ma non passò molto tempo dall'uscita di R1 perché io e molti altri ci chiedessimo: "Cosa succederà adesso?"

Ebbene, un rapporto di Reuters pubblicato di recente rivela che il team di sviluppo di DeepSeek ha fretta di lanciare il modello R2 entro maggio. Quindi potremmo averlo molto presto, e posso dirvelo con certezza: questo nuovo modello cambierà il panorama dell'intelligenza artificiale in modo ancora più radicale di quanto abbia fatto R1.
L'impatto di R2
Ecco cosa mi aspetto da R2:
- Sarà estremamente economico, proprio come R1
- Sarà all'altezza o addirittura supererà modelli leader come o3-full o o3-high di OpenAI
- Supererà quasi tutti gli altri modelli sul mercato
E arriverà davvero presto, se le ultime notizie sono attendibili. Il team di Hangzhou che lavora su DeepSeek sembra davvero impaziente di pubblicarlo, e la mia previsione personale è che potremmo vederlo rilasciato subito dopo la festa cinese del Qingming, che cade il 6 maggio, quindi tenete d'occhio i vostri calendari.
Si dice anche che il team DeepSeek si stia concentrando sulla produzione di codice di qualità superiore rispetto a prima e su prestazioni migliori in una varietà di lingue, non solo in inglese e cinese, che erano i focus principali e le opzioni predefinite di R1. Questo è comprensibile, dato che DeepSeek R1 si è dimostrato popolare in tutto il mondo e gli utenti vorranno interagire con R2 in spagnolo, francese, russo, ecc.
E basta guardare indietro all'impatto che R1 ha avuto nel prevedere l'impatto di R2 sui mercati globali. Il lancio di R1 ha portato a un crollo enorme del mercato azionario, con titoli come NVIDIA, criptovalute e titoli azionari globali in calo nei giorni successivi al lancio. All'epoca, la cosa mi stupì, perché non avevamo quasi mai visto niente del genere prima.

Perché è successo esattamente? Beh, in parte perché R1 è stato realizzato utilizzando chip NVIDIA meno potenti e datati, non quelli più recenti, il che ha reso la tecnologia NVIDIA più recente meno preziosa e interessante da questo punto di vista. Ha anche portato una forte concorrenza ai principali giganti occidentali della tecnologia AI, con conseguente calo delle valutazioni per loro e per i loro prodotti.
Il lancio di R2 potrebbe avere un impatto simile. Potrebbe sconvolgere il dominio delle grandi aziende di intelligenza artificiale, come OpenAI e Google, sconvolgendo ancora una volta il panorama e dimostrando che non è necessario utilizzare chip e altri componenti hardware all'avanguardia, di ultima generazione, per realizzare modelli di intelligenza artificiale incredibili.

Il segreto del successo di DeepSeek
A questo punto, potresti chiederti "Qual è il segreto dell'incredibile successo di DeepSeek?". Beh, credo di aver trovato la risposta. La chiave del successo di DeepSeek è stata la rapidità con cui ha innovato nello sviluppo dell'intelligenza artificiale, osando pensare fuori dagli schemi e fare le cose in modo diverso dalle grandi aziende consolidate.
Innovazione nella tecnologia
Gran parte di questo è stato un ingente investimento nel computing. La società madre di DeepSeek ha investito molto nell'acquisto di hardware di calcolo, come cluster di supercomputing all'avanguardia come Firefly, che utilizza migliaia di chip NVIDIA 800 a un costo molto inferiore rispetto ai chip più recenti, consentendo a DeepSeek di sviluppare un'intelligenza artificiale straordinaria con un budget relativamente ridotto.
In effetti, c'è una storia piuttosto interessante dietro tutto questo. L'azienda dietro DeepSeek ha speso circa 1,2 miliardi di yuan per due di questi cluster di supercalcolo AI nel 2020 e nel 2021. Questi cluster erano composti da circa 10.000 chip NVIDIA 800 e questi acquisti hanno attirato l'attenzione di alcuni importanti enti regolatori in Cina.

Questi enti hanno chiesto a DeepSeek perché stessero acquistando così tanti chip, e il team ha dovuto spiegare a cosa stessero lavorando. Alla fine, hanno ottenuto il via libera dalle autorità di regolamentazione, che ha permesso loro di procedere. Nel frattempo, le aziende occidentali di intelligenza artificiale stanno utilizzando ancora più chip NVIDIA di fascia alta – fino a 50.000 – la cui esportazione in Cina è stata letteralmente vietata.
DeepSeek ha dovuto quindi gestire chip di qualità inferiore, ma è comunque riuscita a farcela, concentrandosi sull'efficienza piuttosto che sulle prestazioni di picco e sfruttando al massimo i componenti disponibili. Questo significa anche minori costi di elaborazione e overhead, che vengono trasferiti agli utenti finali – persone come me e te.
Impostazione dello standard
Una volta consolidata l'infrastruttura iniziale, DeepSeek è stata in grado di portare avanti le proprie innovazioni, ampliando il proprio lavoro e sviluppando in modo economicamente efficiente diversi modelli e sistemi di intelligenza artificiale. Ha persino raggiunto un punto in cui il suo modello è a soli 4,5 punti di distanza, nei test di benchmark, dal primato ufficiale al mondo.

È incredibile per me, e mi entusiasma ancora di più per R2. Perché se R1 è così vicino a essere il migliore del settore, R2 quasi certamente si spingerà molto più in alto e otterrà molto di più. Sarà emozionante vedere quando R2 verrà rilasciato quanto sarà impressionante, come si comporterà rispetto ad altri modelli e come le altre aziende dovranno recuperare terreno rispetto a DeepSeek.
Prezzi equi
C'è anche il fattore prezzo. DeepSeek era disponibile e accessibile a prezzi notevolmente inferiori rispetto a qualsiasi altro importante modello di intelligenza artificiale sul mercato. Ho confrontato le tabelle dei prezzi al momento del rilascio di R1 e la differenza era impressionante. E molte persone hanno rapidamente abbandonato i loro abbonamenti a OpenAI per passare a DeepSeek quando hanno visto quanto fosse valido e conveniente.
Abbiamo addirittura visto OpenAI costretta a ridurre rapidamente i suoi piani tariffari, perché DeepSeek era fino a 40 volte più economico di quanto OpenAI applicasse in quel momento, il che mi lascia ancora sbalordito quando ci ripenso.

Naturalmente, non sappiamo ancora molto sul prezzo di R2, ma non mi aspetto che DeepSeek cambi troppo strategia con il nuovo modello. Dovrebbe comunque essere un'opzione conveniente, offrendo al maggior numero possibile di persone l'accesso a tecnologie di intelligenza artificiale di fascia alta senza costringerle a spendere cifre esorbitanti in canoni mensili.
Inoltre, con il lancio di questi nuovi strumenti da DeepSeek al suo evento Open Source, l'accesso allo sviluppo di IA si è ulteriormente abbassato e reso più accessibile. È quindi possibile che R2 sia ancora più economico del modello R1 originale, il che avrebbe davvero un impatto profondo sull'intero mondo dell'IA e oltre.
Preparati per il rilascio DeepSeek R2
Nel complesso, sono davvero entusiasta dell'imminente rilascio di R2 da parte di DeepSeek. Tutti i segnali sono positivi, il che suggerisce che questo nuovo modello open source sarà persino migliore non solo di R1, ma di qualsiasi altro modello di intelligenza artificiale visto finora. Sarà più veloce, più intelligente e superiore sotto ogni aspetto, e potremmo persino ottenerlo a un prezzo migliore. Restate sintonizzati per ulteriori aggiornamenti.