BrowserGPT

BrowserGPT

Explora el asistente ChatGPT todo en uno más potente para la web.

Comprobar BrowserGPT
Comprobar BrowserGPT
Productividad
Google Doc

Escribe // para disfrutar de nuestra asistencia de IA mientras escribes en Google Docs.

Gmail

Escriba // cree correos electrónicos atractivos y respuestas personalizadas.

Barra Lateral

Explora una alternativa de barra lateral Bing más potente para Chrome.

Buscador

Encuentre las respuestas completas de HIX.AI entre los resultados de búsqueda típicos.

Barra de búsqueda rápida

Seleccione cualquier texto en línea para traducir, reescribir, resumir, etc.

Medios de comunicación social
Twitter

Escriba // para redactar publicaciones Twitter concisas pero poderosas que sean tendencia.

Instagram

Escribe // para crear subtítulos atractivos para tus publicaciones de Instagram.

Facebook

Escriba // para redactar publicaciones interactivas de Facebook que atraigan a su comunidad.

Quora

Escriba // para proporcionar respuestas valiosas y votadas a favor en Quora.

Reddit

Escriba // para crear publicaciones Reddit que resuenen en comunidades específicas.

YouTube

Resume vídeos largos de YouTube con un solo clic.

Hogar > Chat de IA > DeepSeek R2: Un nuevo modelo de código abierto que cambia las reglas del juego

DeepSeek R2: Un nuevo modelo de código abierto que cambia las reglas del juego

El lanzamiento público de DeepSeek R1 en enero de 2025 cambió drásticamente el panorama de la IA. Pero hoy hablaré sobre el siguiente paso en la evolución de DeepSeek, y quizás el próximo gran avance en la tecnología de IA tal como la conocemos: DeepSeek R2 .

Avances recientes de DeepSeek

búsqueda profunda-r2-1.png

Esto ha pasado bastante desapercibido, pero el equipo de investigación de DeepSeek organizó recientemente un evento llamado "Semana del Código Abierto". Durante dicho evento, el equipo de DeepSeek publicó cinco repositorios de código abierto para mostrar los avances recientes en IA.

Las tres herramientas más destacadas son:

  • FlashMLA : este es un kernel de decodificación MLA eficiente para GPU Hopper.
  • DeepEP : la primera biblioteca de comunicación para el entrenamiento e inferencia de modelos MoE.
  • DeepGEMM : una biblioteca GEMM FP8 que funciona con GEMM densos y MoE.
búsqueda profunda-r2-2.png

Entonces, ¿qué significa todo esto realmente?

Bueno, todas estas herramientas están diseñadas para facilitar y hacer más eficiente el desarrollo y la optimización de futuros modelos y productos de IA. Y esto me lleva directamente al tema principal de discusión: DeepSeek R2.

DeepSeek R2: La próxima evolución en IA

búsqueda profunda-r2-3.png

El evento de la Semana de Código Abierto de DeepSeek y los productos exhibidos allí se vinculan perfectamente con el próximo lanzamiento del muy publicitado modelo Reasoning 2 o R2 de la compañía, que será una importante actualización respecto del modelo anterior DeepSeek R1.

Para cualquiera que no haya estado siguiendo las noticias y lanzamientos relacionados con DeepSeek, desglosaré los conceptos básicos:

DeepSeek R1 se desarrolló en China y se lanzó a principios de 2025. Fue un acontecimiento importante en el ámbito de la IA y, en parte, impulsó la venta de más de un billón de dólares en el mercado bursátil global. ¿Por qué? Porque R1 era un modelo avanzado y revolucionario, capaz de competir con los mejores modelos de IA de las grandes marcas occidentales.

búsqueda profunda-r2-4.png

Las pruebas demostraron que, en muchas áreas, era equivalente o mejor que productos como:

Logró todo esto siendo de código abierto y de libre acceso. Fue una innovación en su momento, y fui uno de los muchos entusiastas de la IA de todo el mundo que quedaron maravillados con la historia: una pequeña startup china había logrado el mismo nivel de excelencia tecnológica que grandes marcas multimillonarias como OpenAI.

Pero no pasó mucho tiempo después del lanzamiento de R1 para que yo y muchos otros nos preguntáramos: "¿Qué sigue?"

búsqueda profunda-r2-5.png

Bueno, un informe de Reuters se publicó recientemente y revela que el equipo de desarrollo de DeepSeek tiene prisa por implementar el modelo R2 para mayo. Así que podríamos tenerlo muy pronto, y puedo asegurarles que este nuevo modelo cambiará el panorama de la IA aún más drásticamente que el R1.

El impacto de R2

Esto es lo que espero de R2:

  • Será extremadamente barato, igual que el R1.
  • Igualará o incluso superará a modelos líderes como o3-full o o3-high de OpenAI.
  • Superará a casi todos los demás modelos del mercado.

Y llegará muy pronto, según los últimos informes. El equipo de Hangzhou que trabaja en DeepSeek parece estar deseando lanzarlo, y mi predicción personal es que podríamos verlo justo después del Festival Qingming chino, que se celebra el 6 de mayo, así que estén atentos a sus calendarios.

También se dice que el equipo de DeepSeek se centra en producir código superior al anterior y un mejor rendimiento en diversos idiomas, no solo en inglés y chino, que eran los principales enfoques y opciones predeterminadas con R1. Esto tiene sentido, ya que DeepSeek R1 se popularizó en todo el mundo y la gente querrá interactuar con R2 en español, francés, ruso, etc.

Y solo tenemos que recordar el impacto que tuvo R1 para predecir cómo R2 podría afectar los mercados globales. El lanzamiento de R1 provocó una caída masiva en el mercado bursátil, con acciones de NVIDIA, criptomonedas y valores globales cayendo en los días posteriores a su lanzamiento. Eso me impresionó en ese momento, porque casi nunca habíamos visto algo así.

búsqueda profunda-r2-6.png

¿Por qué ocurrió eso exactamente? Bueno, en parte porque la R1 se creó con chips NVIDIA menos potentes y antiguos, no con los más recientes, lo que hizo que la tecnología más reciente de NVIDIA perdiera valor e impacto. También generó una fuerte competencia para los grandes gigantes occidentales de la tecnología de IA, lo que resultó en una menor valoración de estos y sus productos.

El lanzamiento de R2 podría tener un impacto similar. Podría romper el dominio de las grandes empresas de IA, como OpenAI y Google, revolucionando el panorama una vez más y demostrando que no es necesario usar chips y otros dispositivos de hardware de vanguardia para crear modelos de IA increíbles.

búsqueda profunda-r2-6-2.png

El secreto del éxito de DeepSeek

A estas alturas, quizá te preguntes: "¿Cuál es el secreto del increíble éxito de DeepSeek?". Bueno, creo que tengo la respuesta. La clave del éxito de DeepSeek residió en su rápida innovación en el desarrollo de IA, atreviéndose a pensar de forma innovadora y a actuar de forma diferente a las grandes empresas consolidadas.

Innovación en tecnología

Gran parte de esto se debió a una fuerte inversión en informática. La empresa matriz de DeepSeek invirtió mucho dinero en la compra de hardware, como clústeres de supercomputación de última generación, como Firefly, que utiliza miles de chips NVIDIA 800 a un coste mucho menor que los chips más recientes, lo que permitió a DeepSeek desarrollar una IA asombrosa con un presupuesto relativamente bajo.

De hecho, hay una historia bastante interesante detrás de esto. La empresa detrás de DeepSeek invirtió alrededor de 1200 millones de yuanes en dos de estos clústeres de IA de supercomputación en 2020 y 2021. Estos clústeres estaban compuestos por unos 10 000 chips NVIDIA 800, y estas compras atrajeron la atención de algunos importantes organismos reguladores en China.

búsqueda profunda-r2-7.png

Estos organismos preguntaron a DeepSeek por qué compraban tantos chips, y el equipo tuvo que explicar en qué estaban trabajando. Finalmente, obtuvieron el visto bueno de las autoridades reguladoras, lo que les permitió seguir adelante. Mientras tanto, las empresas occidentales de IA utilizan aún más chips NVIDIA de gama alta (hasta 50 000), cuya exportación a China ha sido literalmente prohibida.

Así pues, DeepSeek tuvo que lidiar con chips de menor calidad, pero aun así logró funcionar, priorizando la eficiencia sobre el máximo rendimiento y extrayendo el máximo valor posible de los componentes disponibles. Esto también implica menores costos computacionales y gastos generales, que se trasladan a los usuarios finales, personas como tú y yo.

Estableciendo el estándar

Una vez establecida la infraestructura inicial, DeepSeek pudo impulsar sus innovaciones, ampliar su trabajo y desarrollar de forma rentable diferentes modelos y sistemas de IA. Incluso llegaron a un punto en el que su modelo está a solo 4,5 puntos de ser el mejor del mundo en las pruebas de referencia.

búsqueda profunda-r2-8.png

Esto me deja boquiabierto y me entusiasma aún más con R2. Porque si R1 está tan cerca de ser el mejor del sector, es casi seguro que R2 alcanzará un nivel mucho mayor y logrará mucho más. Será muy emocionante ver, cuando se lance R2, lo impresionante que es, cómo se compara con otros modelos y cómo otras empresas tendrán que ponerse al día con DeepSeek.

Precios justos

También está el factor precio. DeepSeek estaba disponible y era accesible a precios mucho más bajos que cualquier otro modelo importante de IA del mercado. Comparé las tablas de precios en el momento del lanzamiento de R1 y la diferencia era asombrosa. Mucha gente abandonó rápidamente sus suscripciones a OpenAI y se pasó a DeepSeek al ver lo bueno y económico que era.

Incluso vimos que OpenAI tuvo que reducir rápidamente sus planes de precios, porque DeepSeek era hasta 40 veces más barato que lo que OpenAI cobraba en ese momento, lo que todavía me sorprende cuando lo recuerdo.

búsqueda profunda-r2-9.png

Claro que aún no sabemos mucho sobre el precio de R2, pero no creo que DeepSeek cambie mucho de estrategia con el nuevo modelo. Debería seguir siendo una opción asequible, brindando al mayor número posible de personas acceso a tecnología de IA de vanguardia sin obligarlas a gastar grandes cantidades en cuotas mensuales.

Además, con el lanzamiento de estas nuevas herramientas por DeepSeek en su evento de código abierto, el acceso al desarrollo de IA se ha vuelto aún más accesible. Por lo tanto, es posible que el R2 sea incluso más económico que el modelo R1 original, lo que revolucionaría el mundo de la IA y más allá.

Prepárese para el lanzamiento de DeepSeek R2

En general, estoy muy entusiasmado con el próximo lanzamiento de la versión R2 de DeepSeek. Todo apunta a que este nuevo modelo de código abierto será incluso mejor que no solo la versión R1, sino cualquier otro modelo de IA que hayamos visto hasta ahora. Será más rápido, más inteligente y superior en todos los aspectos, e incluso podríamos conseguir un mejor precio. Manténganse al tanto de las novedades.

Artículos Relacionados

Ver más