BrowserGPT

BrowserGPT

Explore o assistente ChatGPT completo e mais poderoso para a web.

Verifique o BrowserGPT
Verifique o BrowserGPT
Produtividade
Google Doc

Digite // para aproveitar nossa assistência de IA enquanto escreve no Google Docs.

Gmail

Digite // crie e-mails atraentes e respostas personalizadas.

Barra Lateral

Explore uma alternativa de barra lateral Bing mais poderosa para o Chrome.

Mecanismo de busca

Encontre respostas abrangentes do HIX.AI entre resultados de pesquisa típicos.

Barra de pesquisa rápida

Selecione qualquer texto online para traduzir, reescrever, resumir, etc.

Mídia social
Twitter

Digite // para compor postagens Twitter concisas, mas poderosas, sobre essa tendência.

Instagram

Digite // para criar legendas envolventes para suas postagens no Instagram.

Facebook

Digite // para redigir postagens interativas do Facebook que envolvam sua comunidade.

Quora

Digite // para fornecer respostas valiosas e votadas positivamente em Quora.

Reddit

Digite // para criar postagens Reddit que tenham repercussão em comunidades específicas.

YouTube

Resuma vídeos longos do YouTube com um clique.

Lar > Bate-papo com IA > DeepSeek R2: Um novo modelo de código aberto revolucionário

DeepSeek R2: Um novo modelo de código aberto revolucionário

O lançamento público do DeepSeek R1 em janeiro de 2025 mudou enormemente o panorama da IA. Mas, hoje, vou falar sobre o próximo passo na evolução do DeepSeek e talvez o próximo grande salto na tecnologia de IA como a conhecemos: DeepSeek R2 .

Avanços recentes do DeepSeek

deepseek-r2-1. png

Isto passou definitivamente despercebido, mas a equipa de investigação da DeepSeek organizou recentemente um evento chamado Open-Source Week. Durante o evento, a equipa do DeepSeek lançou cinco repositórios de código aberto para mostrar o progresso recente e os avanços na IA que têm vindo a fazer.

As três ferramentas mais notáveis ​​são:

  • FlashMLA : Este é um kernel de descodificação MLA eficiente para GPUs Hopper.
  • DeepEP : a primeira biblioteca de comunicação para treino e inferência de modelos MoE.
  • DeepGEMM : Uma biblioteca FP8 GEMM que funciona com GEMMs densos e MoE.
deepseek-r2-2. png

Então, o que significa tudo isto realmente?

Pois bem, todas estas ferramentas são concebidas para tornar mais fácil e eficiente o desenvolvimento e a otimização de futuros modelos e produtos de IA. E isto leva-me diretamente ao tópico principal da discussão: DeepSeek R2.

DeepSeek R2: A próxima evolução na IA

deepseek-r2-3. png

O evento Open-Source Week da DeepSeek e os produtos aí apresentados estão todos perfeitamente alinhados com o próximo lançamento do tão aguardado modelo Reasoning 2 ou R2 da empresa, que deverá ser uma grande actualização em relação ao modelo anterior DeepSeek R1.

Para quem não acompanha as notícias e lançamentos relacionados com o DeepSeek, vou explicar o básico:

O DeepSeek R1 foi desenvolvido na China e lançado no início de 2025. Foi um grande evento na esfera da IA ​​​​e levou parcialmente à venda de mais de 1 bilião de dólares no mercado global de ações. Porquê? Porque o R1 era um modelo tão avançado e revolucionário, mais do que capaz de competir com os melhores modelos de IA das grandes marcas ocidentais.

deepseek-r2-4.png

Os testes mostraram que ele era, em muitas áreas, equivalente ou melhor do que:

Conseguiu fazer tudo isto sendo de código aberto e de acesso gratuito. Foi inovador na altura, e eu fui um dos muitos entusiastas da IA ​​em todo o mundo que ficaram impressionados com a história: uma pequena startup chinesa conseguiu atingir o mesmo nível de excelência tecnológica de grandes marcas multibilionárias como a OpenAI.

Mas não demorou muito tempo depois do lançamento do R1 para que eu e muitos outros nos perguntássemos: "O que vem a seguir?"

deepseek-r2-5.png

Pois bem, foi recentemente publicada uma notícia da Reuters, revelando que a equipa de desenvolvimento da DeepSeek está com pressa para lançar o modelo R2 até Maio. Assim, poderemos tê-lo muito em breve, e posso dizer com toda a certeza: este novo modelo vai mudar o panorama da IA ​​de forma ainda mais drástica do que o R1.

O Impacto do R2

Eis o que espero do R2:

  • Será extremamente barato, assim como o R1
  • Igualará ou até mesmo superará modelos líderes como o3-full ou o3-high da OpenAI
  • Superará quase todos os outros modelos do mercado

E isso vai acontecer muito em breve, se tivermos em conta os últimos relatos. A equipa de Hangzhou que trabalha no DeepSeek parece realmente ansiosa por lançá-lo, e a minha previsão pessoal é que possa ser lançado logo após o feriado do Festival Qingming Chinês, que é no dia 6 de maio, por isso, fiquem atentos ao vosso calendário.

A equipa do DeepSeek também se está a concentrar em produzir código superior ao anterior e melhor desempenho numa variedade de idiomas, não apenas inglês e chinês, que eram os principais focos e opções padrão do R1. Isto faz sentido, uma vez que o DeepSeek R1 se mostrou popular em todo o mundo, e as pessoas vão querer interagir com o R2 em espanhol, francês, russo, etc.

E só precisamos de olhar para o impacto que o R1 teve para prever como o R2 poderá afectar os mercados globais. O lançamento do R1 levou a uma enorme queda no mercado de ações, com as ações da NVIDIA, as criptomoedas e as ações globais a caírem nos dias seguintes ao seu lançamento. Isso impressionou-me na altura, porque quase nunca tínhamos visto algo semelhante antes.

deepseek-r2-6.png

Por que razão isso aconteceu exatamente? Bem, em parte porque o R1 foi construído utilizando chips NVIDIA mais antigos e menos potentes, e não os mais recentes, o que tornou a mais recente tecnologia da NVIDIA menos valiosa e impressionante deste ponto de vista. Também trouxe uma grande concorrência aos grandes gigantes ocidentais da tecnologia de IA, levando a avaliações mais baixas para os mesmos e para os seus produtos.

O lançamento do R2 pode ter um impacto semelhante. Isto poderá perturbar o domínio das grandes empresas de IA, como a OpenAI e a Google, abalando o cenário mais uma vez e provando que não tem necessariamente de utilizar os chips e outras peças de hardware mais recentes e de última geração para criar modelos de IA incríveis.

deepseek-r2-6-2.png

O segredo do sucesso do DeepSeek

Por esta altura, deve estar a perguntar-se: “Qual é o segredo por detrás da incrível história de sucesso do DeepSeek?” Bem, acho que tenho a resposta. A chave para o sucesso da DeepSeek esteve na rapidez com que inovaram no desenvolvimento da IA, ousando pensar fora da caixa e fazer as coisas de forma diferente das grandes empresas estabelecidas.

Inovação em Tecnologia

Uma grande parte disso foi um grande investimento em computação. A empresa-mãe da DeepSeek investiu muito dinheiro na compra de hardware de computação, como clusters de supercomputação de última geração, como o Firefly, que utiliza milhares de chips NVIDIA 800 a um custo muito mais baixo do que os chips mais recentes, permitindo à DeepSeek criar uma IA incrível com um orçamento relativamente pequeno.

Na verdade, há uma história bastante interessante por trás. A empresa por detrás do DeepSeek gastou cerca de 1,2 mil milhões de yuans em dois destes clusters de IA de supercomputação em 2020 e 2021. Estes clusters eram compostos por cerca de 10.000 chips NVIDIA 800, e estas compras atraíram a atenção de alguns grandes organismos reguladores na China.

deepseek-r2-7.png

Estes organismos perguntaram à DeepSeek porque estavam a comprar tantos chips, e a equipa teve de explicar no que estava a trabalhar. No final, obtiveram a autorização das autoridades reguladoras, o que lhes permitiu prosseguir. Entretanto, as empresas ocidentais de IA estão a utilizar ainda mais — até 50.000 — chips NVIDIA de gama alta, cuja exportação para a China foi literalmente proibida.

Assim, a DeepSeek teve de lidar com chips de menor qualidade, mas ainda assim fez o sistema funcionar, concentrando-se na eficiência em vez do desempenho máximo e extraindo o máximo valor possível dos componentes disponíveis. Isto também significa menores custos computacionais e despesas gerais, que são passados ​​para os utilizadores finais — pessoas como eu e tu.

Definindo o Padrão

Depois de a DeepSeek ter estabelecido a infraestrutura inicial, puderam prosseguir as suas inovações, alargando o seu trabalho e desenvolvendo diferentes modelos e sistemas de IA de forma económica. Chegaram mesmo a um ponto em que o seu modelo está a apenas 4,5 pontos de ser o melhor oficialmente do mundo em testes de benchmark.

deepseek-r2-8.png

Isto é de fazer cair o queixo para mim e deixa-me ainda mais entusiasmado com o R2. Porque se o R1 está tão perto de ser o melhor no negócio, o R2 irá certamente muito mais longe e conquistará muito mais. Será muito entusiasmante ver o quão impressionante será quando o R2 for lançado, como se irá sair em comparação com outros modelos e como outras empresas terão de tentar alcançar o DeepSeek.

Preços justos

Há também o fator preço. O DeepSeek estava disponível e acessível a preços muito mais baratos do que qualquer outro grande modelo de IA no mercado. Comparei as tabelas de preços na altura do lançamento do R1 e a diferença foi impressionante. E muitas pessoas rapidamente abandonaram as suas subscrições OpenAI e migraram para o DeepSeek quando viram o quão bom e barato era.

Vimos até a OpenAI a ter de reduzir rapidamente os seus planos de preços, porque o DeepSeek era até 40 vezes mais barato do que a OpenAI cobrava na altura, o que ainda me impressiona quando penso nisso.

deepseek-r2-9.png

Claro que ainda não sabemos muito sobre o preço do R2, mas não espero que a DeepSeek mude muito de tática com o novo modelo. Deve ainda ser uma opção acessível, dando ao maior número possível de pessoas acesso à tecnologia de IA de ponta sem as obrigar a gastar grandes quantias em taxas mensais.

Além disso, com a DeepSeek a lançar estas novas ferramentas no seu evento Open-Source, o nível de exigência para o desenvolvimento de IA tornou-se ainda mais reduzido e acessível. Assim, é possível que o R2 seja ainda mais barato do que o modelo R1 original, o que realmente causaria impacto em todo o mundo da IA ​​e não só.

Prepare-se para o lançamento do DeepSeek R2

No geral, estou muito entusiasmado com o próximo lançamento do R2 da DeepSeek. Todos os sinais são positivos, sugerindo que este novo modelo de código aberto será ainda melhor do que não só o R1, mas qualquer outro modelo de IA que vimos até agora. Será mais rápido, mais inteligente e superior em todos os aspetos, e podemos até conseguir um preço melhor por ele. Fique atento para mais atualizações.

Postagens relacionadas

Veja mais