BrowserGPT

BrowserGPT

Ontdek de krachtigste, alles-in-één ChatGPT-assistent voor internet.

Controleer BrowserGPT
Controleer BrowserGPT
Productiviteit
Google Doc

Typ // om te profiteren van onze AI-assistentie terwijl u schrijft op Google Documenten.

Gmail

Type // maak boeiende e-mails en gepersonaliseerde antwoorden.

Zijbalk

Ontdek een krachtiger Bing zijbalkalternatief voor Chrome.

Zoekmachine

Vind de uitgebreide antwoorden van HIX.AI tussen de typische zoekresultaten.

Snelle opzoekbalk

Selecteer online een tekst om te vertalen, herschrijven, samen te vatten, enz.

Sociale media
Twitter

Type // om beknopte maar krachtige Twitter-posts samen te stellen die deze trend volgen.

Instagram

Typ // om boeiende ondertiteling voor je Instagram-berichten te maken.

Facebook

Typ // om interactieve Facebook-berichten op te stellen die uw community betrekken.

Quora

Typ // om waardevolle, positieve antwoorden te geven op Quora.

Reddit

Type // om Reddit-berichten te maken die resoneren met specifieke communities.

YouTube

Vat lange YouTube-video's samen met één klik.

Thuis > AI-chat > DeepSeek R2: een baanbrekend nieuw open-sourcemodel

DeepSeek R2: een baanbrekend nieuw open-sourcemodel

De publieke release van DeepSeek R1 in januari 2025 veranderde het AI-landschap enorm. Maar vandaag ga ik het hebben over de volgende stap in de evolutie van DeepSeek, en misschien wel de volgende grote sprong voorwaarts in de AI-technologie zoals we die kennen: DeepSeek R2 .

Recente ontwikkelingen van DeepSeek

deepseek-r2-1.png

Dit is zeker enigszins onopgemerkt gebleven, maar het onderzoeksteam van DeepSeek organiseerde onlangs een evenement genaamd Open Source Week. Tijdens dat evenement publiceerde het DeepSeek -team vijf open source-repositories om de recente vooruitgang en AI-ontwikkelingen te laten zien.

De drie meest opvallende van deze tools zijn:

  • FlashMLA : Dit is een efficiënte MLA-decoderingskernel voor Hopper GPU's.
  • DeepEP : de allereerste communicatiebibliotheek voor MoE-modeltraining en -inferentie.
  • DeepGEMM : een FP8 GEMM-bibliotheek die werkt met zowel dichte als MoE GEMM's.
deepseek-r2-2.png

Maar wat betekent dit nu eigenlijk allemaal?

Al deze tools zijn ontworpen om het ontwikkelen en stroomlijnen van toekomstige AI-modellen en -producten eenvoudiger en efficiënter te maken. En dat brengt me naadloos bij het hoofdonderwerp van de discussie: DeepSeek R2.

DeepSeek R2: de volgende evolutie in AI

deepseek-r2-3.png

Het Open Source Week-evenement van DeepSeek en de daar getoonde producten sluiten allemaal naadloos aan bij de aanstaande release van het veelgeprezen Reasoning 2- of R2-model van het bedrijf. Dit model is een grote verbetering ten opzichte van het vorige DeepSeek R1-model.

Voor iedereen die het nieuws en de releases rondom DeepSeek nog niet heeft gevolgd, zal ik de basisprincipes uitleggen:

DeepSeek R1 werd ontwikkeld in China en gelanceerd begin 2025. Het was een belangrijke gebeurtenis in de AI-wereld en leidde mede tot de verkoop van meer dan 1 biljoen dollar op de wereldwijde aandelenmarkt. Waarom? Omdat R1 zo'n geavanceerd en revolutionair model was, dat perfect kon concurreren met de beste AI-modellen van de grote westerse merken.

deepseek-r2-4.png

Uit tests bleek dat het op veel vlakken gelijkwaardig of beter was dan onder andere:

Het is gelukt om dit alles te doen terwijl het open source en gratis toegankelijk was. Het was destijds baanbrekend en ik was een van de vele AI-fanaten wereldwijd die overdonderd waren door het verhaal: een kleine Chinese startup was erin geslaagd hetzelfde niveau van technologische excellentie te bereiken als grote miljardenmerken zoals OpenAI.

Maar het duurde niet lang na de release van R1 voordat ik en vele anderen ons afvroegen: "Wat is het volgende?"

deepseek-r2-5.png

Nou, er verscheen onlangs een Reuters-rapport waaruit bleek dat het ontwikkelteam van DeepSeek haast heeft om het R2-model vóór mei uit te rollen. Dus we krijgen het misschien heel snel, en ik kan je met zekerheid zeggen: dit nieuwe model gaat het AI-landschap nog drastischer veranderen dan R1.

De impact van R2

Dit is wat ik van R2 verwacht:

  • Het zal extreem goedkoop zijn, net als R1
  • Het zal de leidende modellen zoals OpenAI's o3-full of o3-high evenaren of zelfs overtreffen
  • Het zal bijna alle andere modellen op de markt overtreffen

En het komt er echt heel snel aan, als we de laatste berichten mogen geloven. Het team in Hangzhou dat aan DeepSeek werkt, lijkt er echt op gebrand om het uit te brengen, en mijn persoonlijke voorspelling is dat we het misschien net na het Chinese Qingmingfestival, op 6 mei, zullen zien verschijnen. Houd je agenda dus in de gaten.

Het DeepSeek -team zou zich ook richten op het produceren van superieure code en betere prestaties in diverse talen, niet alleen Engels en Chinees, wat de belangrijkste focuspunten en standaardopties van R1 waren. Dit is logisch, aangezien DeepSeek R1 wereldwijd populair bleek en mensen R2 in het Spaans, Frans, Russisch, enzovoort, willen gebruiken.

En we hoeven alleen maar terug te kijken naar de impact die R1 had om te voorspellen hoe R2 de wereldwijde markten zou kunnen beïnvloeden. De release van R1 leidde tot een enorme daling van de aandelenmarkt, met aandelen van NVIDIA, cryptovaluta en wereldwijde aandelen die in de dagen na de release allemaal daalden. Dat verbaasde me destijds, want zoiets hadden we bijna nog nooit eerder gezien.

deepseek-r2-6.png

Waarom gebeurde dat precies? Nou, deels omdat R1 gebouwd was met minder krachtige, oudere NVIDIA-chips, niet de nieuwste, waardoor NVIDIA's nieuwste technologie vanuit dat oogpunt minder waardevol en indrukwekkend werd. Het bracht ook grote concurrentie met zich mee voor de grote westerse AI-techgiganten, wat leidde tot lagere waarderingen voor hen en hun producten.

De lancering van R2 zou een vergelijkbare impact kunnen hebben. Het zou de dominantie van grote AI-bedrijven, zoals OpenAI en Google, kunnen verstoren, het landschap opnieuw op zijn kop kunnen zetten en bewijzen dat je niet per se de allernieuwste en beste chips en andere hardware nodig hebt om ongelooflijke AI-modellen te maken.

deepseek-r2-6-2.png

Het geheim van DeepSeek voor succes

Op dit punt vraag je je misschien af: "Wat is het geheim achter DeepSeeks ongelooflijke succesverhaal?" Nou, ik denk dat ik het antwoord heb. De sleutel tot DeepSeeks succes lag in de snelle innovatie in AI-ontwikkeling, waarbij ze buiten de gebaande paden durfden te denken en dingen anders deden dan de grote, gevestigde bedrijven.

Innovatie in technologie

Een groot deel hiervan was een forse investering in computing. Het moederbedrijf van DeepSeek stak veel geld in de aanschaf van computinghardware, zoals geavanceerde supercomputerclusters zoals Firefly. Deze clusters gebruiken duizenden NVIDIA 800-chips tegen veel lagere kosten dan de nieuwste chips, waardoor DeepSeek verbluffende AI kon bouwen met een relatief klein budget.

Daar zit eigenlijk een heel interessant verhaal achter. Het bedrijf achter DeepSeek heeft in 2020 en 2021 zo'n 1,2 miljard yuan uitgegeven aan twee van deze supercomputer-AI-clusters. Deze clusters bestonden uit zo'n 10.000 NVIDIA 800-chips, en deze aankopen trokken de aandacht van enkele grote regelgevende instanties in China.

deepseek-r2-7.png

Deze instanties vroegen DeepSeek waarom ze zoveel chips kochten, en het team moest uitleggen waar ze aan werkten. Uiteindelijk kregen ze groen licht van de toezichthouders, waardoor ze verder konden. Ondertussen gebruiken westerse AI-bedrijven nog meer – tot wel 50.000 – high-end NVIDIA-chips die letterlijk verboden zijn voor export naar China.

DeepSeek moest het dus doen met chips van mindere kwaliteit, maar zorgde er toch voor dat het werkte, met een focus op efficiëntie boven piekprestaties, en door zoveel mogelijk waarde te halen uit de beschikbare componenten. Dat betekent ook lagere rekenkosten en overheadkosten, die worden doorberekend aan de eindgebruikers – mensen zoals jij en ik.

De standaard bepalen

Nadat DeepSeek die initiële infrastructuur eenmaal had opgezet, konden ze hun innovaties voortzetten, hun werk opschalen en kostenefficiënt verschillende AI-modellen en -systemen ontwikkelen. Ze bereikten zelfs een punt waarop hun model in benchmarktests slechts 4,5 punten verwijderd is van de officiële beste ter wereld.

deepseek-r2-8.png

Dat vind ik echt verbijsterend, en het maakt me nog enthousiaster over R2. Want als R1 zo dicht bij de beste in de branche zit, zal R2 vrijwel zeker nog veel hoger mikken en nog veel meer bereiken. Het zal heel spannend zijn om te zien hoe indrukwekkend R2 is, hoe het presteert ten opzichte van andere modellen en hoe andere bedrijven DeepSeek zullen moeten inhalen.

Eerlijke prijzen

Dan is er nog de prijsfactor. DeepSeek was beschikbaar en toegankelijk voor aanzienlijk lagere prijzen dan elk ander groot AI-model op de markt. Ik vergeleek prijsgrafieken ten tijde van de release van R1 en het verschil was duizelingwekkend. Veel mensen zegden hun OpenAI abonnementen snel op en stapten massaal over op DeepSeek toen ze zagen hoe goed en goedkoop het was.

We zagen zelfs dat OpenAI snel zijn prijzen moest verlagen, omdat DeepSeek tot wel 40 keer goedkoper was dan wat OpenAI destijds vroeg. Als ik eraan terugdenk, vind ik dat nog steeds verbazingwekkend.

deepseek-r2-9.png

Natuurlijk weten we nog niet veel over de prijs van R2, maar ik verwacht niet dat DeepSeek met het nieuwe model al te veel van tactiek zal veranderen. Het zou nog steeds een betaalbare optie moeten zijn, die zoveel mogelijk mensen toegang geeft tot geavanceerde AI-technologie zonder dat ze enorme maandelijkse kosten hoeven te betalen.

Bovendien is de drempel voor AI-ontwikkeling nu nog lager en betaalbaarder geworden, nu DeepSeek deze nieuwe tools tijdens zijn open-source-evenement heeft gelanceerd. Het is dus mogelijk dat R2 nog goedkoper wordt dan het oorspronkelijke R1-model, dat echt seismische golven door de hele AI-wereld en daarbuiten zou sturen.

Maak je klaar voor de release van DeepSeek R2

Over het algemeen ben ik erg enthousiast over de aanstaande R2-release van DeepSeek. Alle tekenen zijn positief en suggereren dat dit nieuwe open-sourcemodel nog beter zal zijn dan niet alleen R1, maar elk ander AI-model dat we tot nu toe hebben gezien. Het wordt in alle opzichten sneller, slimmer en superieur, en we krijgen er misschien zelfs een betere prijs voor. Blijf op de hoogte voor verdere updates.

gerelateerde berichten

Bekijk meer