BrowserGPT

BrowserGPT

Udforsk den mest kraftfulde, alt-i-én ChatGPT-assistent til nettet.

Tjek BrowserGPT
Tjek BrowserGPT
Produktivitet
Google Doc

Skriv // for at nyde vores AI-hjælp, mens du skriver på Google Docs.

Gmail

Skriv // lav overbevisende e-mails og personlige svar.

Sidebjælke

Udforsk et mere kraftfuldt Bing sidebar-alternativ til Chrome.

Søgemaskine

Find HIX.AI's omfattende svar blandt typiske søgeresultater.

Hurtig opslagslinje

Vælg enhver tekst online for at oversætte, omskrive, opsummere osv.

Sociale medier
Twitter

Skriv // for at komponere kortfattet, men alligevel kraftfuldt Twitter-indlæg om den tendens.

Instagram

Skriv // for at oprette engagerende billedtekster til dine Instagram-opslag.

Facebook

Skriv // for at lave et udkast til interaktive Facebook-indlæg, der engagerer dit fællesskab.

Quora

Skriv // for at give værdifulde, opstemte svar på Quora.

Reddit

Skriv // for at lave Reddit-indlæg, der giver genklang med specifikke fællesskaber.

YouTube

Opsummer lange YouTube-videoer med et enkelt klik.

Hjem > AI Chat > DeepSeek R2: En banebrydende ny open source-model

DeepSeek R2: En banebrydende ny open source-model

Den offentlige udgivelse af DeepSeek R1 i januar 2025 ændrede AI-landskabet enormt. Men i dag vil jeg tale om det næste skridt i DeepSeeks udvikling, og måske det næste store spring fremad inden for AI-teknologi, som vi kender den: DeepSeek R2 .

Nylige fremskridt af DeepSeek

deepseek-r2-1.png

Dette har helt sikkert gået lidt under radaren, men DeepSeeks forskerteam afholdt for nylig et arrangement kaldet Open-Source Week. Under dette arrangement udgav DeepSeek teamet fem open source-repositorier for at vise de seneste fremskridt og AI-fremskridt, de har gjort.

De tre mest bemærkelsesværdige af disse værktøjer er:

  • FlashMLA : Dette er en effektiv MLA-dekodningskerne til Hopper GPU'er.
  • DeepEP : Det allerførste kommunikationsbibliotek til MoE-modeltræning og -inferens.
  • DeepGEMM : Et FP8 GEMM-bibliotek, der fungerer med både tætte og MoE GEMM'er.
deepseek-r2-2.png

Så hvad betyder alt dette egentlig?

Alle disse værktøjer er designet til at gøre det nemmere og mere effektivt at udvikle og strømline fremtidige AI-modeller og -produkter. Og det leder mig præcist videre til hovedemnet: DeepSeek R2.

DeepSeek R2: Den næste udvikling inden for AI

deepseek-r2-3.png

DeepSeeks Open-Source Week-begivenhed og de produkter, der vises der, hænger alle perfekt sammen med den kommende udgivelse af virksomhedens meget omtalte Reasoning 2- eller R2-model, som forventes at være en større opgradering i forhold til den tidligere DeepSeek R1-model.

For alle derude, som ikke har fulgt DeepSeek-relaterede nyheder og udgivelser, vil jeg gennemgå det grundlæggende:

DeepSeek R1 blev udviklet i Kina og lanceret i starten af ​​2025. Det var en stor begivenhed inden for AI-sfæren, og det førte delvist til salg af mere end 1 billion dollars fra det globale aktiemarked. Hvorfor? Fordi R1 var en så avanceret og revolutionerende model, der var mere end i stand til at konkurrere med de bedste AI-modeller fra de store vestlige mærker.

deepseek-r2-4.png

Test viste, at den på mange områder var tilsvarende eller bedre end lignende:

Det lykkedes at gøre alt dette, samtidig med at det var open source og gratis at få adgang til. Det var banebrydende på det tidspunkt, og jeg var en af ​​mange AI-entusiaster over hele kloden, der blev blæst bagover af historien: en lille kinesisk startup havde formået at opnå det samme niveau af teknologisk ekspertise som store milliardbrands som OpenAI.

Men det varede ikke længe efter R1's udgivelse, før jeg og mange andre spekulerede: "Hvad er det næste?"

deepseek-r2-5.png

En Reuters-rapport er for nylig udkommet, der afslører, at DeepSeeks udviklingsteam har travlt med at få R2-modellen rullet ud inden maj. Så vi får den muligvis meget snart, og jeg kan sige med sikkerhed: denne nye model vil ændre AI-landskabet endnu mere dramatisk end R1 gjorde.

Virkningen af ​​R2

Her er hvad jeg forventer af R2:

  • Det bliver ekstremt billigt, ligesom R1
  • Den vil matche eller endda overgå førende modeller som OpenAI's o3-full eller o3-high
  • Den vil overgå næsten alle andre modeller på markedet

Og det kommer meget snart, hvis man skal tro de seneste rapporter. Hangzhou-holdet, der arbejder på DeepSeek , virker virkelig ivrige efter at få det ud, og min personlige forudsigelse er, at vi måske ser det udgives lige efter den kinesiske Qingming Festival-ferie, som er den 6. maj, så hold øje med jeres kalendere.

Det siges også, at DeepSeek teamet fokuserer på at producere bedre kode end før og bedre ydeevne på en række sprog, ikke kun engelsk og kinesisk, som var hovedfokus og standardindstillinger med R1. Dette giver mening, da DeepSeek R1 viste sig populær over hele verden, og folk vil ønske at interagere med R2 på spansk, fransk, russisk osv.

Og vi behøver blot at se tilbage på den indflydelse R1 havde på at forudsige, hvordan R2 kunne påvirke de globale markeder. R1's udgivelse førte til et massivt fald på aktiemarkedet, hvor aktier, kryptovalutaer og globale aktier faldt i dagene efter udgivelsen. Det imponerede mig dengang, for vi havde næsten aldrig set noget lignende før.

deepseek-r2-6.png

Hvorfor skete det præcist? Dels fordi R1 blev bygget med mindre kraftfulde, ældre NVIDIA-chips, ikke de nyeste, så det gjorde NVIDIAs nyeste teknologi mindre værdifuld og imponerende set fra det synspunkt. Det medførte også stor konkurrence til de store vestlige AI-teknologigiganter, hvilket førte til lavere værdiansættelser for dem og deres produkter.

Lanceringen af ​​R2 kan have en lignende effekt. Det kan forstyrre dominansen hos de store AI-firmaer som OpenAI og Google, ryste landskabet endnu engang og bevise, at man ikke nødvendigvis behøver at bruge de absolut banebrydende, nyeste og bedste chips og andre hardwarestykker for at lave utrolige AI-modeller.

deepseek-r2-6-2.png

DeepSeeks hemmelighed bag succes

På dette tidspunkt undrer du dig måske over, "Hvad er hemmeligheden bag DeepSeeks utrolige succeshistorie?" Jeg tror, ​​jeg har svaret. Nøglen til DeepSeeks succes lå i, hvordan de hurtigt innoverede inden for AI-udvikling, turde tænke ud af boksen og gøre tingene anderledes end de store, etablerede virksomheder.

Innovation i teknologi

En stor del af dette var en stor investering i computere. DeepSeeks moderselskab investerede mange penge i at købe computerhardware, såsom avancerede supercomputerklynger, som Firefly, der bruger tusindvis af NVIDIA 800-chips til en meget lavere pris end de nyeste chips, hvilket giver DeepSeek mulighed for at bygge fantastisk AI på et relativt lille budget.

Faktisk er der en ret interessant historie bag det. Virksomheden bag DeepSeek brugte omkring 1,2 milliarder yuan på to af disse supercomputer-AI-klynger i 2020 og 2021. Disse klynger bestod af omkring 10.000 NVIDIA 800-chips, og disse køb tiltrak opmærksomhed fra nogle store regulerende myndigheder i Kina.

deepseek-r2-7.png

Disse organer spurgte DeepSeek , hvorfor de købte så mange chips, og teamet måtte forklare, hvad de arbejdede på. Til sidst fik de "alt klart" fra de regulerende myndigheder, hvilket tillod dem at fortsætte. I mellemtiden bruger vestlige AI-firmaer endnu flere – op til 50.000 – high-end NVIDIA-chips, der bogstaveligt talt er blevet forbudt at eksportere til Kina.

Så DeepSeek måtte håndtere chips af lavere kvalitet, men fik det alligevel til at fungere, med fokus på effektivitet frem for topydelse og ved at udvinde så meget værdi som muligt af de tilgængelige komponenter. Det betyder også lavere beregningsomkostninger og overheadomkostninger, som overføres til slutbrugerne – folk som dig og mig.

Sætter standarden

Da DeepSeek havde etableret den indledende infrastruktur, var de i stand til at fortsætte med deres innovationer, opskalere deres arbejde og omkostningseffektivt udvikle forskellige AI-modeller og -systemer. De nåede endda et punkt, hvor deres model kun er 4,5 point fra at være den officielle bedste i verden på benchmarktests.

deepseek-r2-8.png

Det er fuldstændig utroligt for mig, og det gør mig endnu mere begejstret for R2. For hvis R1 er så tæt på at være den bedste i branchen, vil R2 næsten helt sikkert presse langt højere og opnå så meget mere. Det bliver meget spændende at se, når R2 afslører, hvor imponerende den er, hvordan den klarer sig i forhold til andre modeller, og hvordan andre virksomheder bliver nødt til at indhente DeepSeek.

Fair Priser

Der er også prisfaktoren. DeepSeek var tilgængelig og tilgængelig til dramatisk lavere priser end nogen anden større AI-model på markedet. Jeg sammenlignede prislister på tidspunktet for R1's udgivelse, og forskellen var svimlende. Og mange mennesker opgav hurtigt deres OpenAI abonnementer og strømmede til DeepSeek , da de så, hvor godt og billigt det var.

Vi oplevede endda, at OpenAI hurtigt måtte reducere sine prisplaner, fordi DeepSeek var op til 40 gange billigere end OpenAI opkrævede på det tidspunkt, hvilket stadig blæser mig bagover, når jeg tænker tilbage på det.

deepseek-r2-9.png

Vi ved selvfølgelig ikke meget om R2's prisfastsættelse endnu, men jeg forventer ikke, at DeepSeek ændrer taktik for meget med den nye model. Det burde stadig være en overkommelig mulighed, der giver så mange mennesker som muligt adgang til avanceret AI-teknologi uden at tvinge dem til at bruge enorme beløb på månedlige gebyrer.

Plus, med DeepSeek , der lancerede disse nye værktøjer på deres Open Source-event, er adgangskravene til AI-udvikling blevet endnu lavere og mere overkommelige. Så det er muligt, at R2 kan være endnu billigere end den originale R1-model, som virkelig vil sende seismiske bølger gennem hele AI-verdenen og videre.

Gør dig klar til DeepSeek R2 -udgivelsen

Alt i alt er jeg virkelig begejstret for den kommende R2-udgivelse fra DeepSeek. Alt tyder på, at denne nye open source-model bliver endnu bedre end ikke bare R1, men enhver anden AI-model, vi har set indtil videre. Den bliver hurtigere, smartere og bedre på alle måder, og vi får måske endda en bedre pris for den. Hold øje med yderligere opdateringer.

Relaterede indlæg

Se mere