BrowserGPT

BrowserGPT

Utforsk den kraftigste, alt-i-ett ChatGPT-assistenten for nettet.

Sjekk BrowserGPT
Sjekk BrowserGPT
Produktivitet
Google Doc

Skriv // for å nyte AI-hjelpen vår mens du skriver på Google Dokumenter.

Gmail

Skriv // lager overbevisende e-poster og personlig tilpassede svar.

Sidefelt

Utforsk et kraftigere Bing-sidefeltalternativ for Chrome.

Søkemotor

Finn HIX.AIs omfattende svar blant typiske søkeresultater.

Hurtigoppslagslinje

Velg hvilken som helst tekst på nettet for å oversette, omskrive, oppsummere osv.

Sosiale medier
Twitter

Skriv // for å komponere konsise, men kraftige Twitter-innlegg den trenden.

Instagram

Skriv // for å lage engasjerende bildetekster for Instagram-innleggene dine.

Facebook

Skriv // for å lage utkast til interaktive Facebook-innlegg som engasjerer fellesskapet ditt.

Quora

Skriv // for å gi verdifulle, oppstemte svar på Quora.

Reddit

Skriv // for å lage Reddit-innlegg som gir gjenklang med bestemte fellesskap.

YouTube

Oppsummer lange YouTube-videoer med ett klikk.

Hjem > AI Chat > DeepSeek R2: En banebrytende ny åpen kildekode-modell

DeepSeek R2: En banebrytende ny åpen kildekode-modell

Den offentlige lanseringen av DeepSeek R1 i januar 2025 endret AI-landskapet enormt. Men i dag skal jeg snakke om det neste trinnet i DeepSeeks utvikling, og kanskje det neste store spranget fremover innen AI-teknologi slik vi kjenner den: DeepSeek R2 .

Nylige fremskritt av DeepSeek

deepseek-r2-1.png

Dette har definitivt gått litt under radaren, men DeepSeeks forskerteam arrangerte nylig et arrangement kalt Open-Source Week. Under dette arrangementet ga DeepSeek-teamet ut fem åpen kildekode-repositorier for å vise den siste fremgangen og AI-fremskrittene de har gjort.

De tre mest bemerkelsesverdige av disse verktøyene er:

  • FlashMLA : Dette er en effektiv MLA-dekodingskjerne for Hopper GPU-er.
  • DeepEP : Det aller første kommunikasjonsbiblioteket for MoE-modelltrening og -inferens.
  • DeepGEMM : Et FP8 GEMM-bibliotek som fungerer med både tette og MoE GEMM-er.
deepseek-r2-2.png

Så, hva betyr egentlig alt dette?

Vel, alle disse verktøyene er utviklet for å gjøre det enklere og mer effektivt å utvikle og strømlinjeforme fremtidige AI-modeller og -produkter. Og det leder meg pent til hovedtemaet: DeepSeek R2.

DeepSeek R2: Den neste utviklingen innen AI

deepseek-r2-3.png

DeepSeeks Open-Source Week-arrangement og produktene som vises frem der, knytter seg pent til den kommende utgivelsen av selskapets mye omtalte Reasoning 2- eller R2-modell, som er satt til å bli en stor oppgradering i forhold til den forrige DeepSeek R1-modellen.

For alle der ute som ikke har fulgt med på DeepSeek-relaterte nyheter og utgivelser, vil jeg dele opp det grunnleggende:

DeepSeek R1 ble utviklet i Kina og lansert tidlig i 2025. Det var en stor begivenhet innen AI-sfæren, og det førte delvis til salg av mer enn 1 billion dollar fra det globale aksjemarkedet. Hvorfor? Fordi R1 var en så avansert og revolusjonerende modell, mer enn i stand til å konkurrere med de beste AI-modellene fra de store vestlige merkene.

deepseek-r2-4.png

Testing viste at den på mange områder var likeverdig med eller bedre enn slike som:

Den klarte å gjøre alt dette samtidig som den var åpen kildekode og gratis å bruke. Den var banebrytende på den tiden, og jeg var en av mange AI-entusiaster over hele verden som ble imponert over historien: en liten kinesisk oppstartsbedrift hadde klart å oppnå samme nivå av teknologisk fortreffelighet som store milliardmerker som OpenAI.

Men det tok ikke lang tid etter at R1 ble utgitt før jeg og mange andre lurte på: «Hva blir det neste?»

deepseek-r2-5.png

Vel, en Reuters-rapport kom nylig ut som avslørte at DeepSeeks utviklingsteam har det travelt med å få R2-modellen rullet ut innen mai. Så vi får den kanskje veldig snart, og jeg kan si deg sikkert: denne nye modellen kommer til å endre AI-landskapet enda mer dramatisk enn R1 gjorde.

Virkningen av R2

Her er hva jeg forventer av R2:

  • Den blir ekstremt billig, akkurat som R1
  • Den vil matche eller til og med overgå ledende modeller som OpenAIs o3-full eller o3-high
  • Den vil utkonkurrere nesten alle andre modeller på markedet

Og den kommer veldig snart, hvis man skal tro de siste rapportene. Hangzhou-teamet som jobber med DeepSeek virker veldig ivrige etter å få den ut, og min personlige spådom er at vi kan se den bli utgitt rett etter den kinesiske Qingming-festivalen, som er 6. mai, så følg med på kalenderne deres.

DeepSeek-teamet skal også fokusere på å produsere bedre kode enn før og bedre ytelse på en rekke språk, ikke bare engelsk og kinesisk, som var hovedfokusene og standardalternativene med R1. Dette gir mening, ettersom DeepSeek R1 viste seg å være populær over hele verden, og folk vil ønske å samhandle med R2 på spansk, fransk, russisk osv.

Og vi trenger bare å se tilbake på hvilken innvirkning R1 hadde på å forutsi hvordan R2 kunne påvirke de globale markedene. Utgivelsen av R1 førte til et massivt fall i aksjemarkedet, med fall i aksjer, kryptovaluta og globale aksjer for blant annet NVIDIA i dagene etter utgivelsen. Det imponerte meg den gangen, for vi hadde nesten aldri sett noe lignende før.

deepseek-r2-6.png

Hvorfor skjedde det, egentlig? Vel, delvis fordi R1 ble bygget med mindre kraftige, eldre NVIDIA-brikker, ikke de nyeste, så det gjorde NVIDIAs nyeste teknologi mindre verdifull og imponerende fra det synspunktet. Det førte også til stor konkurranse til de store vestlige AI-teknologigigantene, noe som førte til lavere verdsettelser for dem og produktene deres.

Lanseringen av R2 kan ha en lignende innvirkning. Det kan forstyrre dominansen til de store AI-selskapene, som OpenAI og Google, riste opp landskapet nok en gang og bevise at man ikke nødvendigvis trenger å bruke de absolutt nyeste og beste brikkene og annen maskinvare for å lage utrolige AI-modeller.

deepseek-r2-6-2.png

DeepSeeks hemmelighet bak suksess

På dette tidspunktet lurer du kanskje på «Hva er hemmeligheten bak DeepSeeks utrolige suksesshistorie?» Vel, jeg tror jeg har svaret. Nøkkelen til DeepSeeks suksess lå i hvordan de raskt innoverte innen AI-utvikling, turte å tenke utenfor boksen og gjøre ting annerledes enn de store, etablerte firmaene.

Innovasjon innen teknologi

En stor del av dette var en tung investering i databehandling. DeepSeeks morselskap investerte mye penger i å kjøpe databehandlingsmaskinvare, som toppmoderne superdataklynger, som Firefly, som bruker tusenvis av NVIDIA 800-brikker til en mye lavere kostnad enn de nyeste brikkene, noe som lar DeepSeek bygge fantastisk AI på et relativt lite budsjett.

Det er faktisk en ganske interessant historie bak det. Selskapet bak DeepSeek brukte rundt 1,2 milliarder yuan på to av disse superdatamaskin-AI-klyngene i 2020 og 2021. Disse klyngene besto av rundt 10 000 NVIDIA 800-brikker, og disse kjøpene vakte oppmerksomhet fra noen store reguleringsorganer i Kina.

deepseek-r2-7.png

Disse instansene spurte DeepSeek hvorfor de kjøpte så mange brikker, og teamet måtte forklare hva de jobbet med. Til slutt fikk de «klarsignal» fra reguleringsmyndighetene, noe som lot dem fortsette. I mellomtiden bruker vestlige AI-firmaer enda flere – opptil 50 000 – avanserte NVIDIA-brikker som bokstavelig talt har blitt forbudt for eksport til Kina.

Så DeepSeek måtte håndtere brikker av lavere kvalitet, men fikk det likevel til å fungere, med fokus på effektivitet fremfor topp ytelse, og å utvinne så mye verdi som mulig fra de tilgjengelige komponentene. Det betyr også lavere beregningskostnader og faste kostnader, som overføres til sluttbrukerne – folk som meg og deg.

Setter standarden

Da DeepSeek hadde etablert den første infrastrukturen, kunne de fortsette med innovasjonene sine, skalere opp arbeidet sitt og utvikle ulike AI-modeller og -systemer på en kostnadseffektiv måte. De nådde til og med et punkt der modellen deres bare er 4,5 poeng unna på benchmarktester fra å være den offisielt beste i verden.

deepseek-r2-8.png

Det er helt utrolig for meg, og det gjør meg enda mer begeistret for R2. For hvis R1 er så nær å være best i bransjen, vil R2 nesten helt sikkert presse seg langt høyere og oppnå så mye mer. Det blir veldig spennende å se når R2 slipper løs hvor imponerende den er, hvordan den presterer mot andre modeller, og hvordan andre firmaer må ta igjen DeepSeek.

Rimelig prising

Det er også prisfaktoren. DeepSeek var tilgjengelig og tilgjengelig til dramatisk lavere prispunkter enn noen annen større AI-modell på markedet. Jeg sammenlignet prisdiagrammer da R1 ble lansert, og forskjellen var svimlende. Og mange forlot raskt OpenAI-abonnementene sine og strømmet til DeepSeek da de så hvor bra og billig det var.

Vi så til og med at OpenAI måtte redusere prisplanene sine raskt, fordi DeepSeek var opptil 40 ganger billigere enn det OpenAI tok på den tiden, noe som fortsatt slår meg helt av banen når jeg tenker tilbake på det.

deepseek-r2-9.png

Selvfølgelig vet vi ikke mye om R2s prising ennå, men jeg forventer ikke at DeepSeek vil endre taktikk for mye med den nye modellen. Det bør fortsatt være et rimelig alternativ som gir så mange som mulig tilgang til avansert AI-teknologi uten å tvinge dem til å bruke enorme summer på månedlige avgifter.

I tillegg, etter at DeepSeek lanserte disse nye verktøyene på sitt Open Source-arrangement, ble inngangskravene til AI-utvikling enda lavere og rimeligere. Så det er mulig at R2 kan være enda billigere enn den originale R1-modellen, som virkelig ville sende seismiske bølger gjennom hele AI-verdenen og utover.

Gjør deg klar for DeepSeek R2-utgivelsen

Alt i alt er jeg veldig spent på den kommende R2-utgivelsen fra DeepSeek. Alt tyder på at denne nye modellen med åpen kildekode vil bli enda bedre enn ikke bare R1, men alle andre AI-modeller vi har sett så langt. Den kommer til å bli raskere, smartere og overlegen på alle måter, og vi kan til og med få en bedre pris for den også. Følg med for ytterligere oppdateringer.

Relaterte innlegg

Se mer