DeepSeek R1'in Ocak 2025'te halka açık olarak piyasaya sürülmesi, yapay zeka manzarasını muazzam bir şekilde değiştirdi. Ancak bugün, DeepSeek'in evrimindeki bir sonraki adımdan ve belki de bildiğimiz haliyle yapay zeka teknolojisindeki bir sonraki büyük sıçramadan bahsedeceğim: DeepSeek R2 .
DeepSeek Son Gelişmeleri

Bu kesinlikle radarın altından bir şekilde geçiyordu, ancak DeepSeek'in araştırma ekibi yakın zamanda Açık Kaynak Haftası adlı bir etkinliğe ev sahipliği yaptı. Bu etkinlik sırasında DeepSeek ekibi, son dönemde kaydettikleri ilerlemeyi ve yapay zeka ilerlemelerini göstermek için beş açık kaynaklı depo yayınladı.
Bu araçların en dikkat çeken üçü şunlardır:
- FlashMLA : Bu, Hopper GPU'lar için verimli bir MLA kod çözme çekirdeğidir.
- DeepEP : MoE model eğitimi ve çıkarımı için ilk iletişim kütüphanesi.
- DeepGEMM : Hem yoğun hem de MoE GEMM'lerle çalışan bir FP8 GEMM kütüphanesi.

Peki, tüm bunlar aslında ne anlama geliyor?
Peki, tüm bu araçlar gelecekteki AI modellerini ve ürünlerini geliştirmeyi ve düzenlemeyi daha kolay ve daha verimli hale getirmek için tasarlanmıştır. Ve bu beni tartışmanın ana konusuna getiriyor: DeepSeek R2.
DeepSeek R2: Yapay Zekada Bir Sonraki Evrim

DeepSeek'in Açık Kaynak Haftası etkinliği ve orada sergilenen ürünler, şirketin çokça duyurulan Reasoning 2 veya R2 modelinin yakında piyasaya sürülmesiyle uyumlu. Bu model, önceki DeepSeek R1 modeline göre önemli bir yükseltme olacak.
DeepSeek ile ilgili haberleri ve duyuruları takip etmeyenler için temelleri anlatacağım:
DeepSeek R1, 2025'in başlarında Çin'de geliştirildi ve piyasaya sürüldü. Yapay zeka alanında büyük bir olaydı ve kısmen küresel hisse senedi piyasasından 1 trilyon dolardan fazla satışa yol açtı. Neden? Çünkü R1, büyük Batılı markaların en iyi yapay zeka modelleriyle rekabet edebilecek kadar gelişmiş, devrim niteliğinde bir modeldi.

Yapılan testler, birçok alanda aşağıdakilere eşdeğer veya daha iyi olduğunu gösterdi:
- Claude
- GPT-4o
- OpenAI-o1-mini
- Ve daha pek çokları
Tüm bunları açık kaynaklı ve erişimi ücretsiz olarak yapmayı başardı. O zamanlar çığır açıcıydı ve hikayeden etkilenen dünya çapındaki birçok AI tutkunundan biriydim: Küçük bir Çin girişimi, OpenAI gibi milyarlarca dolarlık devasa markalarla aynı teknolojik mükemmellik seviyesine ulaşmayı başarmıştı.
Ancak R1'in piyasaya sürülmesinden kısa bir süre sonra ben ve birçok kişi "Sırada ne var?" diye merak etmeye başladık.

Eh, yakın zamanda bir Reuters raporu çıktı ve DeepSeek'in geliştirme ekibinin R2 modelini Mayıs ayına kadar kullanıma sunmak için acele ettiğini ortaya koydu. Yani çok yakında alabiliriz ve size kesin olarak söyleyebilirim ki: bu yeni model yapay zeka manzarasını R1'den bile daha dramatik bir şekilde değiştirecek.
R2'nin Etkisi
R2'den beklentilerim şunlar:
- R1 gibi son derece ucuz olacak
- OpenAI'nin o3-full veya o3-high gibi önde gelen modelleriyle eşleşecek hatta onları geride bırakacak
- Piyasadaki diğer modellerin hemen hemen hepsinden daha iyi performans gösterecek
Ve son raporlara inanılacaksa, gerçekten çok yakında geliyor. DeepSeek üzerinde çalışan Hangzhou merkezli ekip bunu yayınlamak için gerçekten istekli görünüyor ve benim kişisel tahminim, 6 Mayıs'ta Çin Qingming Festivali tatilinden hemen sonra yayınlanacağı yönünde, bu yüzden takvimlerinizi takip edin.
DeepSeek ekibinin ayrıca, yalnızca R1'deki ana odak noktaları ve varsayılan seçenekler olan İngilizce ve Çince'nin yanı sıra, daha önce olduğundan daha üstün kod üretmeye ve bir dizi dilde daha iyi performans göstermeye odaklandığı söyleniyor. Bu mantıklıdır, çünkü DeepSeek R1 tüm dünyada popüler oldu ve insanlar R2 ile İspanyolca, Fransızca, Rusça vb. dillerinde etkileşim kurmak isteyecektir.
Ve R1'in küresel piyasaları nasıl etkileyebileceğini tahmin etmek için geriye dönüp R2'nin etkisine bakmamız yeterli. R1'in piyasaya sürülmesi, NVIDIA hisseleri, kripto paralar ve küresel hisse senetleri gibi hisse senetlerinin piyasaya sürülmesinden sonraki günlerde düşüşe geçmesiyle borsada büyük bir düşüşe yol açtı. Bu beni o zamanlar hayrete düşürdü çünkü daha önce buna benzer bir şey neredeyse hiç görmemiştik.

Tam olarak neden böyle oldu? Kısmen, R1'in daha az güçlü, eski NVIDIA çipleri kullanılarak yapılmış olması, en son olanlar değil, dolayısıyla NVIDIA'nın en son teknolojisini bu açıdan daha az değerli ve etkileyici hale getirdi. Ayrıca, büyük Batılı AI teknoloji devlerine büyük bir rekabet getirdi ve bu da onların ve ürünlerinin daha düşük değerlemelerine yol açtı.
R2'nin lansmanı da benzer bir etkiye sahip olabilir. OpenAI ve Google gibi büyük AI firmalarının hakimiyetini bozabilir, manzarayı bir kez daha sarsabilir ve inanılmaz AI modelleri yapmak için mutlaka en son teknoloji, en son ve en iyi çipleri ve diğer donanım parçalarını kullanmanız gerekmediğini kanıtlayabilir.

DeepSeek'in Başarısının Sırrı
Bu noktada, "DeepSeek'in inanılmaz başarı hikayesinin ardındaki sır nedir?" diye merak ediyor olabilirsiniz. Sanırım cevabı buldum. DeepSeek'in başarısının anahtarı, yapay zeka geliştirmede nasıl hızla yenilik yaptıkları, alışılmışın dışında düşünmeye ve büyük, yerleşik firmalardan farklı şeyler yapmaya cesaret etmeleriydi.
Teknolojide Yenilik
Bunun büyük bir kısmı bilişime yapılan ağır yatırımdı. DeepSeek'in ana şirketi, Firefly gibi en son teknoloji süper bilgisayar kümeleri gibi bilişim donanımları satın almak için çok para harcadı ve bu da en son yongalardan çok daha düşük maliyetle binlerce NVIDIA 800 yongası kullanarak DeepSeek nispeten küçük bir bütçeyle muhteşem bir AI inşa etmesini sağladı.
Aslında bunun arkasında oldukça ilginç bir hikaye var. DeepSeek arkasındaki şirket, 2020 ve 2021'de bu süper bilgisayar AI kümelerinden ikisine yaklaşık 1,2 milyar yuan harcadı. Bu kümeler yaklaşık 10.000 NVIDIA 800 çipinden oluşuyordu ve bu satın alımlar Çin'deki bazı büyük düzenleyici kurumların dikkatini çekti.

Bu kuruluşlar DeepSeek neden bu kadar çok çip aldıklarını sordular ve ekip ne üzerinde çalıştıklarını açıklamak zorunda kaldı. Sonunda, düzenleyici otoritelerden "her şey yolunda" cevabını aldılar ve bu da onların devam etmelerine olanak sağladı. Bu arada, Batılı AI firmaları, kelimenin tam anlamıyla Çin'e ihraç edilmesi yasaklanmış olan daha da fazla - 50.000'e kadar - üst düzey NVIDIA çipi kullanıyor.
Yani DeepSeek daha düşük kaliteli yongalarla başa çıkmak zorundaydı, ancak yine de çalışmasını sağladı, en yüksek performanstan ziyade verimliliğe odaklandı ve mevcut bileşenlerden mümkün olduğunca fazla değer çıkardı. Bu ayrıca daha düşük hesaplama maliyetleri ve genel giderler anlamına gelir ve bunlar son kullanıcılara -benim ve sizin gibi insanlara- aktarılır.
Standartları Belirlemek
DeepSeek bu ilk altyapıyı kurduğunda, yeniliklerini ilerletebildiler, çalışmalarını ölçeklendirebildiler ve farklı AI modelleri ve sistemleri maliyet açısından verimli bir şekilde geliştirebildiler. Hatta modellerinin kıyaslama testlerinde dünyanın resmi en iyisi olmaktan sadece 4,5 puan uzakta olduğu bir noktaya bile ulaştılar.

Bu benim için şaşırtıcı ve beni R2 konusunda daha da heyecanlandırıyor. Çünkü eğer R1 sektördeki en iyi olmaya bu kadar yakınsa, R2 neredeyse kesinlikle çok daha yükseğe çıkacak ve çok daha fazlasını başaracaktır. R2 piyasaya sürüldüğünde ne kadar etkileyici olduğunu, diğer modellere karşı nasıl performans gösterdiğini ve diğer firmaların DeepSeek yetişmek için nasıl bir yol izlemesi gerektiğini görmek çok heyecan verici olacak.
Adil Fiyatlandırma
Ayrıca fiyatlandırma faktörü de var. DeepSeek , piyasadaki diğer tüm büyük AI modellerinden çok daha ucuz fiyat noktalarında mevcuttu ve erişilebilirdi. R1'in piyasaya sürüldüğü sırada fiyatlandırma grafiklerini karşılaştırdım ve fark şaşırtıcıydı. Ve birçok kişi, ne kadar iyi ve ucuz olduğunu gördüklerinde OpenAI aboneliklerini hızla terk edip DeepSeek akın etti.
Hatta OpenAI fiyatlandırma planlarını hızla düşürmek zorunda kaldığını gördük, çünkü DeepSeek o dönemde OpenAI talep ettiği ücretten 40 kat daha ucuzdu; geriye dönüp düşündüğümde bu durum beni hala hayrete düşürüyor.

Elbette, R2'nin fiyatlandırması hakkında henüz çok fazla şey bilmiyoruz, ancak DeepSeek yeni modelle taktiklerini çok fazla değiştirmesini beklemiyorum. Hala uygun fiyatlı bir seçenek olmalı, mümkün olduğunca çok sayıda insana yüksek kaliteli AI teknolojisine aylık ücretlere büyük miktarlarda para harcamaya zorlamadan erişim sağlamalı.
Ayrıca, DeepSeek Açık Kaynak etkinliğinde bu yeni araçları yayınlamasıyla, AI geliştirmeye giriş barı daha da düştü ve daha uygun fiyatlı hale geldi. Bu nedenle, R2'nin orijinal R1 modelinden daha ucuz olması mümkün olabilir ve bu da gerçekten tüm AI dünyasında ve ötesinde sismik dalgalar gönderebilir.
DeepSeek R2 Sürümüne Hazır Olun
Genel olarak, DeepSeek yaklaşan R2 sürümü için gerçekten heyecanlıyım. Tüm işaretler olumlu, bu yeni açık kaynaklı modelin yalnızca R1'den değil, şu ana kadar gördüğümüz diğer tüm AI modellerinden bile daha iyi olacağını gösteriyor. Her bakımdan daha hızlı, daha akıllı ve üstün olacak ve hatta bunun için daha iyi bir fiyat bile alabiliriz. Daha fazla güncelleme için bizi izlemeye devam edin.