Peluncuran DeepSeek R1 ke publik pada bulan Januari 2025 mengubah lanskap AI secara drastis. Namun, hari ini, saya akan membahas langkah selanjutnya dalam evolusi DeepSeek, dan mungkin lompatan besar berikutnya dalam teknologi AI seperti yang kita ketahui: DeepSeek R2 .
Kemajuan Terbaru DeepSeek

Hal ini jelas tidak banyak diketahui, tetapi tim peneliti DeepSeek baru-baru ini menyelenggarakan acara Open-Source Week. Selama acara tersebut, tim DeepSeek merilis lima repositori open-source untuk menunjukkan kemajuan terkini dan kemajuan AI yang telah mereka buat.
Tiga alat yang paling terkenal adalah:
- FlashMLA : Ini adalah kernel decoding MLA yang efisien untuk GPU Hopper.
- DeepEP : Pustaka komunikasi pertama untuk pelatihan dan inferensi model MoE.
- DeepGEMM : Pustaka GEMM FP8 yang bekerja dengan GEMM padat dan MoE.

Jadi, apa sebenarnya arti semua ini?
Nah, semua alat ini dirancang untuk mempermudah dan mengefisienkan pengembangan serta penyederhanaan model dan produk AI di masa mendatang. Dan itu membawa saya langsung ke topik utama diskusi: DeepSeek R2.
DeepSeek R2: Evolusi Berikutnya dalam AI

Acara Open-Source Week DeepSeek dan berbagai produk yang dipamerkan di sana semuanya terkait erat dengan peluncuran model Reasoning 2 atau R2 yang sangat digembar-gemborkan perusahaan tersebut, yang ditetapkan sebagai peningkatan besar dibandingkan model DeepSeek R1 sebelumnya.
Bagi siapa pun di luar sana yang belum mengikuti berita dan rilis terkait DeepSeek, saya akan uraikan dasar-dasarnya:
DeepSeek R1 dikembangkan di Tiongkok dan diluncurkan pada awal tahun 2025. Ini merupakan peristiwa besar dalam bidang AI, dan sebagian menyebabkan penjualan lebih dari $1 triliun dari pasar ekuitas global. Mengapa? Karena R1 merupakan model yang sangat canggih dan revolusioner, lebih dari mampu bersaing dengan model AI terbaik dari merek-merek besar Barat.

Pengujian menunjukkan bahwa, di banyak area, setara dengan atau lebih baik daripada:
- Claude
- GPT-4o
- OpenAI-o1-mini
- Dan masih banyak lagi
Ia berhasil melakukan semua ini dengan tetap menggunakan sumber terbuka dan akses gratis. Ia merupakan terobosan pada saat itu, dan saya adalah salah satu dari banyak penggemar AI di seluruh dunia yang terpesona oleh ceritanya: sebuah perusahaan rintisan kecil Tiongkok telah berhasil mencapai tingkat keunggulan teknologi yang sama dengan merek-merek besar bernilai miliaran dolar seperti OpenAI.
Namun tidak butuh waktu lama setelah peluncuran R1 bagi saya dan banyak orang lainnya untuk bertanya, "Apa selanjutnya?"

Nah, laporan Reuters baru-baru ini muncul, yang mengungkapkan bahwa tim pengembangan DeepSeek sedang terburu-buru untuk meluncurkan model R2 pada bulan Mei. Jadi, kita mungkin akan segera mendapatkannya, dan saya dapat memberi tahu Anda dengan pasti: model baru ini akan mengubah lanskap AI secara lebih dramatis daripada yang dilakukan R1.
Dampak R2
Inilah yang saya harapkan dari R2:
- Ini akan sangat murah, sama seperti R1
- Ini akan menyamai atau bahkan mengungguli model terkemuka seperti o3-full atau o3-high OpenAI
- Ini akan mengungguli hampir semua model lain di pasaran
Dan itu akan segera hadir, jika laporan terbaru dapat dipercaya. Tim yang berbasis di Hangzhou yang mengerjakan DeepSeek tampaknya sangat bersemangat untuk merilisnya, dan prediksi pribadi saya adalah kita mungkin akan melihatnya dirilis tepat setelah liburan Festival Qingming China, yang jatuh pada tanggal 6 Mei, jadi pantau terus kalender Anda.
Tim DeepSeek juga dikatakan berfokus pada pembuatan kode yang lebih unggul dari sebelumnya dan kinerja yang lebih baik dalam berbagai bahasa, tidak hanya bahasa Inggris dan Mandarin, yang merupakan fokus utama dan pilihan default dengan R1. Hal ini masuk akal, karena DeepSeek R1 terbukti populer di seluruh dunia, dan orang-orang akan ingin berinteraksi dengan R2 dalam bahasa Spanyol, Prancis, Rusia, dll.
Dan kita hanya perlu melihat kembali dampak R1 untuk memprediksi bagaimana R2 dapat memengaruhi pasar global. Peluncuran R1 menyebabkan penurunan besar di pasar saham, dengan saham NVIDIA, kripto, dan ekuitas global semuanya anjlok dalam beberapa hari setelah peluncurannya. Itu membuat saya kagum saat itu, karena kami hampir tidak pernah melihat yang seperti itu sebelumnya.

Mengapa hal itu terjadi? Ya, sebagian karena R1 dibuat menggunakan chip NVIDIA lawas yang kurang bertenaga, bukan yang terbaru, sehingga membuat teknologi terbaru NVIDIA kurang bernilai dan mengesankan dari sudut pandang itu. Hal itu juga mendatangkan persaingan besar bagi raksasa teknologi AI Barat, yang menyebabkan valuasi yang lebih rendah bagi mereka dan produk mereka.
Peluncuran R2 dapat memberikan dampak yang sama. Peluncuran ini dapat mengganggu dominasi perusahaan AI besar, seperti OpenAI dan Google, mengguncang dunia sekali lagi dan membuktikan bahwa Anda tidak perlu menggunakan chip dan perangkat keras canggih, terbaru, dan terhebat untuk membuat model AI yang luar biasa.

Rahasia Sukses DeepSeek
Pada titik ini, Anda mungkin bertanya-tanya, "Apa rahasia di balik kisah sukses DeepSeek yang luar biasa?" Baiklah, saya rasa saya punya jawabannya. Kunci keberhasilan DeepSeek terletak pada bagaimana mereka berinovasi dengan cepat dalam pengembangan AI, berani berpikir di luar kebiasaan, dan melakukan hal-hal yang berbeda dari perusahaan-perusahaan besar yang mapan.
Inovasi dalam Teknologi
Sebagian besar dari ini adalah investasi besar dalam komputasi. Perusahaan induk DeepSeek menggelontorkan banyak uang untuk membeli perangkat keras komputasi, seperti kluster superkomputer canggih, seperti Firefly, yang menggunakan ribuan chip NVIDIA 800 dengan biaya yang jauh lebih rendah daripada chip terbaru, yang memungkinkan DeepSeek membangun AI yang menakjubkan dengan anggaran yang relatif kecil.
Sebenarnya, ada cerita yang cukup menarik di balik itu. Perusahaan di balik DeepSeek menghabiskan sekitar 1,2 miliar yuan untuk dua klaster AI superkomputer ini pada tahun 2020 dan 2021. Klaster tersebut terdiri dari sekitar 10.000 chip NVIDIA 800, dan pembelian ini menarik perhatian beberapa badan regulasi besar di Tiongkok.

Badan-badan tersebut bertanya kepada DeepSeek mengapa mereka membeli begitu banyak chip, dan tim tersebut harus menjelaskan apa yang sedang mereka kerjakan. Pada akhirnya, mereka memperoleh "izin" dari otoritas regulasi, yang memungkinkan mereka untuk terus maju. Sementara itu, perusahaan-perusahaan AI Barat bahkan menggunakan lebih banyak lagi – hingga 50.000 – chip NVIDIA kelas atas yang secara harfiah telah dilarang untuk diekspor ke Tiongkok.
Jadi, DeepSeek harus mengatasi chip dengan kualitas yang lebih rendah, tetapi tetap membuatnya berfungsi, dengan berfokus pada efisiensi daripada kinerja puncak, dan mengekstraksi sebanyak mungkin nilai dari komponen yang tersedia. Itu juga berarti biaya komputasi dan overhead yang lebih rendah, yang dibebankan kepada pengguna akhir – orang-orang seperti saya dan Anda.
Menetapkan Standar
Setelah DeepSeek membangun infrastruktur awal tersebut, mereka mampu terus maju dengan inovasi mereka, meningkatkan skala pekerjaan mereka, dan mengembangkan berbagai model dan sistem AI dengan biaya yang efisien. Mereka bahkan mencapai titik di mana model mereka hanya berjarak 4,5 poin pada uji tolok ukur untuk menjadi yang terbaik di dunia.

Itu sungguh mencengangkan bagi saya, dan membuat saya semakin bersemangat tentang R2. Karena jika R1 begitu dekat untuk menjadi yang terbaik dalam bisnis ini, R2 hampir pasti akan melaju jauh lebih tinggi dan meraih lebih banyak lagi. Akan sangat menarik untuk melihat saat R2 dirilis seberapa mengesankannya, bagaimana kinerjanya dibandingkan model lain, dan bagaimana perusahaan lain harus mengejar ketertinggalan dengan DeepSeek.
Harga Wajar
Ada pula faktor harga. DeepSeek tersedia dan dapat diakses dengan harga yang jauh lebih murah daripada model AI utama lainnya di pasaran. Saya membandingkan grafik harga pada saat peluncuran R1, dan perbedaannya sangat mencolok. Dan banyak orang dengan cepat meninggalkan langganan OpenAI mereka dan beralih ke DeepSeek ketika mereka melihat betapa bagus dan murahnya itu.
Kami bahkan melihat OpenAI harus segera mengurangi rencana harganya, karena DeepSeek hingga 40 kali lebih murah daripada harga yang ditetapkan OpenAI saat itu, yang masih membuat saya takjub jika mengingatnya kembali.

Tentu saja, kami belum tahu banyak tentang harga R2, tetapi saya tidak berharap DeepSeek akan mengubah taktiknya terlalu banyak dengan model baru ini. Model ini seharusnya tetap menjadi pilihan yang terjangkau, yang memberikan akses ke teknologi AI canggih kepada sebanyak mungkin orang tanpa memaksa mereka mengeluarkan biaya bulanan yang besar.
Ditambah lagi, dengan DeepSeek merilis perangkat baru ini di acara Open-Source-nya, standar untuk pengembangan AI menjadi lebih rendah dan lebih terjangkau. Jadi, mungkin saja R2 akan lebih murah daripada model R1 asli, yang benar-benar akan mengirimkan gelombang seismik ke seluruh dunia AI dan seterusnya.
Bersiaplah untuk Peluncuran DeepSeek R2
Secara keseluruhan, saya sangat antusias dengan peluncuran R2 mendatang dari DeepSeek. Semua tandanya positif, yang menunjukkan bahwa model sumber terbuka baru ini akan lebih baik daripada R1, tetapi model AI lain yang pernah kita lihat sejauh ini. Model ini akan lebih cepat, lebih cerdas, dan lebih unggul dalam segala hal, dan kita bahkan mungkin mendapatkan harga yang lebih baik untuk model ini. Nantikan informasi terbaru selanjutnya.