Die Veröffentlichung von DeepSeek R1 im Januar 2025 hat die KI-Landschaft enorm verändert. Heute spreche ich über den nächsten Schritt in der DeepSeek-Entwicklung und vielleicht den nächsten großen Sprung in der KI-Technologie, wie wir sie kennen: DeepSeek R2 .
Jüngste Fortschritte bei DeepSeek

Dies ist definitiv etwas unbemerkt geblieben, aber das Forschungsteam von DeepSeek veranstaltete kürzlich eine Veranstaltung namens Open-Source Week. Während dieser Veranstaltung veröffentlichte das DeepSeek -Team fünf Open-Source-Repos, um die jüngsten Fortschritte und Fortschritte im Bereich KI zu präsentieren.
Die drei wichtigsten dieser Tools sind:
- FlashMLA : Dies ist ein effizienter MLA-Decodierungskernel für Hopper-GPUs.
- DeepEP : Die erste Kommunikationsbibliothek für MoE-Modelltraining und -Inferenz.
- DeepGEMM : Eine FP8-GEMM-Bibliothek, die sowohl mit dichten als auch mit MoE-GEMMs funktioniert.

Was bedeutet das alles also eigentlich?
All diese Tools sollen die Entwicklung und Optimierung zukünftiger KI-Modelle und -Produkte vereinfachen und effizienter gestalten. Und das führt mich direkt zum Hauptthema: DeepSeek R2.
DeepSeek R2: Die nächste Evolutionsstufe der KI

Die Open-Source-Week-Veranstaltung von DeepSeek und die dort vorgestellten Produkte passen alle nahtlos zur bevorstehenden Veröffentlichung des mit Spannung erwarteten Reasoning 2- oder R2-Modells des Unternehmens, das ein bedeutendes Upgrade gegenüber dem vorherigen DeepSeek R1-Modell darstellen soll.
Für alle, die die Neuigkeiten und Veröffentlichungen zu DeepSeek nicht verfolgt haben, erkläre ich hier die Grundlagen:
DeepSeek R1 wurde in China entwickelt und Anfang 2025 auf den Markt gebracht. Es war ein bedeutendes Ereignis im KI-Bereich und führte teilweise zum Verkauf von über einer Billion US-Dollar auf dem globalen Aktienmarkt. Warum? Weil R1 ein so fortschrittliches, revolutionäres Modell war, das es durchaus mit den besten KI-Modellen der großen westlichen Marken aufnehmen konnte.

Tests zeigten, dass es in vielen Bereichen gleichwertig oder besser war als beispielsweise:
- Claude
- GPT-4o
- OpenAI-o1-mini
- Und viele andere
All dies gelang dem Unternehmen, obwohl es Open Source und frei zugänglich war. Es war damals bahnbrechend, und ich war einer von vielen KI-Enthusiasten weltweit, die von der Geschichte begeistert waren: Ein kleines chinesisches Startup hatte es geschafft, das gleiche technologische Niveau zu erreichen wie riesige Multimilliarden-Dollar-Marken wie OpenAI.
Doch es dauerte nicht lange nach der Veröffentlichung von R1, bis ich und viele andere uns fragten: „Wie geht es weiter?“

Ein kürzlich veröffentlichter Reuters-Bericht enthüllt, dass das Entwicklungsteam von DeepSeek es eilig hat, das R2-Modell bis Mai auf den Markt zu bringen. Es könnte also schon bald soweit sein, und ich kann Ihnen mit Sicherheit sagen: Dieses neue Modell wird die KI-Landschaft noch dramatischer verändern als R1.
Die Auswirkungen von R2
Folgendes erwarte ich von R2:
- Es wird extrem günstig sein, genau wie R1
- Es wird führenden Modellen wie OpenAIs o3-full oder o3-high ebenbürtig sein oder sie sogar übertreffen.
- Es wird fast alle anderen Modelle auf dem Markt übertreffen
Und es kommt schon sehr bald, wenn man den neuesten Berichten Glauben schenken darf. Das in Hangzhou ansässige Team, das an DeepSeek arbeitet, scheint es kaum erwarten zu können, es herauszubringen, und ich persönlich vermute, dass es kurz nach dem chinesischen Qingming-Fest am 6. Mai erscheinen wird. Behalten Sie also Ihre Kalender im Auge.
Das DeepSeek -Team soll sich außerdem darauf konzentrieren, besseren Code als bisher zu produzieren und die Leistung in verschiedenen Sprachen zu verbessern, nicht nur in Englisch und Chinesisch, die bei R1 im Mittelpunkt standen und standardmäßig verfügbar waren. Dies ist sinnvoll, da sich DeepSeek R1 weltweit als beliebt erwiesen hat und Nutzer mit R2 auf Spanisch, Französisch, Russisch usw. interagieren möchten.
Und wir müssen nur auf die Auswirkungen von R1 zurückblicken, um vorherzusagen, wie sich R2 auf die globalen Märkte auswirken könnte. Die Veröffentlichung von R1 führte zu einem massiven Einbruch der Aktienmärkte. NVIDIA-Aktien, Kryptowährungen und globale Aktienkurse fielen in den Tagen nach der Veröffentlichung. Das hat mich damals beeindruckt, denn so etwas hatten wir zuvor fast noch nie erlebt.

Warum genau geschah das? Nun, zum Teil, weil R1 mit weniger leistungsstarken, älteren NVIDIA-Chips gebaut wurde, nicht mit den neuesten. Das machte NVIDIAs neueste Technologie aus dieser Sicht weniger wertvoll und beeindruckend. Es brachte auch große Konkurrenz für die großen westlichen KI-Technologiegiganten mit sich, was zu niedrigeren Bewertungen für sie und ihre Produkte führte.
Die Einführung von R2 könnte ähnliche Auswirkungen haben. Sie könnte die Dominanz der großen KI-Unternehmen wie OpenAI und Google brechen, die Landschaft erneut aufrütteln und beweisen, dass man nicht unbedingt die allerneuesten und besten Chips und andere Hardware benötigt, um unglaubliche KI-Modelle zu erstellen.

Das Erfolgsgeheimnis von DeepSeek
An dieser Stelle fragen Sie sich vielleicht: „Was ist das Geheimnis hinter DeepSeeks unglaublicher Erfolgsgeschichte?“ Nun, ich glaube, ich habe die Antwort. Der Schlüssel zum Erfolg von DeepSeek lag in der schnellen Innovation in der KI-Entwicklung, dem Mut, über den Tellerrand hinauszublicken und Dinge anders zu machen als die großen, etablierten Unternehmen.
Innovation in der Technologie
Ein großer Teil davon war eine hohe Investition in die Computertechnik. Die Muttergesellschaft von DeepSeek investierte viel Geld in die Anschaffung von Computerhardware, darunter hochmoderne Supercomputer-Cluster wie Firefly, die Tausende von NVIDIA 800-Chips zu deutlich geringeren Kosten als die neuesten Chips verwenden. Dadurch konnte DeepSeek mit relativ geringem Budget beeindruckende KI entwickeln.
Tatsächlich steckt dahinter eine interessante Geschichte. Das Unternehmen hinter DeepSeek gab 2020 und 2021 rund 1,2 Milliarden Yuan für zwei dieser Supercomputing-KI-Cluster aus. Diese Cluster bestanden aus rund 10.000 NVIDIA 800-Chips, und diese Käufe erregten die Aufmerksamkeit einiger großer chinesischer Regulierungsbehörden.

Diese Stellen fragten DeepSeek , warum sie so viele Chips kauften, und das Team musste erklären, woran es arbeitete. Schließlich erhielten sie von den Aufsichtsbehörden grünes Licht, sodass sie weiterarbeiten konnten. Westliche KI-Unternehmen verwenden inzwischen sogar noch mehr – bis zu 50.000 – High-End-NVIDIA-Chips, deren Export nach China buchstäblich verboten ist.
DeepSeek musste also mit Chips minderer Qualität auskommen, schaffte es aber dennoch, seinen Betrieb aufrechtzuerhalten, indem es den Fokus auf Effizienz statt auf Spitzenleistung legte und den größtmöglichen Nutzen aus den verfügbaren Komponenten zog. Das bedeutet auch geringere Rechenkosten und Overheads, die an die Endnutzer – Menschen wie Sie und ich – weitergegeben werden.
Maßstäbe setzen
Nachdem DeepSeek die anfängliche Infrastruktur aufgebaut hatte, konnte das Unternehmen seine Innovationen vorantreiben, seine Arbeit ausweiten und kosteneffizient verschiedene KI-Modelle und -Systeme entwickeln. In Benchmark-Tests fehlten dem Modell sogar nur noch 4,5 Punkte, um offiziell das beste der Welt zu sein.

Das ist für mich atemberaubend und macht mich noch gespannter auf R2. Denn wenn R1 schon so nah dran ist, das Beste in der Branche zu sein, wird R2 mit Sicherheit noch viel mehr erreichen. Es wird spannend zu sehen sein, wie beeindruckend R2 bei der Veröffentlichung ist, wie es im Vergleich zu anderen Modellen abschneidet und wie andere Firmen mit DeepSeek mithalten müssen.
Faire Preise
Hinzu kommt der Preisfaktor. DeepSeek war deutlich günstiger erhältlich als jedes andere große KI-Modell auf dem Markt. Ich habe die Preise zum Zeitpunkt der Veröffentlichung von R1 verglichen, und der Unterschied war enorm. Viele Nutzer kündigten schnell ihre OpenAI Abonnements und wechselten zu DeepSeek , als sie sahen, wie gut und günstig es war.
Wir mussten sogar beobachten, dass OpenAI seine Preispläne rasch reduzieren musste, da DeepSeek bis zu 40-mal günstiger war als das, was OpenAI damals verlangte. Wenn ich daran zurückdenke, bin ich immer noch sprachlos.

Natürlich wissen wir noch nicht viel über die Preise von R2, aber ich erwarte nicht, dass DeepSeek mit dem neuen Modell seine Taktik allzu sehr ändert. Es sollte weiterhin eine erschwingliche Option sein, die möglichst vielen Menschen Zugang zu High-End-KI-Technologie ermöglicht, ohne dass sie hohe monatliche Gebühren zahlen müssen.
Mit der Veröffentlichung dieser neuen Tools auf DeepSeek Open-Source-Event ist der Einstieg in die KI-Entwicklung zudem noch einfacher und erschwinglicher geworden. Es ist also möglich, dass R2 sogar günstiger wird als das ursprüngliche R1-Modell, was in der gesamten KI-Welt und darüber hinaus für Aufsehen sorgen würde.
Machen Sie sich bereit für die Veröffentlichung von DeepSeek R2
Insgesamt bin ich sehr gespannt auf die bevorstehende R2-Version von DeepSeek. Alle Anzeichen sind positiv und deuten darauf hin, dass dieses neue Open-Source-Modell nicht nur R1, sondern auch alle anderen KI-Modelle, die wir bisher gesehen haben, noch besser sein wird. Es wird schneller, intelligenter und in jeder Hinsicht überlegen sein, und vielleicht bekommen wir dafür sogar einen besseren Preis. Bleiben Sie dran für weitere Updates.