DeepSeek V4: KI-Tool Test & Bewertung
DeepSeek V4 ist die im April 2026 veröffentlichte Modellgeneration von DeepSeek, bestehend aus dem Flaggschiff V4-Pro (1,6 Billionen Parameter, 49 Milliarden aktiv) und dem kompakteren V4-Flash (284 Milliarden, 13 Milliarden aktiv). Beide nutzen eine Mixture-of-Experts-Architektur, verarbeiten bis zu 1 Million Token in einem Durchgang und stehen unter MIT-Lizenz als Open Weights bereit. V4-Pro erreicht 80,6 % auf SWE-bench Verified und liegt damit fast gleichauf mit Claude Opus, zu einem Bruchteil der Kosten.
Zuletzt aktualisiert: 2. Juni 2026
Wer ein offenes Modell auf dem Niveau kommerzieller Spitzenmodelle sucht, aber nicht die Preise der US-Anbieter zahlen möchte, kommt an DeepSeek V4 kaum vorbei. Das Modell erreicht bei Programmierung und Reasoning fast die Werte von Claude Opus und GPT-5, kostet über die Cloud-API aber nur einen Bruchteil und steht zusätzlich als Open Weights für den Eigenbetrieb bereit.
Wichtigste Funktionen
- Zwei Varianten für unterschiedliche Anforderungen: V4-Pro ist das Flaggschiff mit 1,6 Billionen Parametern (49 Milliarden aktiv) für maximale Leistung. V4-Flash mit 284 Milliarden Parametern (13 Milliarden aktiv) ist die schlankere und günstigere Option für Aufgaben, bei denen es auf Geschwindigkeit und Kosten ankommt.
- Sehr großes Kontextfenster: Beide Varianten verarbeiten bis zu 1 Million Token in einem Durchgang. Das entspricht mehreren tausend Seiten Text und reicht für ganze Vertragssammlungen, Projektdokumentationen oder umfangreiche Code-Bestände in einer einzigen Anfrage.
- Starke Coding-Leistung: V4-Pro löst 80,6 % der Aufgaben auf SWE-bench Verified, einem Test mit echten Software-Bugs aus GitHub-Projekten, und liegt damit nahe an Claude Opus. V4-Flash kommt auf 79,0 %.
- Mixture-of-Experts-Architektur: Pro Anfrage wird nur ein Bruchteil der Parameter aktiviert. Das senkt den Rechenaufwand erheblich und ist der Grund, warum die Modelle trotz ihrer Größe vergleichsweise effizient arbeiten.
- Offene MIT-Lizenz: Die Modellgewichte stehen unter MIT-Lizenz bereit. Anpassung, Weitergabe und kommerzielle Nutzung sind ohne Einschränkungen möglich.
Preise und Tarife
Der Chat-Dienst von DeepSeek ist kostenlos nutzbar. Über die API kostet V4-Pro seit Mai 2026 dauerhaft rund 0,40 Euro pro Million Input-Tokens und 0,80 Euro pro Million Output-Tokens (umgerechnet aus 0,435 und 0,87 US-Dollar). Das frühere, höhere Listenpreis-Niveau ist damit aufgehoben. Die kompaktere V4-Flash liegt noch einmal deutlich darunter, bei ungefähr 0,09 Euro pro Million Input-Tokens und 0,18 Euro pro Million Output-Tokens. Wer die offenen Gewichte selbst hostet, zahlt keine Lizenz- oder API-Gebühren, braucht für V4-Pro allerdings einen Server mit mehreren leistungsstarken Grafikkarten. V4-Flash ist beim Eigenbetrieb deutlich genügsamer.
Für wen ist DeepSeek V4 geeignet?
- Entwicklungsteams mit hohem Code-Volumen: Wer regelmäßig Programmcode generieren, prüfen oder erweitern lässt, bekommt mit V4-Pro ein Modell nahe an den teuersten Cloud-Modellen, zu einem Bruchteil der Kosten.
- Unternehmen mit sehr langen Dokumenten: Kanzleien, Ingenieurbüros oder Forschungseinrichtungen, die ganze Aktenbestände oder umfangreiche technische Unterlagen am Stück auswerten wollen, profitieren vom Kontextfenster mit 1 Million Tokens.
- Forschung und KI-Entwicklung: Die MIT-Lizenz erlaubt die unbeschränkte Anpassung und Weitergabe. Für Hochschulen, Startups und KI-Teams, die ein eigenes Modell aufbauen, ist das eine attraktive Grundlage.
DSGVO und Datenschutz
DeepSeek ist ein chinesisches Unternehmen, und der Cloud-Dienst verarbeitet Daten auf Servern in China. Für personenbezogene oder vertrauliche Daten kommt die Cloud-Variante damit nicht in Frage. Über die Verwendung der Daten zum Training gibt der Anbieter keine für EU-Unternehmen belastbaren Zusicherungen. Die DSGVO-konforme Lösung ist der Eigenbetrieb der offenen Modellgewichte auf eigener Infrastruktur, bei dem keine Daten das eigene Netzwerk verlassen. Für V4-Pro ist das wegen der Modellgröße nur mit einem entsprechend ausgestatteten Server sinnvoll, für V4-Flash mit moderaterem Aufwand.
Alternativen zu DeepSeek V4
- GLM-5.1: Offenes Spitzenmodell von Z.ai mit Fokus auf Software-Entwicklung, führte bei Erscheinen den SWE-bench Pro an. Ebenfalls server-schwer und über eine China-Cloud verfügbar.
- Kimi K2.6: Offenes Modell von Moonshot AI, besonders auf agentische Aufgaben über viele Schritte ausgelegt. Vergleichbare Größenordnung und Lizenzsituation.
- Qwen 3.6: Alibabas Open-Weight-Modell mit multimodalen Fähigkeiten, das sich anders als DeepSeek V4 auf einer Workstation betreiben lässt. Die zugänglichere Option für Unternehmen ohne Server-Infrastruktur.
Vorteile
- Open Weights unter MIT-Lizenz, kommerzielle Nutzung und Self-Hosting ohne Einschränkungen
- V4-Pro erreicht 80,6 % auf SWE-bench Verified, fast auf dem Niveau von Claude Opus
- Sehr großes Kontextfenster mit 1 Million Tokens für ganze Dokumentensammlungen
- Deutlich günstiger als die großen US-Anbieter, auch über die Cloud-API
Nachteile
- Cloud-Dienst läuft auf Servern in China, nicht DSGVO-konform für personenbezogene Daten
- V4-Pro mit 1,6 Billionen Parametern nur auf großer Server-Hardware selbst betreibbar
- Bei deutscher Sprachqualität schwächer als europäisch trainierte Modelle wie Gemma 4