Zum Inhalt springen
D

DeepSeek V4: KI-Tool Test & Bewertung

4.5
Sprachmodelle Freemium Chat kostenlos / API für V4-Pro ab ca. 0,40 Euro pro Mio. Input-Tokens, Eigenbetrieb der offenen Gewichte kostenlos Hybrid Open Source

DeepSeek V4 ist die im April 2026 veröffentlichte Modellgeneration von DeepSeek, bestehend aus dem Flaggschiff V4-Pro (1,6 Billionen Parameter, 49 Milliarden aktiv) und dem kompakteren V4-Flash (284 Milliarden, 13 Milliarden aktiv). Beide nutzen eine Mixture-of-Experts-Architektur, verarbeiten bis zu 1 Million Token in einem Durchgang und stehen unter MIT-Lizenz als Open Weights bereit. V4-Pro erreicht 80,6 % auf SWE-bench Verified und liegt damit fast gleichauf mit Claude Opus, zu einem Bruchteil der Kosten.

Zuletzt aktualisiert: 2. Juni 2026

Wer ein offenes Modell auf dem Niveau kommerzieller Spitzenmodelle sucht, aber nicht die Preise der US-Anbieter zahlen möchte, kommt an DeepSeek V4 kaum vorbei. Das Modell erreicht bei Programmierung und Reasoning fast die Werte von Claude Opus und GPT-5, kostet über die Cloud-API aber nur einen Bruchteil und steht zusätzlich als Open Weights für den Eigenbetrieb bereit.

Wichtigste Funktionen

  • Zwei Varianten für unterschiedliche Anforderungen: V4-Pro ist das Flaggschiff mit 1,6 Billionen Parametern (49 Milliarden aktiv) für maximale Leistung. V4-Flash mit 284 Milliarden Parametern (13 Milliarden aktiv) ist die schlankere und günstigere Option für Aufgaben, bei denen es auf Geschwindigkeit und Kosten ankommt.
  • Sehr großes Kontextfenster: Beide Varianten verarbeiten bis zu 1 Million Token in einem Durchgang. Das entspricht mehreren tausend Seiten Text und reicht für ganze Vertragssammlungen, Projektdokumentationen oder umfangreiche Code-Bestände in einer einzigen Anfrage.
  • Starke Coding-Leistung: V4-Pro löst 80,6 % der Aufgaben auf SWE-bench Verified, einem Test mit echten Software-Bugs aus GitHub-Projekten, und liegt damit nahe an Claude Opus. V4-Flash kommt auf 79,0 %.
  • Mixture-of-Experts-Architektur: Pro Anfrage wird nur ein Bruchteil der Parameter aktiviert. Das senkt den Rechenaufwand erheblich und ist der Grund, warum die Modelle trotz ihrer Größe vergleichsweise effizient arbeiten.
  • Offene MIT-Lizenz: Die Modellgewichte stehen unter MIT-Lizenz bereit. Anpassung, Weitergabe und kommerzielle Nutzung sind ohne Einschränkungen möglich.

Preise und Tarife

Der Chat-Dienst von DeepSeek ist kostenlos nutzbar. Über die API kostet V4-Pro seit Mai 2026 dauerhaft rund 0,40 Euro pro Million Input-Tokens und 0,80 Euro pro Million Output-Tokens (umgerechnet aus 0,435 und 0,87 US-Dollar). Das frühere, höhere Listenpreis-Niveau ist damit aufgehoben. Die kompaktere V4-Flash liegt noch einmal deutlich darunter, bei ungefähr 0,09 Euro pro Million Input-Tokens und 0,18 Euro pro Million Output-Tokens. Wer die offenen Gewichte selbst hostet, zahlt keine Lizenz- oder API-Gebühren, braucht für V4-Pro allerdings einen Server mit mehreren leistungsstarken Grafikkarten. V4-Flash ist beim Eigenbetrieb deutlich genügsamer.

Für wen ist DeepSeek V4 geeignet?

  • Entwicklungsteams mit hohem Code-Volumen: Wer regelmäßig Programmcode generieren, prüfen oder erweitern lässt, bekommt mit V4-Pro ein Modell nahe an den teuersten Cloud-Modellen, zu einem Bruchteil der Kosten.
  • Unternehmen mit sehr langen Dokumenten: Kanzleien, Ingenieurbüros oder Forschungseinrichtungen, die ganze Aktenbestände oder umfangreiche technische Unterlagen am Stück auswerten wollen, profitieren vom Kontextfenster mit 1 Million Tokens.
  • Forschung und KI-Entwicklung: Die MIT-Lizenz erlaubt die unbeschränkte Anpassung und Weitergabe. Für Hochschulen, Startups und KI-Teams, die ein eigenes Modell aufbauen, ist das eine attraktive Grundlage.

DSGVO und Datenschutz

DeepSeek ist ein chinesisches Unternehmen, und der Cloud-Dienst verarbeitet Daten auf Servern in China. Für personenbezogene oder vertrauliche Daten kommt die Cloud-Variante damit nicht in Frage. Über die Verwendung der Daten zum Training gibt der Anbieter keine für EU-Unternehmen belastbaren Zusicherungen. Die DSGVO-konforme Lösung ist der Eigenbetrieb der offenen Modellgewichte auf eigener Infrastruktur, bei dem keine Daten das eigene Netzwerk verlassen. Für V4-Pro ist das wegen der Modellgröße nur mit einem entsprechend ausgestatteten Server sinnvoll, für V4-Flash mit moderaterem Aufwand.

Alternativen zu DeepSeek V4

  • GLM-5.1: Offenes Spitzenmodell von Z.ai mit Fokus auf Software-Entwicklung, führte bei Erscheinen den SWE-bench Pro an. Ebenfalls server-schwer und über eine China-Cloud verfügbar.
  • Kimi K2.6: Offenes Modell von Moonshot AI, besonders auf agentische Aufgaben über viele Schritte ausgelegt. Vergleichbare Größenordnung und Lizenzsituation.
  • Qwen 3.6: Alibabas Open-Weight-Modell mit multimodalen Fähigkeiten, das sich anders als DeepSeek V4 auf einer Workstation betreiben lässt. Die zugänglichere Option für Unternehmen ohne Server-Infrastruktur.

Vorteile

  • Open Weights unter MIT-Lizenz, kommerzielle Nutzung und Self-Hosting ohne Einschränkungen
  • V4-Pro erreicht 80,6 % auf SWE-bench Verified, fast auf dem Niveau von Claude Opus
  • Sehr großes Kontextfenster mit 1 Million Tokens für ganze Dokumentensammlungen
  • Deutlich günstiger als die großen US-Anbieter, auch über die Cloud-API

Nachteile

  • Cloud-Dienst läuft auf Servern in China, nicht DSGVO-konform für personenbezogene Daten
  • V4-Pro mit 1,6 Billionen Parametern nur auf großer Server-Hardware selbst betreibbar
  • Bei deutscher Sprachqualität schwächer als europäisch trainierte Modelle wie Gemma 4

Anwendungsgebiete

Lange Dokumente und Codebases analysierenCode-Generierung und FehlersucheMehrstufige Reasoning-AufgabenGünstige KI-API für Entwickler