R1 Distill Qwen 7B Detaillierte Informationen und Preise für AI-Modelle anzeigen

Kontext Länge 131,072 Token, deepseek von bereitgestellt

131,072

Kontext-Token

$0.00

Prompt-Preis

$0.00

Ausgabepreis

0/16

Funktionsunterstützung

Modell-Übersicht

DeepSeek-R1-Distill-Qwen-7B is a 7 billion parameter dense language model distilled from DeepSeek-R1, leveraging reinforcement learning-enhanced reasoning data generated by DeepSeek's larger models. The distillation process transfers advanced reasoning, math, and code capabilities into a smaller, more efficient model architecture based on Qwen2.5-Math-7B. This model demonstrates strong performance across mathematical benchmarks (92.8% pass@1 on MATH-500), coding tasks (Codeforces rating 1189), and general reasoning (49.1% pass@1 on GPQA Diamond), achieving competitive accuracy relative to larger models while maintaining smaller inference costs.

Grundinformationen

Entwickler

deepseek

Modellserie

Qwen

Veröffentlichungsdatum

2025-05-30

Kontextlänge

131,072 Token

Variante

standard

Preisinformationen

Prompt-Token

$0.00 / 1M Token

Vervollständigungs-Token

$0.00 / 1M Token

Unterstützte Funktionen

Nicht unterstützt (16)

Bildeingabe

Top K

Seed

Häufigkeitsstrafe

Presence Penalty

Wiederholungsstrafe

Antwortformat

Min P

Logit-Bias

Tool-Nutzung

Logprobs

Top Logprobs

Strukturierte Ausgaben

Schlussfolgerung

Web-Suchoptionen

Top A

Tatsächliche Nutzungsstatistiken

#236

Von insgesamt 353 Modellen

269.44M

Gesamte Tokens der letzten 30 Tage

11.71M

Tägliche Durchschnittsnutzung

85%

Wöchentliche Nutzungsänderung

Nutzungstrend der letzten 30 Tage

Modelle desselben Autors (deepseek)

DeepSeek V3.1

163,840 Token

$0.25 / $1.00

Details anzeigen

DeepSeek V3.1 (free)

32,768 Token

Kostenlos

Details anzeigen

DeepSeek V3.1 (thinking)

131,072 Token

$0.55 / $2.19

Details anzeigen

DeepSeek V3.1 Base

163,840 Token

$0.25 / $1.00

Details anzeigen