Deepseek R1 0528 Qwen3 8B (free) Consultez les informations détaillées et les prix des modèles d'IA
Contexte Longueur 131,072 tokens, deepseek de fourni
131,072
Tokens de Contexte
Gratuit
Prix du Prompt
Gratuit
Prix de sortie
10/16
Support de Fonctionnalités
Présentation du Modèle
DeepSeek-R1-0528 is a lightly upgraded release of DeepSeek R1 that taps more compute and smarter post-training tricks, pushing its reasoning and inference to the brink of flagship models like O3 and Gemini 2.5 Pro. It now tops math, programming, and logic leaderboards, showcasing a step-change in depth-of-thought. The distilled variant, DeepSeek-R1-0528-Qwen3-8B, transfers this chain-of-thought into an 8 B-parameter form, beating standard Qwen3 8B by +10 pp and tying the 235 B “thinking” giant on AIME 2024.
Informations de Base
Développeur
deepseek
Série de Modèles
Qwen
Date de sortie
2025-05-29
Longueur de Contexte
131,072 tokens
Variante
free
Informations sur les Prix
Ce modèle est gratuit
Politique de Données
Conditions d'utilisation
학습 정책
1
Fonctionnalités Prises en Charge
Pris en charge (10)
Top K
Seed
Pénalité de Fréquence
Pénalité de Présence
Pénalité de Répétition
Min P
Biais Logit
Logprobs
Top Logprobs
Raisonnement
Non pris en charge (6)
Entrée d'Image
Format de Réponse
Utilisation d'Outils
Sorties Structurées
Options de Recherche Web
Top A
Autres Variantes
Statistiques d'Utilisation Réelle
#83
Sur 346 modèles au total
6.0B
Total des Tokens des 30 derniers jours
301.44M
Usage Moyen Quotidien
18%
Changement d'Usage Hebdomadaire