Deepseek R1 0528 Qwen3 8B Consulta la información detallada y precios de los modelos de AI
Contexto Longitud 131,072 tokens, deepseek de proporcionado
131,072
Tokens de Contexto
$0.05
Precio del Prompt
$0.10
Precio de salida
5/16
Soporte de Funciones
legal #3
Razonamiento #14
Introducción del Modelo
DeepSeek-R1-0528 is a lightly upgraded release of DeepSeek R1 that taps more compute and smarter post-training tricks, pushing its reasoning and inference to the brink of flagship models like O3 and Gemini 2.5 Pro. It now tops math, programming, and logic leaderboards, showcasing a step-change in depth-of-thought. The distilled variant, DeepSeek-R1-0528-Qwen3-8B, transfers this chain-of-thought into an 8 B-parameter form, beating standard Qwen3 8B by +10 pp and tying the 235 B “thinking” giant on AIME 2024.
Información Básica
Desarrollador
deepseek
Serie de Modelos
Qwen
Fecha de lanzamiento
2025-05-29
Longitud de Contexto
131,072 tokens
Tokens de Finalización Máximos
131,072 tokens
Variante
standard
Información de Precios
Tokens de Prompt
$0.05 / 1M tokens
Tokens de Completado
$0.10 / 1M tokens
Política de Datos
Funciones Compatibles
Compatible (5)
Top K
Penalización de Frecuencia
Penalización de Presencia
Penalización de Repetición
Razonamiento
No compatible (11)
Entrada de Imagen
Seed
Formato de Respuesta
Min P
Sesgo Logit
Uso de Herramientas
Logprobs
Top Logprobs
Salidas Estructuradas
Opciones de Búsqueda Web
Top A
Otras Variantes
Estadísticas de Uso Real
#96
De 346 modelos en total
4.4B
Total de Tokens Últimos 30 Días
220.39M
Uso Promedio Diario
192%
Cambio de Uso Semanal