Deepseek R1 0528 Qwen3 8B Consulta la información detallada y precios de los modelos de AI

Contexto Longitud 131,072 tokens, deepseek de proporcionado

131,072
Tokens de Contexto
$0.01
Precio del Prompt
$0.05
Precio de salida
10/16
Soporte de Funciones
Razonamiento #12

Introducción del Modelo

DeepSeek-R1-0528 is a lightly upgraded release of DeepSeek R1 that taps more compute and smarter post-training tricks, pushing its reasoning and inference to the brink of flagship models like O3 and Gemini 2.5 Pro. It now tops math, programming, and logic leaderboards, showcasing a step-change in depth-of-thought. The distilled variant, DeepSeek-R1-0528-Qwen3-8B, transfers this chain-of-thought into an 8 B-parameter form, beating standard Qwen3 8B by +10 pp and tying the 235 B “thinking” giant on AIME 2024.

Información Básica

Desarrollador
deepseek
Serie de Modelos
Qwen
Fecha de lanzamiento
2025-05-29
Longitud de Contexto
131,072 tokens
Variante
standard

Información de Precios

Tokens de Prompt
$0.01 / 1M tokens
Tokens de Completado
$0.05 / 1M tokens

Política de Datos

Términos de Servicio

학습 정책

1

Funciones Compatibles

Compatible (10)

Top K
Seed
Penalización de Frecuencia
Penalización de Presencia
Penalización de Repetición
Min P
Sesgo Logit
Logprobs
Top Logprobs
Razonamiento

No compatible (6)

Entrada de Imagen
Formato de Respuesta
Uso de Herramientas
Salidas Estructuradas
Opciones de Búsqueda Web
Top A

Otras Variantes

Estadísticas de Uso Real

#78
De 353 modelos en total
14.3B
Total de Tokens Últimos 30 Días
477.85M
Uso Promedio Diario
12%
Cambio de Uso Semanal

Tendencia de uso de los últimos 30 días

Modelos del Mismo Autor (deepseek)

DeepSeek V3.1
163,840 tokens
$0.25 / $1.00
DeepSeek V3.1 (free)
32,768 tokens
Gratis
DeepSeek V3.1 (thinking)
131,072 tokens
$0.55 / $2.19
DeepSeek V3.1 Base
163,840 tokens
$0.25 / $1.00
R1 Distill Qwen 7B
131,072 tokens
$0.00 / $0.00

Modelos de Rango de Precio Similar

Llama 3.3 70B Instruct
meta-llama
131,072 tokens
$0.01 / $0.04