R1 Distill Qwen 14B Consulta la información detallada y precios de los modelos de AI
Contexto Longitud 64,000 tokens, deepseek de proporcionado
64,000
Tokens de Contexto
$0.15
Precio del Prompt
$0.15
Precio de salida
8/16
Soporte de Funciones
Razonamiento #12
Introducción del Modelo
DeepSeek R1 Distill Qwen 14B is a distilled large language model based on [Qwen 2.5 14B](https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-14B), using outputs from [DeepSeek R1](/deepseek/deepseek-r1). It outperforms OpenAI's o1-mini across various benchmarks, achieving new state-of-the-art results for dense models. Other benchmark results include: - AIME 2024 pass@1: 69.7 - MATH-500 pass@1: 93.9 - CodeForces Rating: 1481 The model leverages fine-tuning from DeepSeek R1's outputs, enabling competitive performance comparable to larger frontier models.
Información Básica
Desarrollador
deepseek
Serie de Modelos
Qwen
Fecha de lanzamiento
2025-01-29
Longitud de Contexto
64,000 tokens
Tokens de Finalización Máximos
32,000 tokens
Variante
standard
Información de Precios
Tokens de Prompt
$0.15 / 1M tokens
Tokens de Completado
$0.15 / 1M tokens
Política de Datos
Funciones Compatibles
Compatible (8)
Top K
Seed
Penalización de Frecuencia
Penalización de Presencia
Penalización de Repetición
Min P
Sesgo Logit
Razonamiento
No compatible (8)
Entrada de Imagen
Formato de Respuesta
Uso de Herramientas
Logprobs
Top Logprobs
Salidas Estructuradas
Opciones de Búsqueda Web
Top A
Otras Variantes
Estadísticas de Uso Real
#215
De 345 modelos en total
238.53M
Total de Tokens Últimos 30 Días
7.95M
Uso Promedio Diario
61%
Cambio de Uso Semanal