R1 Distill Qwen 14B (free) Consulta la información detallada y precios de los modelos de AI
Contexto Longitud 64,000 tokens, deepseek de proporcionado
64,000
Tokens de Contexto
Gratis
Precio del Prompt
Gratis
Precio de salida
10/16
Soporte de Funciones
Razonamiento #9
Introducción del Modelo
DeepSeek R1 Distill Qwen 14B is a distilled large language model based on [Qwen 2.5 14B](https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-14B), using outputs from [DeepSeek R1](/deepseek/deepseek-r1). It outperforms OpenAI's o1-mini across various benchmarks, achieving new state-of-the-art results for dense models. Other benchmark results include: - AIME 2024 pass@1: 69.7 - MATH-500 pass@1: 93.9 - CodeForces Rating: 1481 The model leverages fine-tuning from DeepSeek R1's outputs, enabling competitive performance comparable to larger frontier models.
Información Básica
Desarrollador
deepseek
Serie de Modelos
Qwen
Fecha de lanzamiento
2025-01-29
Longitud de Contexto
64,000 tokens
Variante
free
Información de Precios
Este modelo es gratuito
Política de Datos
Términos de Servicio
학습 정책
1
Funciones Compatibles
Compatible (10)
Top K
Seed
Penalización de Frecuencia
Penalización de Presencia
Penalización de Repetición
Min P
Sesgo Logit
Logprobs
Top Logprobs
Razonamiento
No compatible (6)
Entrada de Imagen
Formato de Respuesta
Uso de Herramientas
Salidas Estructuradas
Opciones de Búsqueda Web
Top A
Otras Variantes
Estadísticas de Uso Real
#219
De 345 modelos en total
199.19M
Total de Tokens Últimos 30 Días
6.64M
Uso Promedio Diario
51%
Cambio de Uso Semanal