R1 Distill Llama 8B Consulta la información detallada y precios de los modelos de AI

Contexto Longitud 32,000 tokens, deepseek de proporcionado

32,000

Tokens de Contexto

$0.04

Precio del Prompt

$0.04

Precio de salida

8/16

Soporte de Funciones

Razonamiento #14

Introducción del Modelo

DeepSeek R1 Distill Llama 8B is a distilled large language model based on [Llama-3.1-8B-Instruct](/meta-llama/llama-3.1-8b-instruct), using outputs from [DeepSeek R1](/deepseek/deepseek-r1). The model combines advanced distillation techniques to achieve high performance across multiple benchmarks, including: - AIME 2024 pass@1: 50.4 - MATH-500 pass@1: 89.1 - CodeForces Rating: 1205 The model leverages fine-tuning from DeepSeek R1's outputs, enabling competitive performance comparable to larger frontier models. Hugging Face: - [Llama-3.1-8B](https://huggingface.co/meta-llama/Llama-3.1-8B) - [DeepSeek-R1-Distill-Llama-8B](https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Llama-8B) |

Información Básica

Desarrollador

deepseek

Serie de Modelos

Llama3

Fecha de lanzamiento

2025-02-07

Longitud de Contexto

32,000 tokens

Tokens de Finalización Máximos

32,000 tokens

Variante

standard

Información de Precios

Tokens de Prompt

$0.04 / 1M tokens

Tokens de Completado

$0.04 / 1M tokens

Política de Datos

Términos de Servicio Política de Privacidad

Funciones Compatibles

Compatible (8)

Top K

Seed

Penalización de Frecuencia

Penalización de Presencia

Penalización de Repetición

Min P

Sesgo Logit

Razonamiento

No compatible (8)

Entrada de Imagen

Formato de Respuesta

Uso de Herramientas

Logprobs

Top Logprobs

Salidas Estructuradas

Opciones de Búsqueda Web

Top A

Estadísticas de Uso Real

#169

De 353 modelos en total

1.0B

Total de Tokens Últimos 30 Días

33.58M

Uso Promedio Diario

67%

Cambio de Uso Semanal

Tendencia de uso de los últimos 30 días

Modelos del Mismo Autor (deepseek)

DeepSeek V3.1

163,840 tokens

$0.25 / $1.00

Ver Detalles

DeepSeek V3.1 (free)

32,768 tokens

Gratis

Ver Detalles

DeepSeek V3.1 (thinking)

131,072 tokens

$0.55 / $2.19

Ver Detalles

DeepSeek V3.1 Base

163,840 tokens

$0.25 / $1.00

Ver Detalles

R1 Distill Qwen 7B

131,072 tokens

$0.00 / $0.00

Ver Detalles

Modelos de Rango de Precio Similar

Ministral 3B

mistralai

32,768 tokens

$0.04 / $0.04

Ver Detalles

Llama 3 8B Lunaris

sao10k

8,192 tokens

$0.04 / $0.05

Ver Detalles

Hermes 2 Pro - Llama-3 8B

nousresearch

131,072 tokens

$0.03 / $0.04

Ver Detalles

Llama 3.2 11B Vision Instruct

meta-llama

131,072 tokens

$0.05 / $0.05

Ver Detalles

Mistral 7B Instruct

mistralai

32,768 tokens

$0.03 / $0.05

Ver Detalles