R1 Distill Llama 8B Consultez les informations détaillées et les prix des modèles d'IA

Contexte Longueur 32,000 tokens, deepseek de fourni

32,000

Tokens de Contexte

$0.04

Prix du Prompt

$0.04

Prix de sortie

8/16

Support de Fonctionnalités

Raisonnement #14

Présentation du Modèle

DeepSeek R1 Distill Llama 8B is a distilled large language model based on [Llama-3.1-8B-Instruct](/meta-llama/llama-3.1-8b-instruct), using outputs from [DeepSeek R1](/deepseek/deepseek-r1). The model combines advanced distillation techniques to achieve high performance across multiple benchmarks, including: - AIME 2024 pass@1: 50.4 - MATH-500 pass@1: 89.1 - CodeForces Rating: 1205 The model leverages fine-tuning from DeepSeek R1's outputs, enabling competitive performance comparable to larger frontier models. Hugging Face: - [Llama-3.1-8B](https://huggingface.co/meta-llama/Llama-3.1-8B) - [DeepSeek-R1-Distill-Llama-8B](https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Llama-8B) |

Informations de Base

Développeur

deepseek

Série de Modèles

Llama3

Date de sortie

2025-02-07

Longueur de Contexte

32,000 tokens

Tokens de Complétion Maximum

32,000 tokens

Variante

standard

Informations sur les Prix

Jetons de Prompt

$0.04 / 1M jetons

Tokens de Complétion

$0.04 / 1M jetons

Politique de Données

Conditions d'utilisation Politique de Confidentialité

Fonctionnalités Prises en Charge

Pris en charge (8)

Top K

Seed

Pénalité de Fréquence

Pénalité de Présence

Pénalité de Répétition

Min P

Biais Logit

Raisonnement

Non pris en charge (8)

Entrée d'Image

Format de Réponse

Utilisation d'Outils

Logprobs

Top Logprobs

Sorties Structurées

Options de Recherche Web

Top A

Statistiques d'Utilisation Réelle

#169

Sur 353 modèles au total

1.0B

Total des Tokens des 30 derniers jours

33.58M

Usage Moyen Quotidien

67%

Changement d'Usage Hebdomadaire

Tendance d'utilisation des 30 derniers jours

Modèles du Même Auteur (deepseek)

DeepSeek V3.1

163,840 tokens

$0.25 / $1.00

Voir les détails

DeepSeek V3.1 (free)

32,768 tokens

Gratuit

Voir les détails

DeepSeek V3.1 (thinking)

131,072 tokens

$0.55 / $2.19

Voir les détails

DeepSeek V3.1 Base

163,840 tokens

$0.25 / $1.00

Voir les détails

R1 Distill Qwen 7B

131,072 tokens

$0.00 / $0.00

Voir les détails

Modèles de Gamme de Prix Similaire

Ministral 3B

mistralai

32,768 tokens

$0.04 / $0.04

Voir les détails

Llama 3 8B Lunaris

sao10k

8,192 tokens

$0.04 / $0.05

Voir les détails

Hermes 2 Pro - Llama-3 8B

nousresearch

131,072 tokens

$0.03 / $0.04

Voir les détails

Llama 3.2 11B Vision Instruct

meta-llama

131,072 tokens

$0.05 / $0.05

Voir les détails

Mistral 7B Instruct

mistralai

32,768 tokens

$0.03 / $0.05

Voir les détails