R1 Distill Qwen 14B (free) Consultez les informations détaillées et les prix des modèles d'IA
Contexte Longueur 64,000 tokens, deepseek de fourni
64,000
Tokens de Contexte
Gratuit
Prix du Prompt
Gratuit
Prix de sortie
10/16
Support de Fonctionnalités
Raisonnement #9
Présentation du Modèle
DeepSeek R1 Distill Qwen 14B is a distilled large language model based on [Qwen 2.5 14B](https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-14B), using outputs from [DeepSeek R1](/deepseek/deepseek-r1). It outperforms OpenAI's o1-mini across various benchmarks, achieving new state-of-the-art results for dense models. Other benchmark results include: - AIME 2024 pass@1: 69.7 - MATH-500 pass@1: 93.9 - CodeForces Rating: 1481 The model leverages fine-tuning from DeepSeek R1's outputs, enabling competitive performance comparable to larger frontier models.
Informations de Base
Développeur
deepseek
Série de Modèles
Qwen
Date de sortie
2025-01-29
Longueur de Contexte
64,000 tokens
Variante
free
Informations sur les Prix
Ce modèle est gratuit
Politique de Données
Conditions d'utilisation
학습 정책
1
Fonctionnalités Prises en Charge
Pris en charge (10)
Top K
Seed
Pénalité de Fréquence
Pénalité de Présence
Pénalité de Répétition
Min P
Biais Logit
Logprobs
Top Logprobs
Raisonnement
Non pris en charge (6)
Entrée d'Image
Format de Réponse
Utilisation d'Outils
Sorties Structurées
Options de Recherche Web
Top A
Autres Variantes
Statistiques d'Utilisation Réelle
#219
Sur 345 modèles au total
199.19M
Total des Tokens des 30 derniers jours
6.64M
Usage Moyen Quotidien
51%
Changement d'Usage Hebdomadaire