R1 Distill Qwen 14B (free) Consultez les informations détaillées et les prix des modèles d'IA

Contexte Longueur 64,000 tokens, deepseek de fourni

64,000

Tokens de Contexte

Gratuit

Prix du Prompt

Gratuit

Prix de sortie

10/16

Support de Fonctionnalités

Présentation du Modèle

DeepSeek R1 Distill Qwen 14B is a distilled large language model based on [Qwen 2.5 14B](https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-14B), using outputs from [DeepSeek R1](/deepseek/deepseek-r1). It outperforms OpenAI's o1-mini across various benchmarks, achieving new state-of-the-art results for dense models. Other benchmark results include: - AIME 2024 pass@1: 69.7 - MATH-500 pass@1: 93.9 - CodeForces Rating: 1481 The model leverages fine-tuning from DeepSeek R1's outputs, enabling competitive performance comparable to larger frontier models.

Informations de Base

Développeur

deepseek

Série de Modèles

Qwen

Date de sortie

2025-01-29

Longueur de Contexte

64,000 tokens

Variante

free

Informations sur les Prix

Ce modèle est gratuit

Politique de Données

Conditions d'utilisation

학습 정책

Fonctionnalités Prises en Charge

Pris en charge (10)

Top K

Seed

Pénalité de Fréquence

Pénalité de Présence

Pénalité de Répétition

Min P

Biais Logit

Logprobs

Top Logprobs

Raisonnement

Non pris en charge (6)

Entrée d'Image

Format de Réponse

Utilisation d'Outils

Sorties Structurées

Options de Recherche Web

Top A

Autres Variantes

R1 Distill Qwen 14B

standard

$0.15 / $0.15

Statistiques d'Utilisation Réelle

Aucune donnée d'utilisation récente disponible.

Modèles du Même Auteur (deepseek)

DeepSeek V3.1

163,840 tokens

$0.25 / $1.00

Voir les détails

DeepSeek V3.1 (free)

32,768 tokens

Gratuit

Voir les détails

DeepSeek V3.1 (thinking)

131,072 tokens

$0.55 / $2.19

Voir les détails

DeepSeek V3.1 Base

163,840 tokens

$0.25 / $1.00

Voir les détails

R1 Distill Qwen 7B

131,072 tokens

$0.00 / $0.00

Voir les détails