R1 Distill Qwen 14B (free) Confira informações detalhadas e preços dos modelos de AI

Contexto Comprimento 64,000 tokens, deepseek de fornecido

64,000

Tokens de Contexto

Grátis

Preço do Prompt

Grátis

Preço de saída

10/16

Suporte de Recursos

Introdução do Modelo

DeepSeek R1 Distill Qwen 14B is a distilled large language model based on [Qwen 2.5 14B](https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-14B), using outputs from [DeepSeek R1](/deepseek/deepseek-r1). It outperforms OpenAI's o1-mini across various benchmarks, achieving new state-of-the-art results for dense models. Other benchmark results include: - AIME 2024 pass@1: 69.7 - MATH-500 pass@1: 93.9 - CodeForces Rating: 1481 The model leverages fine-tuning from DeepSeek R1's outputs, enabling competitive performance comparable to larger frontier models.

Informações Básicas

Desenvolvedor

deepseek

Série de Modelos

Qwen

Data de lançamento

2025-01-29

Comprimento do Contexto

64,000 tokens

Variante

free

Informações de Preços

Este modelo é gratuito

Política de Dados

Termos de Serviço

학습 정책

Recursos Suportados

Suportado (10)

Top K

Seed

Penalidade de Frequência

Penalidade de Presença

Penalidade de Repetição

Min P

Viés Logit

Logprobs

Top Logprobs

Raciocínio

Não suportado (6)

Entrada de Imagem

Formato de Resposta

Uso de Ferramentas

Saídas Estruturadas

Opções de Pesquisa Web

Top A

Outras Variantes

R1 Distill Qwen 14B

standard

$0.15 / $0.15

Estatísticas de Uso Real

Nenhum dado de uso recente disponível.

Modelos do Mesmo Autor (deepseek)

DeepSeek V3.1

163,840 tokens

$0.25 / $1.00

Ver Detalhes

DeepSeek V3.1 (free)

32,768 tokens

Grátis

Ver Detalhes

DeepSeek V3.1 (thinking)

131,072 tokens

$0.55 / $2.19

Ver Detalhes

DeepSeek V3.1 Base

163,840 tokens

$0.25 / $1.00

Ver Detalhes

R1 Distill Qwen 7B

131,072 tokens

$0.00 / $0.00

Ver Detalhes