R1 Distill Llama 70B Confira informações detalhadas e preços dos modelos de AI
Contexto Comprimento 131,072 tokens, deepseek de fornecido
131,072
Tokens de Contexto
$0.10
Preço do Prompt
$0.40
Preço de saída
8/16
Suporte de Recursos
ciência #15
Raciocínio #11
Introdução do Modelo
DeepSeek R1 Distill Llama 70B is a distilled large language model based on [Llama-3.3-70B-Instruct](/meta-llama/llama-3.3-70b-instruct), using outputs from [DeepSeek R1](/deepseek/deepseek-r1). The model combines advanced distillation techniques to achieve high performance across multiple benchmarks, including: - AIME 2024 pass@1: 70.0 - MATH-500 pass@1: 94.5 - CodeForces Rating: 1633 The model leverages fine-tuning from DeepSeek R1's outputs, enabling competitive performance comparable to larger frontier models.
Informações Básicas
Desenvolvedor
deepseek
Série de Modelos
Llama3
Data de lançamento
2025-01-23
Comprimento do Contexto
131,072 tokens
Tokens de Conclusão Máximos
16,384 tokens
Variante
standard
Informações de Preços
Tokens de Prompt
$0.10 / 1M tokens
Tokens de Conclusão
$0.40 / 1M tokens
Política de Dados
Recursos Suportados
Suportado (8)
Top K
Seed
Penalidade de Frequência
Penalidade de Presença
Penalidade de Repetição
Formato de Resposta
Min P
Raciocínio
Não suportado (8)
Entrada de Imagem
Viés Logit
Uso de Ferramentas
Logprobs
Top Logprobs
Saídas Estruturadas
Opções de Pesquisa Web
Top A
Outras Variantes
Estatísticas de Uso Real
#51
De 346 modelos no total
17.3B
Total de Tokens Últimos 30 Dias
575.52M
Uso Médio Diário
61%
Mudança de Uso Semanal