DeepSeek V3.1 Base Confira informações detalhadas e preços dos modelos de AI
Contexto Comprimento 163,840 tokens, deepseek de fornecido
163,840
Tokens de Contexto
$0.20
Preço do Prompt
$0.80
Preço de saída
9/16
Suporte de Recursos
Introdução do Modelo
This is a base model, trained only for raw next-token prediction. Unlike instruct/chat models, it has not been fine-tuned to follow user instructions. Prompts need to be written more like training text or examples rather than simple requests (e.g., “Translate the following sentence…” instead of just “Translate this”). DeepSeek-V3.1 Base is a 671B parameter open Mixture-of-Experts (MoE) language model with 37B active parameters per forward pass and a context length of 128K tokens. Trained on 14.8T tokens using FP8 mixed precision, it achieves high training efficiency and stability, with strong performance across language, reasoning, math, and coding tasks.
Informações Básicas
Desenvolvedor
deepseek
Série de Modelos
DeepSeek
Data de lançamento
2025-08-20
Comprimento do Contexto
163,840 tokens
Variante
standard
Informações de Preços
Tokens de Prompt
$0.20 / 1M tokens
Tokens de Conclusão
$0.80 / 1M tokens
Política de Dados
Termos de Serviço
학습 정책
1
Recursos Suportados
Suportado (9)
Top K
Seed
Penalidade de Frequência
Penalidade de Presença
Penalidade de Repetição
Min P
Viés Logit
Logprobs
Top Logprobs
Não suportado (7)
Entrada de Imagem
Formato de Resposta
Uso de Ferramentas
Saídas Estruturadas
Raciocínio
Opções de Pesquisa Web
Top A