DeepSeek V3.1 Base Consultez les informations détaillées et les prix des modèles d'IA
Contexte Longueur 163,840 tokens, deepseek de fourni
163,840
Tokens de Contexte
$0.20
Prix du Prompt
$0.80
Prix de sortie
9/16
Support de Fonctionnalités
Présentation du Modèle
This is a base model, trained only for raw next-token prediction. Unlike instruct/chat models, it has not been fine-tuned to follow user instructions. Prompts need to be written more like training text or examples rather than simple requests (e.g., “Translate the following sentence…” instead of just “Translate this”). DeepSeek-V3.1 Base is a 671B parameter open Mixture-of-Experts (MoE) language model with 37B active parameters per forward pass and a context length of 128K tokens. Trained on 14.8T tokens using FP8 mixed precision, it achieves high training efficiency and stability, with strong performance across language, reasoning, math, and coding tasks.
Informations de Base
Développeur
deepseek
Série de Modèles
DeepSeek
Date de sortie
2025-08-20
Longueur de Contexte
163,840 tokens
Variante
standard
Informations sur les Prix
Jetons de Prompt
$0.20 / 1M jetons
Tokens de Complétion
$0.80 / 1M jetons
Politique de Données
Conditions d'utilisation
학습 정책
1
Fonctionnalités Prises en Charge
Pris en charge (9)
Top K
Seed
Pénalité de Fréquence
Pénalité de Présence
Pénalité de Répétition
Min P
Biais Logit
Logprobs
Top Logprobs
Non pris en charge (7)
Entrée d'Image
Format de Réponse
Utilisation d'Outils
Sorties Structurées
Raisonnement
Options de Recherche Web
Top A