DeepSeek V3.1 Base 查看AI模型的詳細資訊和價格
上下文 長度 163,840 代幣, deepseek 來自 提供
163,840
上下文權杖
$0.20
提示價格
$0.80
輸出價格
9/16
功能支援
模型介紹
This is a base model, trained only for raw next-token prediction. Unlike instruct/chat models, it has not been fine-tuned to follow user instructions. Prompts need to be written more like training text or examples rather than simple requests (e.g., “Translate the following sentence…” instead of just “Translate this”). DeepSeek-V3.1 Base is a 671B parameter open Mixture-of-Experts (MoE) language model with 37B active parameters per forward pass and a context length of 128K tokens. Trained on 14.8T tokens using FP8 mixed precision, it achieves high training efficiency and stability, with strong performance across language, reasoning, math, and coding tasks.
基本資訊
開發商
deepseek
模型系列
DeepSeek
發布日期
2025-08-20
上下文長度
163,840 令牌
變體
standard
價格資訊
提示令牌
$0.20 / 1M 代幣
完成令牌
$0.80 / 1M 代幣
資料政策
使用條款
학습 정책
1
支援功能
支援 (9)
Top K
種子
頻率懲罰
存在懲罰
重複懲罰
Min P
Logit偏置
Logprobs
Top Logprobs
不支援 (7)
圖像輸入
回應格式
工具使用
結構化輸出
推理
網路搜尋選項
Top A