DeepSeek V3.1 Base 查看AI模型的詳細資訊和價格

上下文 長度 163,840 代幣, deepseek 來自 提供

163,840
上下文權杖
$0.20
提示價格
$0.80
輸出價格
9/16
功能支援

模型介紹

This is a base model, trained only for raw next-token prediction. Unlike instruct/chat models, it has not been fine-tuned to follow user instructions. Prompts need to be written more like training text or examples rather than simple requests (e.g., “Translate the following sentence…” instead of just “Translate this”). DeepSeek-V3.1 Base is a 671B parameter open Mixture-of-Experts (MoE) language model with 37B active parameters per forward pass and a context length of 128K tokens. Trained on 14.8T tokens using FP8 mixed precision, it achieves high training efficiency and stability, with strong performance across language, reasoning, math, and coding tasks.

基本資訊

開發商
deepseek
模型系列
DeepSeek
發布日期
2025-08-20
上下文長度
163,840 令牌
變體
standard

價格資訊

提示令牌
$0.20 / 1M 代幣
完成令牌
$0.80 / 1M 代幣

資料政策

使用條款

학습 정책

1

支援功能

支援 (9)

Top K
種子
頻率懲罰
存在懲罰
重複懲罰
Min P
Logit偏置
Logprobs
Top Logprobs

不支援 (7)

圖像輸入
回應格式
工具使用
結構化輸出
推理
網路搜尋選項
Top A

實際使用量統計

暫無最近使用量資料。

同作者模型 (deepseek)

DeepSeek V3.1
163,840 令牌
$0.20 / $0.80
DeepSeek V3.1 (free)
64,000 令牌
免費
DeepSeek V3.1 (thinking)
131,072 令牌
$0.55 / $2.19
R1 Distill Qwen 7B
131,072 令牌
$0.00 / $0.00
Deepseek R1 0528 Qwen3 8B (free)
131,072 令牌
免費

相似價位模型

DeepSeek V3.1
deepseek
163,840 令牌
$0.20 / $0.80
R1 0528
deepseek
163,840 令牌
$0.20 / $0.80
Qwen3 Coder 480B A35B
qwen
262,144 令牌
$0.20 / $0.80
DeepSeek V3 0324
deepseek
163,840 令牌
$0.20 / $0.80
MAI DS R1
microsoft
163,840 令牌
$0.20 / $0.80