DeepSeek V3.1 Base 查看AI模型的详细信息和价格
上下文 长度 163,840 令牌, deepseek 来自 提供
163,840
上下文令牌
$0.20
提示价格
$0.80
输出价格
9/16
功能支持
模型介绍
This is a base model, trained only for raw next-token prediction. Unlike instruct/chat models, it has not been fine-tuned to follow user instructions. Prompts need to be written more like training text or examples rather than simple requests (e.g., “Translate the following sentence…” instead of just “Translate this”). DeepSeek-V3.1 Base is a 671B parameter open Mixture-of-Experts (MoE) language model with 37B active parameters per forward pass and a context length of 128K tokens. Trained on 14.8T tokens using FP8 mixed precision, it achieves high training efficiency and stability, with strong performance across language, reasoning, math, and coding tasks.
基本信息
开发商
deepseek
模型系列
DeepSeek
发布日期
2025-08-20
上下文长度
163,840 令牌
变体
standard
价格信息
提示令牌
$0.20 / 1M 令牌
完成令牌
$0.80 / 1M 令牌
数据政策
使用条款
학습 정책
1
支持功能
支持 (9)
Top K
种子
频率惩罚
存在惩罚
重复惩罚
Min P
Logit偏置
Logprobs
Top Logprobs
不支持 (7)
图像输入
响应格式
工具使用
结构化输出
推理
网络搜索选项
Top A