DeepSeek V3.1 Base AI 모델의 상세 정보와 가격을 확인하세요
컨텍스트 길이 163,840 토큰, deepseek 에서 제공
163,840
컨텍스트 토큰
$0.20
프롬프트 가격
$0.80
출력 가격
9/16
기능 지원
모델 소개
This is a base model, trained only for raw next-token prediction. Unlike instruct/chat models, it has not been fine-tuned to follow user instructions. Prompts need to be written more like training text or examples rather than simple requests (e.g., “Translate the following sentence…” instead of just “Translate this”). DeepSeek-V3.1 Base is a 671B parameter open Mixture-of-Experts (MoE) language model with 37B active parameters per forward pass and a context length of 128K tokens. Trained on 14.8T tokens using FP8 mixed precision, it achieves high training efficiency and stability, with strong performance across language, reasoning, math, and coding tasks.
기본 정보
개발사
deepseek
모델 시리즈
DeepSeek
출시일
2025-08-20
컨텍스트 길이
163,840 토큰
변형
standard
가격 정보
프롬프트 토큰
$0.20 / 1M 토큰
완료 토큰
$0.80 / 1M 토큰
데이터 정책
이용약관
학습 정책
1
지원 기능
지원됨 (9)
Top K
Seed
Frequency Penalty
Presence Penalty
Repetition Penalty
Min P
Logit Bias
Logprobs
Top Logprobs
미지원 (7)
이미지 입력
Response Format
도구 사용
구조화된 출력
추론
Web Search Options
Top A