DeepSeek V3.1 Base AI 모델의 상세 정보와 가격을 확인하세요

컨텍스트 길이 163,840 토큰, deepseek 에서 제공

163,840
컨텍스트 토큰
$0.20
프롬프트 가격
$0.80
출력 가격
9/16
기능 지원

모델 소개

This is a base model, trained only for raw next-token prediction. Unlike instruct/chat models, it has not been fine-tuned to follow user instructions. Prompts need to be written more like training text or examples rather than simple requests (e.g., “Translate the following sentence…” instead of just “Translate this”). DeepSeek-V3.1 Base is a 671B parameter open Mixture-of-Experts (MoE) language model with 37B active parameters per forward pass and a context length of 128K tokens. Trained on 14.8T tokens using FP8 mixed precision, it achieves high training efficiency and stability, with strong performance across language, reasoning, math, and coding tasks.

기본 정보

개발사
deepseek
모델 시리즈
DeepSeek
출시일
2025-08-20
컨텍스트 길이
163,840 토큰
변형
standard

가격 정보

프롬프트 토큰
$0.20 / 1M 토큰
완료 토큰
$0.80 / 1M 토큰

데이터 정책

이용약관

학습 정책

1

지원 기능

지원됨 (9)

Top K
Seed
Frequency Penalty
Presence Penalty
Repetition Penalty
Min P
Logit Bias
Logprobs
Top Logprobs

미지원 (7)

이미지 입력
Response Format
도구 사용
구조화된 출력
추론
Web Search Options
Top A

실제 사용량 통계

최근 사용량 데이터가 없습니다.

동일 제작사 모델 (deepseek)

DeepSeek V3.1
163,840 토큰
$0.20 / $0.80
DeepSeek V3.1 (free)
64,000 토큰
무료
DeepSeek V3.1 (thinking)
131,072 토큰
$0.55 / $2.19
R1 Distill Qwen 7B
131,072 토큰
$0.00 / $0.00
Deepseek R1 0528 Qwen3 8B (free)
131,072 토큰
무료

유사 가격대 모델

DeepSeek V3.1
deepseek
163,840 토큰
$0.20 / $0.80
R1 0528
deepseek
163,840 토큰
$0.20 / $0.80
Qwen3 Coder 480B A35B
qwen
262,144 토큰
$0.20 / $0.80
DeepSeek V3 0324
deepseek
163,840 토큰
$0.20 / $0.80
MAI DS R1
microsoft
163,840 토큰
$0.20 / $0.80