R1 Distill Qwen 7B AI 모델의 상세 정보와 가격을 확인하세요
컨텍스트 길이 131,072 토큰, deepseek 에서 제공
131,072
컨텍스트 토큰
$0.10
프롬프트 가격
$0.20
출력 가격
2/16
기능 지원
효율성 1위
모델 소개
DeepSeek-R1-Distill-Qwen-7B is a 7 billion parameter dense language model distilled from DeepSeek-R1, leveraging reinforcement learning-enhanced reasoning data generated by DeepSeek's larger models. The distillation process transfers advanced reasoning, math, and code capabilities into a smaller, more efficient model architecture based on Qwen2.5-Math-7B. This model demonstrates strong performance across mathematical benchmarks (92.8% pass@1 on MATH-500), coding tasks (Codeforces rating 1189), and general reasoning (49.1% pass@1 on GPQA Diamond), achieving competitive accuracy relative to larger models while maintaining smaller inference costs.
기본 정보
개발사
deepseek
모델 시리즈
Qwen
출시일
2025-05-30
컨텍스트 길이
131,072 토큰
변형
standard
가격 정보
프롬프트 토큰
$0.10 / 1M 토큰
완료 토큰
$0.20 / 1M 토큰
데이터 정책
지원 기능
지원됨 (2)
Seed
추론
미지원 (14)
이미지 입력
Top K
Frequency Penalty
Presence Penalty
Repetition Penalty
Response Format
Min P
Logit Bias
도구 사용
Logprobs
Top Logprobs
구조화된 출력
Web Search Options
Top A
실제 사용량 통계
#196
전체 346개 모델 중
330.11M
최근 30일 총 토큰
17.37M
일평균 사용량
78%
주간 사용량 변화