R1 Distill Qwen 7B AIモデルの詳細情報と価格を確認してください

コンテキスト 長さ 131,072 トークン、 deepseek から 提供

131,072
コンテキストトークン
$0.10
プロンプト価格
$0.20
出力価格
2/16
機能サポート
効率性 1位

モデル紹介

DeepSeek-R1-Distill-Qwen-7B is a 7 billion parameter dense language model distilled from DeepSeek-R1, leveraging reinforcement learning-enhanced reasoning data generated by DeepSeek's larger models. The distillation process transfers advanced reasoning, math, and code capabilities into a smaller, more efficient model architecture based on Qwen2.5-Math-7B. This model demonstrates strong performance across mathematical benchmarks (92.8% pass@1 on MATH-500), coding tasks (Codeforces rating 1189), and general reasoning (49.1% pass@1 on GPQA Diamond), achieving competitive accuracy relative to larger models while maintaining smaller inference costs.

基本情報

開発者
deepseek
モデルシリーズ
Qwen
リリース日
2025-05-30
コンテキスト長
131,072 トークン
バリアント
standard

価格情報

プロンプトトークン
$0.10 / 1M トークン
完了トークン
$0.20 / 1M トークン

データポリシー

サポート機能

サポート済み (2)

シード
推論

未対応 (14)

画像入力
Top K
頻度ペナルティ
Presence Penalty
繰り返しペナルティ
レスポンス形式
Min P
Logitバイアス
ツール使用
Logprobs
Top Logprobs
構造化出力
Web検索オプション
Top A

実際の使用量統計

#196
全346個のモデル中
330.11M
過去30日間の総トークン数
17.37M
1日平均使用量
78%
週間使用量変化

過去30日間の使用量推移

同一作者モデル (deepseek)

Deepseek R1 0528 Qwen3 8B (free)
131,072 トークン
無料
Deepseek R1 0528 Qwen3 8B
131,072 トークン
$0.05 / $0.10
R1 0528 (free)
163,840 トークン
無料
R1 0528
128,000 トークン
$0.50 / $2.15
DeepSeek Prover V2 (free)
163,840 トークン
無料

類似価格帯モデル

Gemma 3 27B
google
131,072 トークン
$0.10 / $0.20
Mistral 7B Instruct v0.1
mistralai
2,824 トークン
$0.11 / $0.19
R1 Distill Qwen 32B
deepseek
131,072 トークン
$0.12 / $0.18
Mixtral 8x7B Instruct
mistralai
32,768 トークン
$0.08 / $0.24