R1 Distill Llama 70B 查看AI模型的詳細資訊和價格

上下文 長度 131,072 代幣, deepseek 來自 提供

131,072
上下文權杖
$0.03
提示價格
$0.10
輸出價格
10/16
功能支援
程式設計 第18位
學術界 第18位
問答 第18位
角色扮演 第18位
finance 第18位
科學 第18位
健康 第18位
SEO 第18位
法律 第18位
技術 第18位
行銷 第18位
翻譯 第18位
推理 第7位

模型介紹

DeepSeek R1 Distill Llama 70B is a distilled large language model based on [Llama-3.3-70B-Instruct](/meta-llama/llama-3.3-70b-instruct), using outputs from [DeepSeek R1](/deepseek/deepseek-r1). The model combines advanced distillation techniques to achieve high performance across multiple benchmarks, including: - AIME 2024 pass@1: 70.0 - MATH-500 pass@1: 94.5 - CodeForces Rating: 1633 The model leverages fine-tuning from DeepSeek R1's outputs, enabling competitive performance comparable to larger frontier models.

基本資訊

開發商
deepseek
模型系列
Llama3
發布日期
2025-01-23
上下文長度
131,072 令牌
變體
standard

價格資訊

提示令牌
$0.03 / 1M 代幣
完成令牌
$0.10 / 1M 代幣

資料政策

使用條款

학습 정책

1

支援功能

支援 (10)

Top K
種子
頻率懲罰
存在懲罰
重複懲罰
Min P
Logit偏置
Logprobs
Top Logprobs
推理

不支援 (6)

圖像輸入
回應格式
工具使用
結構化輸出
網路搜尋選項
Top A

其他變體

實際使用量統計

#70
總共 353 個模型中
19.7B
最近30天總Token數
658.17M
日均使用量
44%
週使用量變化

最近30天使用量趨勢

同作者模型 (deepseek)

DeepSeek V3.1
163,840 令牌
$0.20 / $0.80
DeepSeek V3.1 (free)
64,000 令牌
免費
DeepSeek V3.1 (thinking)
131,072 令牌
$0.55 / $2.19
DeepSeek V3.1 Base
163,840 令牌
$0.20 / $0.80
R1 Distill Qwen 7B
131,072 令牌
$0.00 / $0.00