R1 Distill Llama 70B 查看AI模型的详细信息和价格
上下文 长度 131,072 令牌, deepseek 来自 提供
131,072
上下文令牌
$0.03
提示价格
$0.10
输出价格
10/16
功能支持
编程 第18位
学术界 第18位
问答 第18位
角色扮演 第18位
finance 第18位
科学 第18位
健康 第18位
SEO 第18位
法律 第18位
技术 第18位
营销 第18位
翻译 第18位
推理 第7位
模型介绍
DeepSeek R1 Distill Llama 70B is a distilled large language model based on [Llama-3.3-70B-Instruct](/meta-llama/llama-3.3-70b-instruct), using outputs from [DeepSeek R1](/deepseek/deepseek-r1). The model combines advanced distillation techniques to achieve high performance across multiple benchmarks, including: - AIME 2024 pass@1: 70.0 - MATH-500 pass@1: 94.5 - CodeForces Rating: 1633 The model leverages fine-tuning from DeepSeek R1's outputs, enabling competitive performance comparable to larger frontier models.
基本信息
开发商
deepseek
模型系列
Llama3
发布日期
2025-01-23
上下文长度
131,072 令牌
变体
standard
价格信息
提示令牌
$0.03 / 1M 令牌
完成令牌
$0.10 / 1M 令牌
数据政策
使用条款
학습 정책
1
支持功能
支持 (10)
Top K
种子
频率惩罚
存在惩罚
重复惩罚
Min P
Logit偏置
Logprobs
Top Logprobs
推理
不支持 (6)
图像输入
响应格式
工具使用
结构化输出
网络搜索选项
Top A
其他变体
实际使用量统计
#70
总共 353 个模型中
19.7B
最近30天总Token数
658.17M
日均使用量
44%
周使用量变化