R1 Distill Llama 70B Проверьте подробную информацию и цены на модели ИИ
Контекст Длина 131,072 токенов, deepseek от предоставлено
131,072
Контекстные токены
$0.03
Цена промпта
$0.10
Цена вывода
10/16
Поддержка Функций
академия #18
викторина #18
ролевая игра #18
finance #18
наука #18
здоровье #18
SEO #18
правовой #18
технология #18
маркетинг #18
перевод #18
программирование #18
Рассуждение #7
Обзор модели
DeepSeek R1 Distill Llama 70B is a distilled large language model based on [Llama-3.3-70B-Instruct](/meta-llama/llama-3.3-70b-instruct), using outputs from [DeepSeek R1](/deepseek/deepseek-r1). The model combines advanced distillation techniques to achieve high performance across multiple benchmarks, including: - AIME 2024 pass@1: 70.0 - MATH-500 pass@1: 94.5 - CodeForces Rating: 1633 The model leverages fine-tuning from DeepSeek R1's outputs, enabling competitive performance comparable to larger frontier models.
Основная информация
Разработчик
deepseek
Серия моделей
Llama3
Дата выпуска
2025-01-23
Длина Контекста
131,072 токенов
Вариант
standard
Информация о Ценах
Токены Промпта
$0.03 / 1M токены
Токены завершения
$0.10 / 1M токены
Политика данных
Условия использования
학습 정책
1
Поддерживаемые Функции
Поддерживается (10)
Top K
Сид
Штраф за Частоту
Штраф за присутствие
Штраф за Повторение
Min P
Logit-смещение
Logprobs
Top Logprobs
Рассуждение
Не поддерживается (6)
Ввод Изображения
Формат Ответа
Использование Инструментов
Структурированные выходы
Параметры веб-поиска
Top A
Другие Варианты
Статистика фактического использования
#70
Из 353 моделей всего
19.7B
Общее количество токенов за последние 30 дней
658.17M
Среднесуточное использование
44%
Изменение недельного использования