R1 Distill Qwen 14B Проверьте подробную информацию и цены на модели ИИ
Контекст Длина 64,000 токенов, deepseek от предоставлено
64,000
Контекстные токены
$0.15
Цена промпта
$0.15
Цена вывода
8/16
Поддержка Функций
Рассуждение #12
Обзор модели
DeepSeek R1 Distill Qwen 14B is a distilled large language model based on [Qwen 2.5 14B](https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-14B), using outputs from [DeepSeek R1](/deepseek/deepseek-r1). It outperforms OpenAI's o1-mini across various benchmarks, achieving new state-of-the-art results for dense models. Other benchmark results include: - AIME 2024 pass@1: 69.7 - MATH-500 pass@1: 93.9 - CodeForces Rating: 1481 The model leverages fine-tuning from DeepSeek R1's outputs, enabling competitive performance comparable to larger frontier models.
Основная информация
Разработчик
deepseek
Серия моделей
Qwen
Дата выпуска
2025-01-29
Длина Контекста
64,000 токенов
Максимум токенов завершения
32,000 токенов
Вариант
standard
Информация о Ценах
Токены Промпта
$0.15 / 1M токены
Токены завершения
$0.15 / 1M токены
Политика данных
Поддерживаемые Функции
Поддерживается (8)
Top K
Сид
Штраф за Частоту
Штраф за присутствие
Штраф за Повторение
Min P
Logit-смещение
Рассуждение
Не поддерживается (8)
Ввод Изображения
Формат Ответа
Использование Инструментов
Logprobs
Top Logprobs
Структурированные выходы
Параметры веб-поиска
Top A
Другие Варианты
Статистика фактического использования
#215
Из 345 моделей всего
238.53M
Общее количество токенов за последние 30 дней
7.95M
Среднесуточное использование
61%
Изменение недельного использования