R1 Distill Qwen 32B Проверьте подробную информацию и цены на модели ИИ
Контекст Длина 131,072 токенов, deepseek от предоставлено
131,072
Контекстные токены
$0.27
Цена промпта
$0.27
Цена вывода
8/16
Поддержка Функций
Рассуждение #16
Обзор модели
DeepSeek R1 Distill Qwen 32B is a distilled large language model based on [Qwen 2.5 32B](https://huggingface.co/Qwen/Qwen2.5-32B), using outputs from [DeepSeek R1](/deepseek/deepseek-r1). It outperforms OpenAI's o1-mini across various benchmarks, achieving new state-of-the-art results for dense models.\n\nOther benchmark results include:\n\n- AIME 2024 pass@1: 72.6\n- MATH-500 pass@1: 94.3\n- CodeForces Rating: 1691\n\nThe model leverages fine-tuning from DeepSeek R1's outputs, enabling competitive performance comparable to larger frontier models.
Основная информация
Разработчик
deepseek
Серия моделей
Qwen
Дата выпуска
2025-01-29
Длина Контекста
131,072 токенов
Максимум токенов завершения
16,384 токенов
Вариант
standard
Информация о Ценах
Токены Промпта
$0.27 / 1M токены
Токены завершения
$0.27 / 1M токены
Политика данных
Поддерживаемые Функции
Поддерживается (8)
Top K
Сид
Штраф за Частоту
Штраф за присутствие
Штраф за Повторение
Формат Ответа
Min P
Рассуждение
Не поддерживается (8)
Ввод Изображения
Logit-смещение
Использование Инструментов
Logprobs
Top Logprobs
Структурированные выходы
Параметры веб-поиска
Top A
Другие Варианты
Статистика фактического использования
#107
Из 353 моделей всего
6.1B
Общее количество токенов за последние 30 дней
203.34M
Среднесуточное использование
12%
Изменение недельного использования