R1 Distill Qwen 32B Проверьте подробную информацию и цены на модели ИИ
Контекст Длина 131,072 токенов, deepseek от предоставлено
131,072
Контекстные токены
$0.12
Цена промпта
$0.18
Цена вывода
8/16
Поддержка Функций
Обзор модели
DeepSeek R1 Distill Qwen 32B is a distilled large language model based on [Qwen 2.5 32B](https://huggingface.co/Qwen/Qwen2.5-32B), using outputs from [DeepSeek R1](/deepseek/deepseek-r1). It outperforms OpenAI's o1-mini across various benchmarks, achieving new state-of-the-art results for dense models.\n\nOther benchmark results include:\n\n- AIME 2024 pass@1: 72.6\n- MATH-500 pass@1: 94.3\n- CodeForces Rating: 1691\n\nThe model leverages fine-tuning from DeepSeek R1's outputs, enabling competitive performance comparable to larger frontier models.
Основная информация
Разработчик
deepseek
Серия моделей
Qwen
Дата выпуска
2025-01-29
Длина Контекста
131,072 токенов
Максимум токенов завершения
16,384 токенов
Вариант
standard
Информация о Ценах
Токены Промпта
$0.12 / 1M токены
Токены завершения
$0.18 / 1M токены
Политика данных
Поддерживаемые Функции
Поддерживается (8)
Top K
Сид
Штраф за Частоту
Штраф за присутствие
Штраф за Повторение
Формат Ответа
Min P
Рассуждение
Не поддерживается (8)
Ввод Изображения
Logit-смещение
Использование Инструментов
Logprobs
Top Logprobs
Структурированные выходы
Параметры веб-поиска
Top A
Другие Варианты
Статистика фактического использования
#129
Из 345 моделей всего
1.9B
Общее количество токенов за последние 30 дней
62.80M
Среднесуточное использование
42%
Изменение недельного использования