Рейтинг LLM-моделей Рейтинги и Статистика Моделей на Основе Использования в Реальном Времени
Сравните и проанализируйте фактическое использование и производительность LLM моделей с различных точек зрения
Ежедневно По модели Модели с высокими способностями к рассуждению (исключая бесплатные модели) ТОП 10
Руководство по Индикатору Коэффициента Мышления
Коэффициент мышления рассчитывается на основе соотношения токенов рассуждения / входных токенов. Чем выше это соотношение, тем больше внутренних процессов рассуждения проходит модель.
Эта метрика показывает, насколько глубокий мыслительный процесс проходит модель перед генерацией ответа. Модели с более высоким коэффициентом мышления могут производить более сложные результаты в задачах, таких как решение сложных проблем, логическое рассуждение и многоэтапное планирование. Однако высокий коэффициент мышления не обязательно означает лучшую производительность. В некоторых задачах чрезмерное внутреннее рассуждение может привести к ненужным вычислительным затратам или быть неэффективным в ситуациях, где требуются краткие ответы. Поэтому эту метрику следует интерпретировать в соответствии с характеристиками и целью задачи.
Ранг | Название Модели | Входные токены | Токены рассуждений | Коэффициент мышления |
---|---|---|---|---|
1 | perplexity/sonar-deep-research | 3.96M | 124.91M | 31.5366 |
2 | deepseek/deepseek-r1-distill-qwen-14b | 5.38M | 7.49M | 1.3909 |
3 | qwen/qwen3-8b-04-28 | 38.87M | 43.17M | 1.1107 |
4 | mistralai/magistral-medium-2506 | 24.58M | 18.22M | 0.7414 |
5 | deepseek/deepseek-r1-distill-llama-70b | 188.91M | 119.87M | 0.6346 |
6 | tencent/hunyuan-a13b-instruct | 23.76K | 14.82K | 0.6234 |
7 | openai/o3-mini-2025-01-31 | 87.57M | 50.81M | 0.5802 |
8 | thudm/glm-4.1v-9b-thinking | 13.38M | 7.49M | 0.5598 |
9 | openai/o1-mini-2024-09-12 | 223.69K | 118.40K | 0.5293 |
10 | deepseek/deepseek-r1-0528-qwen3-8b | 213.82M | 96.55M | 0.4516 |