Рейтинг LLM-моделей Рейтинги и Статистика Моделей на Основе Использования в Реальном Времени
Сравните и проанализируйте фактическое использование и производительность LLM моделей с различных точек зрения
Еженедельно По модели Модели с высокими способностями к рассуждению (исключая бесплатные модели) ТОП 10
Руководство по Индикатору Коэффициента Мышления
Коэффициент мышления рассчитывается на основе соотношения токенов рассуждения / входных токенов. Чем выше это соотношение, тем больше внутренних процессов рассуждения проходит модель.
Эта метрика показывает, насколько глубокий мыслительный процесс проходит модель перед генерацией ответа. Модели с более высоким коэффициентом мышления могут производить более сложные результаты в задачах, таких как решение сложных проблем, логическое рассуждение и многоэтапное планирование. Однако высокий коэффициент мышления не обязательно означает лучшую производительность. В некоторых задачах чрезмерное внутреннее рассуждение может привести к ненужным вычислительным затратам или быть неэффективным в ситуациях, где требуются краткие ответы. Поэтому эту метрику следует интерпретировать в соответствии с характеристиками и целью задачи.
Ранг | Название Модели | Входные токены | Токены рассуждений | Коэффициент мышления |
---|---|---|---|---|
1 | perplexity/sonar-deep-research | 8.13M | 448.53M | 55.1685 |
2 | thudm/glm-z1-32b-0414 | 1.85M | 9.84M | 5.3066 |
3 | deepseek/deepseek-r1-distill-qwen-1.5b | 16.20M | 21.12M | 1.3037 |
4 | thudm/glm-z1-rumination-32b-0414 | 620.07K | 691.94K | 1.1159 |
5 | qwen/qwen3-8b-04-28 | 140.43M | 111.86M | 0.7966 |
6 | openai/o1-mini-2024-09-12 | 1.34M | 978.55K | 0.7308 |
7 | deepseek/deepseek-r1-distill-llama-70b | 1.5B | 997.49M | 0.6856 |
8 | deepseek/deepseek-r1-distill-llama-8b | 203.05M | 137.26M | 0.676 |
9 | openai/o1-mini | 32.46M | 21.09M | 0.6499 |
10 | deepseek/deepseek-r1-distill-qwen-14b | 22.99M | 14.20M | 0.6179 |