Рейтинг LLM-моделей Рейтинги и Статистика Моделей на Основе Использования в Реальном Времени
Сравните и проанализируйте фактическое использование и производительность LLM моделей с различных точек зрения
Ежедневно По модели Модели с высокими способностями к рассуждению (исключая бесплатные модели) ТОП 10
Руководство по Индикатору Коэффициента Мышления
Коэффициент мышления рассчитывается на основе соотношения токенов рассуждения / входных токенов. Чем выше это соотношение, тем больше внутренних процессов рассуждения проходит модель.
Эта метрика показывает, насколько глубокий мыслительный процесс проходит модель перед генерацией ответа. Модели с более высоким коэффициентом мышления могут производить более сложные результаты в задачах, таких как решение сложных проблем, логическое рассуждение и многоэтапное планирование. Однако высокий коэффициент мышления не обязательно означает лучшую производительность. В некоторых задачах чрезмерное внутреннее рассуждение может привести к ненужным вычислительным затратам или быть неэффективным в ситуациях, где требуются краткие ответы. Поэтому эту метрику следует интерпретировать в соответствии с характеристиками и целью задачи.
Ранг | Название Модели | Входные токены | Токены рассуждений | Коэффициент мышления |
---|---|---|---|---|
1 | perplexity/sonar-deep-research | 1.28M | 68.09M | 53.1884 |
2 | thudm/glm-z1-32b-0414 | 58.26K | 200.75K | 3.4458 |
3 | thudm/glm-z1-rumination-32b-0414 | 21.52K | 33.83K | 1.5716 |
4 | deepseek/deepseek-r1-distill-llama-8b | 33.89M | 38.89M | 1.1478 |
5 | deepseek/deepseek-r1-distill-llama-70b | 198.89M | 216.61M | 1.0891 |
6 | deepseek/deepseek-r1-distill-qwen-1.5b | 2.74M | 2.15M | 0.7877 |
7 | openai/o1-mini-2024-09-12 | 149.81K | 114.37K | 0.7634 |
8 | openai/o1-mini | 4.65M | 3.09M | 0.6646 |
9 | qwen/qwq-32b | 86.66M | 50.96M | 0.5881 |
10 | openai/o1-preview | 1.51M | 672.48K | 0.445 |