Рейтинг LLM-моделей Рейтинги и Статистика Моделей на Основе Использования в Реальном Времени
Сравните и проанализируйте фактическое использование и производительность LLM моделей с различных точек зрения
Ежедневно По модели Модели с высокими способностями к рассуждению (исключая бесплатные модели) ТОП 10
Руководство по Индикатору Коэффициента Мышления
Коэффициент мышления рассчитывается на основе соотношения токенов рассуждения / входных токенов. Чем выше это соотношение, тем больше внутренних процессов рассуждения проходит модель.
Эта метрика показывает, насколько глубокий мыслительный процесс проходит модель перед генерацией ответа. Модели с более высоким коэффициентом мышления могут производить более сложные результаты в задачах, таких как решение сложных проблем, логическое рассуждение и многоэтапное планирование. Однако высокий коэффициент мышления не обязательно означает лучшую производительность. В некоторых задачах чрезмерное внутреннее рассуждение может привести к ненужным вычислительным затратам или быть неэффективным в ситуациях, где требуются краткие ответы. Поэтому эту метрику следует интерпретировать в соответствии с характеристиками и целью задачи.
Ранг | Название Модели | Входные токены | Токены рассуждений | Коэффициент мышления |
---|---|---|---|---|
1 | perplexity/sonar-deep-research | 1.96M | 79.93M | 40.7464 |
2 | minimax/minimax-m1 | 13.70M | 45.36M | 3.3117 |
3 | qwen/qwen3-8b-04-28 | 12.64M | 14.09M | 1.1148 |
4 | openai/o1-mini | 13.55M | 14.14M | 1.0436 |
5 | deepseek/deepseek-r1-distill-qwen-1.5b | 928.56K | 817.08K | 0.8799 |
6 | deepseek/deepseek-r1-0528-qwen3-8b | 109.83M | 86.83M | 0.7906 |
7 | qwen/qwen3-14b-04-28 | 594.76M | 423.61M | 0.7122 |
8 | openai/o1-mini-2024-09-12 | 45.56K | 32.38K | 0.7107 |
9 | openai/o3-mini-high-2025-01-31 | 23.41M | 15.51M | 0.6624 |
10 | openai/o3-mini-2025-01-31 | 92.05M | 56.08M | 0.6092 |