Рейтинг LLM-моделей Рейтинги и Статистика Моделей на Основе Использования в Реальном Времени
Сравните и проанализируйте фактическое использование и производительность LLM моделей с различных точек зрения
Месячный По модели Модели с высокими способностями к рассуждению (исключая бесплатные модели) ТОП 10
Руководство по Индикатору Коэффициента Мышления
Коэффициент мышления рассчитывается на основе соотношения токенов рассуждения / входных токенов. Чем выше это соотношение, тем больше внутренних процессов рассуждения проходит модель.
Эта метрика показывает, насколько глубокий мыслительный процесс проходит модель перед генерацией ответа. Модели с более высоким коэффициентом мышления могут производить более сложные результаты в задачах, таких как решение сложных проблем, логическое рассуждение и многоэтапное планирование. Однако высокий коэффициент мышления не обязательно означает лучшую производительность. В некоторых задачах чрезмерное внутреннее рассуждение может привести к ненужным вычислительным затратам или быть неэффективным в ситуациях, где требуются краткие ответы. Поэтому эту метрику следует интерпретировать в соответствии с характеристиками и целью задачи.
Ранг | Название Модели | Входные токены | Токены рассуждений | Коэффициент мышления |
---|---|---|---|---|
1 | perplexity/sonar-deep-research | 125.24M | 3.8B | 30.542 |
2 | x-ai/grok-3-mini-beta | 10.2B | 11.6B | 1.1399 |
3 | deepseek/deepseek-r1-distill-qwen-1.5b | 97.37M | 110.88M | 1.1387 |
4 | openai/o1-preview | 5.91M | 5.12M | 0.8661 |
5 | deepseek/deepseek-r1-distill-qwen-7b | 73.84M | 60.75M | 0.8227 |
6 | deepseek/deepseek-r1-distill-llama-8b | 349.75M | 272.94M | 0.7804 |
7 | qwen/qwen3-8b-04-28 | 3.3B | 2.5B | 0.7559 |
8 | openai/o1-mini-2024-09-12 | 10.18M | 6.57M | 0.6448 |
9 | deepseek/deepseek-r1-0528-qwen3-8b | 4.9B | 2.9B | 0.6009 |
10 | thudm/glm-z1-32b-0414 | 2.59M | 1.34M | 0.516 |