Рейтинг LLM-моделей Рейтинги и Статистика Моделей на Основе Использования в Реальном Времени
Сравните и проанализируйте фактическое использование и производительность LLM моделей с различных точек зрения
Месячный По модели Модели с высокими способностями к рассуждению (исключая бесплатные модели) ТОП 10
Руководство по Индикатору Коэффициента Мышления
Коэффициент мышления рассчитывается на основе соотношения токенов рассуждения / входных токенов. Чем выше это соотношение, тем больше внутренних процессов рассуждения проходит модель.
Эта метрика показывает, насколько глубокий мыслительный процесс проходит модель перед генерацией ответа. Модели с более высоким коэффициентом мышления могут производить более сложные результаты в задачах, таких как решение сложных проблем, логическое рассуждение и многоэтапное планирование. Однако высокий коэффициент мышления не обязательно означает лучшую производительность. В некоторых задачах чрезмерное внутреннее рассуждение может привести к ненужным вычислительным затратам или быть неэффективным в ситуациях, где требуются краткие ответы. Поэтому эту метрику следует интерпретировать в соответствии с характеристиками и целью задачи.
Ранг | Название Модели | Входные токены | Токены рассуждений | Коэффициент мышления |
---|---|---|---|---|
1 | perplexity/sonar-deep-research | 70.58M | 2.2B | 30.8616 |
2 | deepseek/deepseek-r1-distill-qwen-1.5b | 104.40M | 132.48M | 1.2689 |
3 | deepseek/deepseek-r1-distill-qwen-7b | 128.26M | 109.82M | 0.8562 |
4 | thudm/glm-z1-rumination-32b-0414 | 238.59K | 202.33K | 0.848 |
5 | microsoft/mai-ds-r1 | 37.90M | 32.06M | 0.8459 |
6 | x-ai/grok-3-mini-beta | 23.2B | 16.7B | 0.7194 |
7 | openai/o1-preview | 19.59M | 13.92M | 0.7106 |
8 | deepseek/deepseek-r1-distill-llama-70b | 17.5B | 12.3B | 0.7017 |
9 | qwen/qwen3-8b-04-28 | 3.0B | 2.0B | 0.6651 |
10 | openai/o3-mini-high-2025-01-31 | 445.14M | 284.50M | 0.6391 |