Рейтинг LLM моделей

Рейтинг Моделей Рейтинг по издателю Рейтинги по Категориям Популярные модели Рейтинг Эффективности Рейтинг соотношения мышления График Ежедневного Использования Соотношение использования категорий Распределение моделей по категориям Топ модели всех категорий Рейтинг приложений Рейтинг приложений по категориям

Еженедельно По модели Модели с высокими способностями к рассуждению (исключая бесплатные модели) ТОП 10

Руководство по Индикатору Коэффициента Мышления

Коэффициент мышления рассчитывается на основе соотношения токенов рассуждения / входных токенов. Чем выше это соотношение, тем больше внутренних процессов рассуждения проходит модель.

Эта метрика показывает, насколько глубокий мыслительный процесс проходит модель перед генерацией ответа. Модели с более высоким коэффициентом мышления могут производить более сложные результаты в задачах, таких как решение сложных проблем, логическое рассуждение и многоэтапное планирование. Однако высокий коэффициент мышления не обязательно означает лучшую производительность. В некоторых задачах чрезмерное внутреннее рассуждение может привести к ненужным вычислительным затратам или быть неэффективным в ситуациях, где требуются краткие ответы. Поэтому эту метрику следует интерпретировать в соответствии с характеристиками и целью задачи.

Ранг	Название Модели	Входные токены	Токены рассуждений	Коэффициент мышления
1	perplexity/sonar-deep-research	33.19M	900.63M	27.1334
2	cognitivecomputations/dolphin3.0-r1-mistral-24b	7.96M	7.79M	0.9792
3	deepseek/deepseek-r1-distill-llama-8b	87.63M	74.63M	0.8517
4	deepseek/deepseek-r1-distill-qwen-1.5b	5.98M	4.75M	0.7946
5	deepseek/deepseek-r1-distill-qwen-14b	105.33M	75.94M	0.721
6	qwen/qwen3-8b-04-28	344.59M	229.96M	0.6673
7	openai/o1-mini-2024-09-12	1.48M	985.58K	0.6638
8	thudm/glm-4.1v-9b-thinking	78.60M	51.84M	0.6595
9	deepseek/deepseek-r1-distill-llama-70b	1.7B	1.0B	0.5841
10	thudm/glm-z1-32b-0414	260.06K	140.71K	0.5411