Classificação de Modelos LLM

Classificação de Modelos Ranking por Editora Rankings por Categoria Modelos em Alta Classificação de Eficiência Classificação de Proporção de Pensamento Gráfico de Uso Diário Proporção de Uso por Categoria Distribuição de Modelos por Categoria Modelos Top Todas as Categorias Ranking de Apps Ranking de Apps por Categoria

Semanal Por Modelo Modelos de Alto Raciocínio (excluindo modelos gratuitos) TOP 10

Guia do Indicador de Taxa de Pensamento

A proporção de pensamento é calculada com base na proporção de tokens de raciocínio / tokens de entrada. Quanto maior for esta proporção, mais processos de raciocínio interno o modelo passa.

Esta métrica indica quão profundo é o processo de pensamento que o modelo passa antes de gerar uma resposta. Modelos com maior proporção de pensamento têm a possibilidade de produzir resultados mais sofisticados em tarefas como resolução de problemas complexos, raciocínio lógico e planejamento de múltiplas etapas. No entanto, uma alta proporção de pensamento não significa necessariamente melhor desempenho. Em algumas tarefas, o raciocínio interno excessivo pode gerar custos computacionais desnecessários ou ser ineficiente em situações onde respostas concisas são necessárias. Portanto, esta métrica deve ser interpretada de acordo com as características e propósito da tarefa.

Classificação	Nome do Modelo	Tokens de Entrada	Tokens de Raciocínio	Taxa de Pensamento
1	perplexity/sonar-deep-research	33.19M	900.63M	27.1334
2	cognitivecomputations/dolphin3.0-r1-mistral-24b	7.96M	7.79M	0.9792
3	deepseek/deepseek-r1-distill-llama-8b	87.63M	74.63M	0.8517
4	deepseek/deepseek-r1-distill-qwen-1.5b	5.98M	4.75M	0.7946
5	deepseek/deepseek-r1-distill-qwen-14b	105.33M	75.94M	0.721
6	qwen/qwen3-8b-04-28	344.59M	229.96M	0.6673
7	openai/o1-mini-2024-09-12	1.48M	985.58K	0.6638
8	thudm/glm-4.1v-9b-thinking	78.60M	51.84M	0.6595
9	deepseek/deepseek-r1-distill-llama-70b	1.7B	1.0B	0.5841
10	thudm/glm-z1-32b-0414	260.06K	140.71K	0.5411