Classificação de Modelos LLM

Classificação de Modelos Ranking por Editora Rankings por Categoria Modelos em Alta Classificação de Eficiência Classificação de Proporção de Pensamento Gráfico de Uso Diário Proporção de Uso por Categoria Distribuição de Modelos por Categoria Modelos Top Todas as Categorias Ranking de Apps Ranking de Apps por Categoria

Diário Por Modelo Modelos de Alto Raciocínio (excluindo modelos gratuitos) TOP 10

Guia do Indicador de Taxa de Pensamento

A proporção de pensamento é calculada com base na proporção de tokens de raciocínio / tokens de entrada. Quanto maior for esta proporção, mais processos de raciocínio interno o modelo passa.

Esta métrica indica quão profundo é o processo de pensamento que o modelo passa antes de gerar uma resposta. Modelos com maior proporção de pensamento têm a possibilidade de produzir resultados mais sofisticados em tarefas como resolução de problemas complexos, raciocínio lógico e planejamento de múltiplas etapas. No entanto, uma alta proporção de pensamento não significa necessariamente melhor desempenho. Em algumas tarefas, o raciocínio interno excessivo pode gerar custos computacionais desnecessários ou ser ineficiente em situações onde respostas concisas são necessárias. Portanto, esta métrica deve ser interpretada de acordo com as características e propósito da tarefa.

Classificação	Nome do Modelo	Tokens de Entrada	Tokens de Raciocínio	Taxa de Pensamento
1	perplexity/sonar-deep-research	3.96M	124.91M	31.5366
2	deepseek/deepseek-r1-distill-qwen-14b	5.38M	7.49M	1.3909
3	qwen/qwen3-8b-04-28	38.87M	43.17M	1.1107
4	mistralai/magistral-medium-2506	24.58M	18.22M	0.7414
5	deepseek/deepseek-r1-distill-llama-70b	188.91M	119.87M	0.6346
6	tencent/hunyuan-a13b-instruct	23.76K	14.82K	0.6234
7	openai/o3-mini-2025-01-31	87.57M	50.81M	0.5802
8	thudm/glm-4.1v-9b-thinking	13.38M	7.49M	0.5598
9	openai/o1-mini-2024-09-12	223.69K	118.40K	0.5293
10	deepseek/deepseek-r1-0528-qwen3-8b	213.82M	96.55M	0.4516