Ranking de Modelos LLM Rankings e Estatísticas de Modelos Baseados em Uso em Tempo Real
Compare e analise o uso real e desempenho dos modelos LLM de várias perspectivas
Semanal Por Modelo Modelos de Alto Raciocínio (excluindo modelos gratuitos) TOP 10
Guia do Indicador de Taxa de Pensamento
A proporção de pensamento é calculada com base na proporção de tokens de raciocínio / tokens de entrada. Quanto maior for esta proporção, mais processos de raciocínio interno o modelo passa.
Esta métrica indica quão profundo é o processo de pensamento que o modelo passa antes de gerar uma resposta. Modelos com maior proporção de pensamento têm a possibilidade de produzir resultados mais sofisticados em tarefas como resolução de problemas complexos, raciocínio lógico e planejamento de múltiplas etapas. No entanto, uma alta proporção de pensamento não significa necessariamente melhor desempenho. Em algumas tarefas, o raciocínio interno excessivo pode gerar custos computacionais desnecessários ou ser ineficiente em situações onde respostas concisas são necessárias. Portanto, esta métrica deve ser interpretada de acordo com as características e propósito da tarefa.
Classificação | Nome do Modelo | Tokens de Entrada | Tokens de Raciocínio | Taxa de Pensamento |
---|---|---|---|---|
1 | perplexity/sonar-deep-research | 17.43M | 628.87M | 36.0746 |
2 | microsoft/mai-ds-r1 | 21.37M | 25.92M | 1.2129 |
3 | deepseek/deepseek-r1-distill-qwen-1.5b | 15.57M | 15.07M | 0.9675 |
4 | deepseek/deepseek-r1-distill-llama-8b | 17.90M | 13.23M | 0.7388 |
5 | openai/o1-preview | 985.47K | 727.32K | 0.738 |
6 | thudm/glm-4.1v-9b-thinking | 85.65M | 63.04M | 0.736 |
7 | openai/o3-mini-high-2025-01-31 | 127.60M | 88.92M | 0.6968 |
8 | deepseek/deepseek-r1-distill-qwen-7b | 36.75M | 25.11M | 0.6833 |
9 | minimax/minimax-m1 | 335.83M | 219.43M | 0.6534 |
10 | qwen/qwen3-8b-04-28 | 2.4B | 1.4B | 0.6109 |