Ranking de Modelos LLM Rankings e Estatísticas de Modelos Baseados em Uso em Tempo Real
Compare e analise o uso real e desempenho dos modelos LLM de várias perspectivas
Diário Por Modelo Modelos de Alto Raciocínio (excluindo modelos gratuitos) TOP 10
Guia do Indicador de Taxa de Pensamento
A proporção de pensamento é calculada com base na proporção de tokens de raciocínio / tokens de entrada. Quanto maior for esta proporção, mais processos de raciocínio interno o modelo passa.
Esta métrica indica quão profundo é o processo de pensamento que o modelo passa antes de gerar uma resposta. Modelos com maior proporção de pensamento têm a possibilidade de produzir resultados mais sofisticados em tarefas como resolução de problemas complexos, raciocínio lógico e planejamento de múltiplas etapas. No entanto, uma alta proporção de pensamento não significa necessariamente melhor desempenho. Em algumas tarefas, o raciocínio interno excessivo pode gerar custos computacionais desnecessários ou ser ineficiente em situações onde respostas concisas são necessárias. Portanto, esta métrica deve ser interpretada de acordo com as características e propósito da tarefa.
Classificação | Nome do Modelo | Tokens de Entrada | Tokens de Raciocínio | Taxa de Pensamento |
---|---|---|---|---|
1 | perplexity/sonar-deep-research | 1.15M | 62.70M | 54.4622 |
2 | thudm/glm-z1-32b-0414 | 50.22K | 165.29K | 3.2912 |
3 | thudm/glm-z1-rumination-32b-0414 | 21.52K | 33.83K | 1.5716 |
4 | deepseek/deepseek-r1-distill-llama-8b | 32.06M | 35.35M | 1.1026 |
5 | deepseek/deepseek-r1-distill-llama-70b | 186.27M | 198.12M | 1.0636 |
6 | deepseek/deepseek-r1-distill-qwen-1.5b | 2.65M | 2.02M | 0.7622 |
7 | openai/o1-mini-2024-09-12 | 146.85K | 109.25K | 0.744 |
8 | openai/o1-mini | 3.80M | 2.83M | 0.7438 |
9 | qwen/qwq-32b | 81.89M | 47.49M | 0.5799 |
10 | openai/o1-preview | 1.16M | 559.28K | 0.4808 |