Diário Por Modelo Modelos de Alto Raciocínio (excluindo modelos gratuitos) TOP 10

Guia do Indicador de Taxa de Pensamento

A proporção de pensamento é calculada com base na proporção de tokens de raciocínio / tokens de entrada. Quanto maior for esta proporção, mais processos de raciocínio interno o modelo passa.

Esta métrica indica quão profundo é o processo de pensamento que o modelo passa antes de gerar uma resposta. Modelos com maior proporção de pensamento têm a possibilidade de produzir resultados mais sofisticados em tarefas como resolução de problemas complexos, raciocínio lógico e planejamento de múltiplas etapas. No entanto, uma alta proporção de pensamento não significa necessariamente melhor desempenho. Em algumas tarefas, o raciocínio interno excessivo pode gerar custos computacionais desnecessários ou ser ineficiente em situações onde respostas concisas são necessárias. Portanto, esta métrica deve ser interpretada de acordo com as características e propósito da tarefa.

Classificação Nome do Modelo Tokens de Entrada Tokens de Raciocínio Taxa de Pensamento
1 perplexity/sonar-deep-research 1.28M 68.09M 53.1884
2 thudm/glm-z1-32b-0414 58.26K 200.75K 3.4458
3 thudm/glm-z1-rumination-32b-0414 21.52K 33.83K 1.5716
4 deepseek/deepseek-r1-distill-llama-8b 33.89M 38.89M 1.1478
5 deepseek/deepseek-r1-distill-llama-70b 198.89M 216.61M 1.0891
6 deepseek/deepseek-r1-distill-qwen-1.5b 2.74M 2.15M 0.7877
7 openai/o1-mini-2024-09-12 149.81K 114.37K 0.7634
8 openai/o1-mini 4.65M 3.09M 0.6646
9 qwen/qwq-32b 86.66M 50.96M 0.5881
10 openai/o1-preview 1.51M 672.48K 0.445