Diario Por Modelo Modelos de Alto Razonamiento (excluyendo modelos gratuitos) TOP 10

Guía del Indicador de Relación de Pensamiento

La proporción de pensamiento se calcula basándose en la proporción de tokens de razonamiento / tokens de entrada. Cuanto más alta sea esta proporción, más procesos de razonamiento interno atraviesa el modelo.

Esta métrica indica qué tan profundo es el proceso de pensamiento que experimenta el modelo antes de generar una respuesta. Los modelos con una mayor proporción de pensamiento tienen la posibilidad de producir resultados más sofisticados en tareas como resolución de problemas complejos, razonamiento lógico y planificación de múltiples pasos. Sin embargo, una alta proporción de pensamiento no necesariamente significa mejor rendimiento. En algunas tareas, el razonamiento interno excesivo puede generar costos computacionales innecesarios o ser ineficiente en situaciones donde se necesitan respuestas concisas. Por lo tanto, esta métrica debe interpretarse según las características y el propósito de la tarea.

Rango Nombre del Modelo Tokens de Entrada Tokens de Razonamiento Proporción de Pensamiento
1 perplexity/sonar-deep-research 1.28M 68.09M 53.1884
2 thudm/glm-z1-32b-0414 58.26K 200.75K 3.4458
3 thudm/glm-z1-rumination-32b-0414 21.52K 33.83K 1.5716
4 deepseek/deepseek-r1-distill-llama-8b 33.89M 38.89M 1.1478
5 deepseek/deepseek-r1-distill-llama-70b 198.89M 216.61M 1.0891
6 deepseek/deepseek-r1-distill-qwen-1.5b 2.74M 2.15M 0.7877
7 openai/o1-mini-2024-09-12 149.81K 114.37K 0.7634
8 openai/o1-mini 4.65M 3.09M 0.6646
9 qwen/qwq-32b 86.66M 50.96M 0.5881
10 openai/o1-preview 1.51M 672.48K 0.445