Mensual Por Modelo Clasificación de Eficiencia de Modelos (excluyendo modelos gratuitos) TOP 10

Guía de Indicadores de Clasificación de Eficiencia

Las clasificaciones de eficiencia se calculan en base a la relación tokens de salida / tokens de entrada. Cuanto más baja sea esta relación, más eficientemente opera el modelo.

Esta métrica tiene un significado particularmente importante en tareas como edición de documentos, refactorización de código y análisis de datos. Los modelos altamente eficientes tienden a extraer con precisión solo las partes necesarias de la información proporcionada por el usuario y responder de manera concisa, reduciendo el consumo innecesario de tokens y permitiendo una utilización de AI rentable. Sin embargo, una baja relación de eficiencia no necesariamente significa mejor rendimiento. Algunas tareas complejas pueden requerir más tokens de salida, y cuando se necesitan explicaciones detalladas o provisión de información extensa, una mayor relación de eficiencia podría ser realmente preferible. Por lo tanto, esta métrica debe interpretarse según la naturaleza y el propósito de la tarea.

Rango Nombre del Modelo Tokens de Entrada Tokens de Salida Ratio de Eficiencia
1 meta-llama/llama-guard-4-12b 820.24M 2.25M 0.0027
2 meta-llama/llama-3.1-405b 422.04M 3.10M 0.0074
3 google/gemini-2.5-pro-exp-03-25 39.2B 355.49M 0.009
4 qwen/qwen-vl-plus 927.33M 13.95M 0.015
5 qwen/qwen-vl-max-2025-01-25 329.78M 5.07M 0.0154
6 neversleep/llama-3-lumimaid-8b 2.9B 49.79M 0.0174
7 openai/codex-mini 1.8B 34.41M 0.0175
8 nothingiisreal/mn-celeste-12b 881.41M 17.83M 0.0202
9 openai/gpt-4o-mini 1,677.5B 34.2B 0.0204
10 mistralai/devstral-small-2505 5.6B 115.06M 0.0205