月度 按模型 模型效率排名 (不包括免费模型) 前 10 名

效率排名指标指南

效率排名基于输出令牌/输入令牌比率计算。该比率越低,模型运行效率越高。

该指标在文档编辑、代码重构、数据分析等任务中具有特别重要的意义。高效的模型倾向于从用户提供的信息中准确提取必要部分并简洁回应,减少不必要的token消耗,实现成本效益的AI利用。然而,低效率比不一定意味着更好的性能。某些复杂任务可能需要更多输出token,当需要详细说明或广泛信息提供时,较高的效率比实际上可能更为理想。因此,应根据任务的特性和目的来解释该指标。

排名 模型名称 输入令牌 输出令牌 效率比率
1 meta-llama/llama-guard-4-12b 820.24M 2.25M 0.0027
2 meta-llama/llama-3.1-405b 422.04M 3.10M 0.0074
3 google/gemini-2.5-pro-exp-03-25 39.2B 355.49M 0.009
4 qwen/qwen-vl-plus 927.33M 13.95M 0.015
5 qwen/qwen-vl-max-2025-01-25 329.78M 5.07M 0.0154
6 neversleep/llama-3-lumimaid-8b 2.9B 49.79M 0.0174
7 openai/codex-mini 1.8B 34.41M 0.0175
8 nothingiisreal/mn-celeste-12b 881.41M 17.83M 0.0202
9 openai/gpt-4o-mini 1,677.5B 34.2B 0.0204
10 mistralai/devstral-small-2505 5.6B 115.06M 0.0205