LLM 模型排名

月度按模型模型效率排名（不包括免费模型）前 10 名

效率排名指标指南

效率排名基于输出令牌/输入令牌比率计算。该比率越低，模型运行效率越高。

该指标在文档编辑、代码重构、数据分析等任务中具有特别重要的意义。高效的模型倾向于从用户提供的信息中准确提取必要部分并简洁回应，减少不必要的token消耗，实现成本效益的AI利用。然而，低效率比不一定意味着更好的性能。某些复杂任务可能需要更多输出token，当需要详细说明或广泛信息提供时，较高的效率比实际上可能更为理想。因此，应根据任务的特性和目的来解释该指标。

排名	模型名称	输入令牌	输出令牌	效率比率
1	meta-llama/llama-guard-4-12b	2.3B	9.41M	0.0041
2	qwen/qwen3-coder-480b-a35b-07-25	484.7B	6.2B	0.0127
3	anthropic/claude-4-opus-20250522	110.1B	1.9B	0.0171
4	anthropic/claude-4-sonnet-20250522	2,343.1B	44.7B	0.019
5	anthropic/claude-4.1-opus-20250805	61.9B	1.3B	0.0217
6	neversleep/llama-3.1-lumimaid-8b	2.1B	55.86M	0.026
7	mistralai/mistral-tiny	9.2B	248.61M	0.0271
8	qwen/qwen-vl-plus	475.23M	13.04M	0.0274
9	anthropic/claude-3-5-haiku-20241022	5.0B	153.03M	0.0308
10	thedrummer/anubis-70b-v1.1	4.9B	168.11M	0.0343