LLM 模型排名

月度按模型模型效率排名（不包括免費模型）前 10 名

效率排名指標指南

效率排名基於輸出令牌/輸入令牌比率計算。該比率越低，模型運行效率越高。

該指標在文件編輯、程式碼重構、資料分析等任務中具有特別重要的意義。高效率的模型傾向於從使用者提供的資訊中精確提取必要部分並簡潔回應，減少不必要的token消耗，實現成本效益的AI利用。然而，低效率比例不一定意味著更好的效能。某些複雜任務可能需要更多輸出token，當需要詳細說明或廣泛資訊提供時，較高的效率比例實際上可能更為理想。因此，應根據任務的特性和目的來解釋該指標。

排名	模型名稱	輸入令牌	輸出權杖	效率比率
1	meta-llama/llama-guard-4-12b	2.3B	9.41M	0.0041
2	qwen/qwen3-coder-480b-a35b-07-25	484.7B	6.2B	0.0127
3	anthropic/claude-4-opus-20250522	110.1B	1.9B	0.0171
4	anthropic/claude-4-sonnet-20250522	2,343.1B	44.7B	0.019
5	anthropic/claude-4.1-opus-20250805	61.9B	1.3B	0.0217
6	neversleep/llama-3.1-lumimaid-8b	2.1B	55.86M	0.026
7	mistralai/mistral-tiny	9.2B	248.61M	0.0271
8	qwen/qwen-vl-plus	475.23M	13.04M	0.0274
9	anthropic/claude-3-5-haiku-20241022	5.0B	153.03M	0.0308
10	thedrummer/anubis-70b-v1.1	4.9B	168.11M	0.0343