LLM 模型排名 基于实时使用量的模型排名和统计
从多个角度比较和分析LLM模型的实际使用量和性能
378+
追踪模型
102+
制作商
8+
类别
06.09
最新数据
月度 按模型 高推理能力模型 (不包括免费模型) 前 10 名
思考比率指标指南
思考比率基于推理令牌 / 输入令牌比率计算。该比率越高,模型经历的内部推理过程就越多。
该指标表示模型在生成响应之前经历的深度思考过程。思考比例较高的模型在复杂问题解决、逻辑推理、多步骤规划等任务中可能产生更精细的结果。然而,高思考比例并不一定意味着更好的性能。在某些任务中,过度的内部推理可能产生不必要的计算成本,或在需要简洁响应的情况下反而效率低下。因此,应根据任务的特性和目的来解释此指标。
排名 | 模型名称 | 输入令牌 | 推理令牌 | 思考比率 |
---|---|---|---|---|
1 | perplexity/sonar-deep-research | 45.39M | 2.0B | 44.1233 |
2 | thudm/glm-z1-32b-0414 | 32.98M | 71.12M | 2.1564 |
3 | thudm/glm-z1-rumination-32b-0414 | 14.96M | 27.72M | 1.8532 |
4 | deepseek/deepseek-r1-distill-qwen-1.5b | 84.57M | 105.03M | 1.2419 |
5 | deepseek/deepseek-r1-distill-llama-70b | 7.8B | 7.2B | 0.9288 |
6 | deepseek/deepseek-r1-distill-qwen-14b | 136.55M | 91.45M | 0.6697 |
7 | qwen/qwq-32b | 2.5B | 1.6B | 0.6504 |
8 | deepseek/deepseek-r1-0528-qwen3-8b | 643.23M | 392.25M | 0.6098 |
9 | openai/o1-mini | 206.32M | 117.34M | 0.5687 |
10 | deepseek/deepseek-r1-distill-llama-8b | 987.75M | 485.04M | 0.4911 |