月度 按模型 高推理能力模型 (不包括免费模型) 前 10 名

思考比率指标指南

思考比率基于推理令牌 / 输入令牌比率计算。该比率越高,模型经历的内部推理过程就越多。

该指标表示模型在生成响应之前经历的深度思考过程。思考比例较高的模型在复杂问题解决、逻辑推理、多步骤规划等任务中可能产生更精细的结果。然而,高思考比例并不一定意味着更好的性能。在某些任务中,过度的内部推理可能产生不必要的计算成本,或在需要简洁响应的情况下反而效率低下。因此,应根据任务的特性和目的来解释此指标。

排名 模型名称 输入令牌 推理令牌 思考比率
1 perplexity/sonar-deep-research 45.39M 2.0B 44.1233
2 thudm/glm-z1-32b-0414 32.98M 71.12M 2.1564
3 thudm/glm-z1-rumination-32b-0414 14.96M 27.72M 1.8532
4 deepseek/deepseek-r1-distill-qwen-1.5b 84.57M 105.03M 1.2419
5 deepseek/deepseek-r1-distill-llama-70b 7.8B 7.2B 0.9288
6 deepseek/deepseek-r1-distill-qwen-14b 136.55M 91.45M 0.6697
7 qwen/qwq-32b 2.5B 1.6B 0.6504
8 deepseek/deepseek-r1-0528-qwen3-8b 643.23M 392.25M 0.6098
9 openai/o1-mini 206.32M 117.34M 0.5687
10 deepseek/deepseek-r1-distill-llama-8b 987.75M 485.04M 0.4911