周 按模型 高推理能力模型 (不包括免费模型) 前 10 名

思考比率指标指南

思考比率基于推理令牌 / 输入令牌比率计算。该比率越高,模型经历的内部推理过程就越多。

该指标表示模型在生成响应之前经历的深度思考过程。思考比例较高的模型在复杂问题解决、逻辑推理、多步骤规划等任务中可能产生更精细的结果。然而,高思考比例并不一定意味着更好的性能。在某些任务中,过度的内部推理可能产生不必要的计算成本,或在需要简洁响应的情况下反而效率低下。因此,应根据任务的特性和目的来解释此指标。

排名 模型名称 输入令牌 推理令牌 思考比率
1 perplexity/sonar-deep-research 17.50M 634.15M 36.2431
2 microsoft/mai-ds-r1 21.43M 25.94M 1.2104
3 deepseek/deepseek-r1-distill-qwen-1.5b 15.60M 15.08M 0.9672
4 deepseek/deepseek-r1-distill-llama-8b 17.92M 13.24M 0.7386
5 openai/o1-preview 985.47K 727.32K 0.738
6 thudm/glm-4.1v-9b-thinking 85.82M 63.12M 0.7355
7 openai/o3-mini-high-2025-01-31 129.20M 90.50M 0.7005
8 deepseek/deepseek-r1-distill-qwen-7b 36.83M 25.15M 0.6828
9 minimax/minimax-m1 339.86M 219.76M 0.6466
10 qwen/qwen3-8b-04-28 2.4B 1.4B 0.6132