每日 按模型 高推理能力模型 (不包括免費模型) 前 10 名

思考比率指標指南

思考比率基於推理令牌 / 輸入令牌比率計算。該比率越高,模型經歷的內部推理過程就越多。

該指標表示模型在生成回應之前經歷的深度思考過程。思考比例較高的模型在複雜問題解決、邏輯推理、多步驟規劃等任務中可能產生更精細的結果。然而,高思考比例並不一定意味著更好的效能。在某些任務中,過度的內部推理可能產生不必要的運算成本,或在需要簡潔回應的情況下反而效率低下。因此,應根據任務的特性和目的來解釋此指標。

排名 模型名稱 輸入令牌 推理令牌 思考比率
1 perplexity/sonar-deep-research 3.96M 124.91M 31.5366
2 deepseek/deepseek-r1-distill-qwen-14b 5.38M 7.49M 1.3909
3 qwen/qwen3-8b-04-28 38.87M 43.17M 1.1107
4 mistralai/magistral-medium-2506 24.58M 18.22M 0.7414
5 deepseek/deepseek-r1-distill-llama-70b 188.91M 119.87M 0.6346
6 tencent/hunyuan-a13b-instruct 23.76K 14.82K 0.6234
7 openai/o3-mini-2025-01-31 87.57M 50.81M 0.5802
8 thudm/glm-4.1v-9b-thinking 13.38M 7.49M 0.5598
9 openai/o1-mini-2024-09-12 223.69K 118.40K 0.5293
10 deepseek/deepseek-r1-0528-qwen3-8b 213.82M 96.55M 0.4516