月度 按模型 高推理能力模型 (不包括免費模型) 前 10 名

思考比率指標指南

思考比率基於推理令牌 / 輸入令牌比率計算。該比率越高,模型經歷的內部推理過程就越多。

該指標表示模型在生成回應之前經歷的深度思考過程。思考比例較高的模型在複雜問題解決、邏輯推理、多步驟規劃等任務中可能產生更精細的結果。然而,高思考比例並不一定意味著更好的效能。在某些任務中,過度的內部推理可能產生不必要的運算成本,或在需要簡潔回應的情況下反而效率低下。因此,應根據任務的特性和目的來解釋此指標。

排名 模型名稱 輸入令牌 推理令牌 思考比率
1 perplexity/sonar-deep-research 70.58M 2.2B 30.8616
2 deepseek/deepseek-r1-distill-qwen-1.5b 104.40M 132.48M 1.2689
3 deepseek/deepseek-r1-distill-qwen-7b 128.26M 109.82M 0.8562
4 thudm/glm-z1-rumination-32b-0414 238.59K 202.33K 0.848
5 microsoft/mai-ds-r1 37.90M 32.06M 0.8459
6 x-ai/grok-3-mini-beta 23.2B 16.7B 0.7194
7 openai/o1-preview 19.59M 13.92M 0.7106
8 deepseek/deepseek-r1-distill-llama-70b 17.5B 12.3B 0.7017
9 qwen/qwen3-8b-04-28 3.0B 2.0B 0.6651
10 openai/o3-mini-high-2025-01-31 445.14M 284.50M 0.6391