LLM 模型排名 基於即時使用量的模型排名和統計
從多個角度比較和分析LLM模型的實際使用量和效能
378+
追蹤模型
102+
製作商
8+
類別
06.09
最新資料
週 按模型 高推理能力模型 (不包括免費模型) 前 10 名
思考比率指標指南
思考比率基於推理令牌 / 輸入令牌比率計算。該比率越高,模型經歷的內部推理過程就越多。
該指標表示模型在生成回應之前經歷的深度思考過程。思考比例較高的模型在複雜問題解決、邏輯推理、多步驟規劃等任務中可能產生更精細的結果。然而,高思考比例並不一定意味著更好的效能。在某些任務中,過度的內部推理可能產生不必要的運算成本,或在需要簡潔回應的情況下反而效率低下。因此,應根據任務的特性和目的來解釋此指標。
排名 | 模型名稱 | 輸入令牌 | 推理令牌 | 思考比率 |
---|---|---|---|---|
1 | perplexity/sonar-deep-research | 8.26M | 453.93M | 54.9601 |
2 | thudm/glm-z1-32b-0414 | 1.86M | 9.87M | 5.3028 |
3 | deepseek/deepseek-r1-distill-qwen-1.5b | 16.29M | 21.26M | 1.3052 |
4 | thudm/glm-z1-rumination-32b-0414 | 620.07K | 691.94K | 1.1159 |
5 | qwen/qwen3-8b-04-28 | 142.22M | 112.85M | 0.7934 |
6 | openai/o1-mini-2024-09-12 | 1.34M | 983.67K | 0.733 |
7 | deepseek/deepseek-r1-distill-llama-70b | 1.5B | 1.0B | 0.6923 |
8 | deepseek/deepseek-r1-distill-llama-8b | 204.87M | 140.80M | 0.6873 |
9 | openai/o1-mini | 33.30M | 21.36M | 0.6413 |
10 | deepseek/deepseek-r1-distill-qwen-14b | 23.04M | 14.27M | 0.6193 |