週間 モデル別 高推論能力モデル (無料モデルを除く) TOP 10

思考比率指標ガイド

思考比率は推論トークン / 入力トークンの比率に基づいて算出されます。この比率が高いほど、モデルがより多くの内部推論プロセスを経ることを示します。

この指標は、モデルが応答を生成する前にどれほど深い思考プロセスを経るかを示します。思考比率が高いモデルは、複雑な問題解決、論理的推論、多段階計画立案などのタスクでより精密な結果を導き出す可能性があります。しかし、高い思考比率が必ずしもより良いパフォーマンスを意味するわけではありません。一部のタスクでは、過度な内部推論が不要な計算コストを発生させたり、簡潔な応答が必要な状況でかえって非効率的になる可能性があります。したがって、この指標はタスクの特性と目的に応じて解釈する必要があります。

順位 モデル名 入力トークン 推論トークン 思考率
1 perplexity/sonar-deep-research 17.43M 628.87M 36.0746
2 microsoft/mai-ds-r1 21.37M 25.92M 1.2129
3 deepseek/deepseek-r1-distill-qwen-1.5b 15.57M 15.07M 0.9675
4 deepseek/deepseek-r1-distill-llama-8b 17.90M 13.23M 0.7388
5 openai/o1-preview 985.47K 727.32K 0.738
6 thudm/glm-4.1v-9b-thinking 85.65M 63.04M 0.736
7 openai/o3-mini-high-2025-01-31 127.60M 88.92M 0.6968
8 deepseek/deepseek-r1-distill-qwen-7b 36.75M 25.11M 0.6833
9 minimax/minimax-m1 335.83M 219.43M 0.6534
10 qwen/qwen3-8b-04-28 2.4B 1.4B 0.6109