LLMモデルランキング リアルタイム使用量ベースのモデルランキングと統計
様々な観点からLLMモデルの実際の使用量とパフォーマンスを比較・分析してみましょう
439+
トラッキングモデル
112+
制作会社
8+
カテゴリー
08.03
最新データ
週間 モデル別 高推論能力モデル (無料モデルを除く) TOP 10
思考比率指標ガイド
思考比率は推論トークン / 入力トークンの比率に基づいて算出されます。この比率が高いほど、モデルがより多くの内部推論プロセスを経ることを示します。
この指標は、モデルが応答を生成する前にどれほど深い思考プロセスを経るかを示します。思考比率が高いモデルは、複雑な問題解決、論理的推論、多段階計画立案などのタスクでより精密な結果を導き出す可能性があります。しかし、高い思考比率が必ずしもより良いパフォーマンスを意味するわけではありません。一部のタスクでは、過度な内部推論が不要な計算コストを発生させたり、簡潔な応答が必要な状況でかえって非効率的になる可能性があります。したがって、この指標はタスクの特性と目的に応じて解釈する必要があります。
順位 | モデル名 | 入力トークン | 推論トークン | 思考率 |
---|---|---|---|---|
1 | perplexity/sonar-deep-research | 17.43M | 628.87M | 36.0746 |
2 | microsoft/mai-ds-r1 | 21.37M | 25.92M | 1.2129 |
3 | deepseek/deepseek-r1-distill-qwen-1.5b | 15.57M | 15.07M | 0.9675 |
4 | deepseek/deepseek-r1-distill-llama-8b | 17.90M | 13.23M | 0.7388 |
5 | openai/o1-preview | 985.47K | 727.32K | 0.738 |
6 | thudm/glm-4.1v-9b-thinking | 85.65M | 63.04M | 0.736 |
7 | openai/o3-mini-high-2025-01-31 | 127.60M | 88.92M | 0.6968 |
8 | deepseek/deepseek-r1-distill-qwen-7b | 36.75M | 25.11M | 0.6833 |
9 | minimax/minimax-m1 | 335.83M | 219.43M | 0.6534 |
10 | qwen/qwen3-8b-04-28 | 2.4B | 1.4B | 0.6109 |