월간 모델별 모델 효율성 순위 (무료 모델 제외) TOP 10

효율성 순위 지표 안내

효율성 순위는 출력 토큰 / 입력 토큰 비율을 기준으로 산출됩니다. 이 비율이 낮을수록 모델이 더 효율적으로 작동한다고 볼 수 있습니다.

이 지표는 특히 문서 편집, 코드 리팩토링, 데이터 분석 등의 작업에서 중요한 의미를 가집니다. 효율성이 높은 모델은 사용자가 제공한 정보에서 필요한 부분만 정확하게 추출하여 간결하게 응답하는 경향이 있어, 불필요한 토큰 소비를 줄이고 비용 효율적인 AI 활용이 가능합니다. 그러나 낮은 효율성 비율이 반드시 더 나은 성능을 의미하지는 않습니다. 일부 복잡한 작업에서는 더 많은 출력 토큰이 필요할 수 있으며, 상세한 설명이나 광범위한 정보 제공이 필요한 경우에는 높은 효율성 비율이 오히려 바람직할 수 있습니다. 따라서 이 지표는 작업의 특성과 목적에 맞게 해석해야 합니다.

순위 모델명 입력 토큰 출력 토큰 효율성 비율
1 meta-llama/llama-guard-4-12b 820.24M 2.25M 0.0027
2 meta-llama/llama-3.1-405b 422.04M 3.10M 0.0074
3 google/gemini-2.5-pro-exp-03-25 39.2B 355.49M 0.009
4 qwen/qwen-vl-plus 927.33M 13.95M 0.015
5 qwen/qwen-vl-max-2025-01-25 329.78M 5.07M 0.0154
6 neversleep/llama-3-lumimaid-8b 2.9B 49.79M 0.0174
7 openai/codex-mini 1.8B 34.41M 0.0175
8 nothingiisreal/mn-celeste-12b 881.41M 17.83M 0.0202
9 openai/gpt-4o-mini 1,677.5B 34.2B 0.0204
10 mistralai/devstral-small-2505 5.6B 115.06M 0.0205