Täglich Nach Modell Modell-Effizienz-Ranking (kostenlose Modelle ausgeschlossen) TOP 10

Leitfaden für Effizienz-Ranking-Indikatoren

Effizienz-Rankings werden basierend auf dem Verhältnis Ausgabe-Token / Eingabe-Token berechnet. Je niedriger dieses Verhältnis ist, desto effizienter arbeitet das Modell.

Diese Metrik ist besonders bedeutsam bei Aufgaben wie Dokumentenbearbeitung, Code-Refactoring und Datenanalyse. Hocheffiziente Modelle neigen dazu, nur die notwendigen Teile aus den vom Benutzer bereitgestellten Informationen genau zu extrahieren und prägnant zu antworten, wodurch unnötiger Token-Verbrauch reduziert und eine kosteneffiziente AI-Nutzung ermöglicht wird. Ein niedriges Effizienzverhältnis bedeutet jedoch nicht unbedingt bessere Leistung. Einige komplexe Aufgaben erfordern möglicherweise mehr Output-Token, und wenn detaillierte Erklärungen oder umfassende Informationsbereitstellung erforderlich sind, kann ein höheres Effizienzverhältnis tatsächlich wünschenswert sein. Daher sollte diese Metrik entsprechend der Natur und dem Zweck der Aufgabe interpretiert werden.

Rang Modellname Eingabe-Token Ausgabe-Token Effizienz-Verhältnis
1 meta-llama/llama-guard-4-12b 101.20M 175.68K 0.0017
2 qwen/qwen-vl-plus 81.43M 1.17M 0.0144
3 anthropic/claude-4-opus-20250522 8.3B 122.60M 0.0147
4 anthropic/claude-3-5-haiku-20241022 373.78M 5.83M 0.0156
5 qwen/qwen3-coder-480b-a35b-07-25 23.7B 391.43M 0.0165
6 anthropic/claude-4-sonnet-20250522 110.4B 2.2B 0.0197
7 moonshotai/kimi-vl-a3b-thinking 41.57M 843.24K 0.0203
8 qwen/qwen-turbo-2024-11-01 284.94M 7.00M 0.0246
9 arcee-ai/spotlight 1.53M 37.87K 0.0248
10 qwen/qwen-2-vl-7b-instruct 83.03M 2.16M 0.0261