Täglich Nach Modell Modell-Effizienz-Ranking (kostenlose Modelle ausgeschlossen) TOP 10

Leitfaden für Effizienz-Ranking-Indikatoren

Effizienz-Rankings werden basierend auf dem Verhältnis Ausgabe-Token / Eingabe-Token berechnet. Je niedriger dieses Verhältnis ist, desto effizienter arbeitet das Modell.

Diese Metrik ist besonders bedeutsam bei Aufgaben wie Dokumentenbearbeitung, Code-Refactoring und Datenanalyse. Hocheffiziente Modelle neigen dazu, nur die notwendigen Teile aus den vom Benutzer bereitgestellten Informationen genau zu extrahieren und prägnant zu antworten, wodurch unnötiger Token-Verbrauch reduziert und eine kosteneffiziente AI-Nutzung ermöglicht wird. Ein niedriges Effizienzverhältnis bedeutet jedoch nicht unbedingt bessere Leistung. Einige komplexe Aufgaben erfordern möglicherweise mehr Output-Token, und wenn detaillierte Erklärungen oder umfassende Informationsbereitstellung erforderlich sind, kann ein höheres Effizienzverhältnis tatsächlich wünschenswert sein. Daher sollte diese Metrik entsprechend der Natur und dem Zweck der Aufgabe interpretiert werden.

Rang Modellname Eingabe-Token Ausgabe-Token Effizienz-Verhältnis
1 meta-llama/llama-guard-4-12b 346.25M 358.77K 0.001
2 openai/codex-mini 42.99M 602.36K 0.0136
3 arcee-ai/virtuoso-large 1.78M 27.95K 0.0157
4 arcee-ai/spotlight 11.97M 188.48K 0.0157
5 perplexity/sonar-deep-research 1.28M 1.13M 0.0162
6 mistralai/devstral-small-2505 279.44M 4.82M 0.0173
7 openai/o4-mini-high-2025-04-16 232.15M 4.99M 0.0189
8 neversleep/llama-3.1-lumimaid-8b 242.03M 4.77M 0.0197
9 arcee-ai/caller-large 1.15M 24.21K 0.0211
10 meta-llama/llama-3.2-1b-instruct 1.1B 23.32M 0.0214