ERNIE 4.5 21B A3B Consultez les informations détaillées et les prix des modèles d'IA

Contexte Longueur 120,000 tokens, baidu de fourni

120,000
Tokens de Contexte
$0.07
Prix du Prompt
$0.28
Prix de sortie
7/16
Support de Fonctionnalités

Présentation du Modèle

A sophisticated text-based Mixture-of-Experts (MoE) model featuring 21B total parameters with 3B activated per token, delivering exceptional multimodal understanding and generation through heterogeneous MoE structures and modality-isolated routing. Supporting an extensive 131K token context length, the model achieves efficient inference via multi-expert parallel collaboration and quantization, while advanced post-training techniques including SFT, DPO, and UPO ensure optimized performance across diverse applications with specialized routing and balancing losses for superior task handling.

Informations de Base

Développeur
baidu
Série de Modèles
Other
Date de sortie
2025-08-12
Longueur de Contexte
120,000 tokens
Tokens de Complétion Maximum
8,000 tokens
Variante
standard

Informations sur les Prix

Jetons de Prompt
$0.07 / 1M jetons
Tokens de Complétion
$0.28 / 1M jetons

Fonctionnalités Prises en Charge

Pris en charge (7)

Top K
Seed
Pénalité de Fréquence
Pénalité de Présence
Pénalité de Répétition
Min P
Biais Logit

Non pris en charge (9)

Entrée d'Image
Format de Réponse
Utilisation d'Outils
Logprobs
Top Logprobs
Sorties Structurées
Raisonnement
Options de Recherche Web
Top A

Statistiques d'Utilisation Réelle

#269
Sur 353 modèles au total
126.83M
Total des Tokens des 30 derniers jours
25.37M
Usage Moyen Quotidien
-
Changement d'Usage Hebdomadaire

Tendance d'utilisation des 30 derniers jours

Modèles du Même Auteur (baidu)

ERNIE 4.5 VL 28B A3B
30,000 tokens
$0.14 / $0.56
ERNIE 4.5 VL 424B A47B
123,000 tokens
$0.42 / $1.25
ERNIE 4.5 300B A47B
123,000 tokens
$0.28 / $1.10

Modèles de Gamme de Prix Similaire

Devstral Small 1.1
mistralai
128,000 tokens
$0.07 / $0.28
Qwen3 Coder 30B A3B Instruct
qwen
262,144 tokens
$0.07 / $0.28
Qwen3 30B A3B Instruct 2507
qwen
262,144 tokens
$0.07 / $0.28
gpt-oss-120b
openai
131,000 tokens
$0.07 / $0.28
Gemma 3 27B
google
96,000 tokens
$0.07 / $0.26