ERNIE 4.5 21B A3B AIモデルの詳細情報と価格を確認してください

コンテキスト 長さ 120,000 トークン、 baidu から 提供

120,000
コンテキストトークン
$0.07
プロンプト価格
$0.28
出力価格
7/16
機能サポート

モデル紹介

A sophisticated text-based Mixture-of-Experts (MoE) model featuring 21B total parameters with 3B activated per token, delivering exceptional multimodal understanding and generation through heterogeneous MoE structures and modality-isolated routing. Supporting an extensive 131K token context length, the model achieves efficient inference via multi-expert parallel collaboration and quantization, while advanced post-training techniques including SFT, DPO, and UPO ensure optimized performance across diverse applications with specialized routing and balancing losses for superior task handling.

基本情報

開発者
baidu
モデルシリーズ
Other
リリース日
2025-08-12
コンテキスト長
120,000 トークン
最大完了トークン
8,000 トークン
バリアント
standard

価格情報

プロンプトトークン
$0.07 / 1M トークン
完了トークン
$0.28 / 1M トークン

サポート機能

サポート済み (7)

Top K
シード
頻度ペナルティ
Presence Penalty
繰り返しペナルティ
Min P
Logitバイアス

未対応 (9)

画像入力
レスポンス形式
ツール使用
Logprobs
Top Logprobs
構造化出力
推論
Web検索オプション
Top A

実際の使用量統計

#269
全353個のモデル中
126.83M
過去30日間の総トークン数
25.37M
1日平均使用量
-
週間使用量変化

過去30日間の使用量推移

同一作者モデル (baidu)

ERNIE 4.5 VL 28B A3B
30,000 トークン
$0.14 / $0.56
ERNIE 4.5 VL 424B A47B
123,000 トークン
$0.42 / $1.25
ERNIE 4.5 300B A47B
123,000 トークン
$0.28 / $1.10

類似価格帯モデル

Devstral Small 1.1
mistralai
128,000 トークン
$0.07 / $0.28
gpt-oss-120b
openai
131,000 トークン
$0.07 / $0.28
Qwen3 30B A3B Thinking 2507
qwen
262,144 トークン
$0.07 / $0.29
Gemma 3 27B
google
96,000 トークン
$0.07 / $0.27
Gemini 1.5 Flash
google
1,000,000 トークン
$0.08 / $0.30