Llama 3.1 Nemotron Ultra 253B v1 查看AI模型的詳細資訊和價格

上下文 長度 131,072 代幣, nvidia 來自 提供

131,072
上下文權杖
$0.60
提示價格
$1.80
輸出價格
8/16
功能支援

模型介紹

Llama-3.1-Nemotron-Ultra-253B-v1 is a large language model (LLM) optimized for advanced reasoning, human-interactive chat, retrieval-augmented generation (RAG), and tool-calling tasks. Derived from Meta’s Llama-3.1-405B-Instruct, it has been significantly customized using Neural Architecture Search (NAS), resulting in enhanced efficiency, reduced memory usage, and improved inference latency. The model supports a context length of up to 128K tokens and can operate efficiently on an 8x NVIDIA H100 node. Note: you must include `detailed thinking on` in the system prompt to enable reasoning. Please see [Usage Recommendations](https://huggingface.co/nvidia/Llama-3_1-Nemotron-Ultra-253B-v1#quick-start-and-usage-recommendations) for more.

基本資訊

開發商
nvidia
模型系列
Llama3
發布日期
2025-04-08
上下文長度
131,072 令牌
變體
standard

價格資訊

提示令牌
$0.60 / 1M 代幣
完成令牌
$1.80 / 1M 代幣

支援功能

支援 (8)

Top K
種子
頻率懲罰
存在懲罰
Logit偏置
Logprobs
Top Logprobs
推理

不支援 (8)

圖像輸入
重複懲罰
回應格式
Min P
工具使用
結構化輸出
網路搜尋選項
Top A

其他變體

實際使用量統計

#225
總共 345 個模型中
183.32M
最近30天總Token數
7.97M
日均使用量
28%
週使用量變化

最近30天使用量趨勢

同作者模型 (nvidia)

Llama 3.1 Nemotron Nano 8B v1
131,072 令牌
$0.00 / $0.00
Llama 3.3 Nemotron Super 49B v1 (free)
131,072 令牌
免費
Llama 3.3 Nemotron Super 49B v1
131,072 令牌
$0.13 / $0.40
Llama 3.1 Nemotron 70B Instruct
131,072 令牌
$0.12 / $0.30
Nemotron-4 340B Instruct
4,096 令牌
$0.00 / $0.00

相似價位模型

Command R
cohere
128,000 令牌
$0.50 / $1.50
Magistral Small 2506
mistralai
40,000 令牌
$0.50 / $1.50
Command R (03-2024)
cohere
128,000 令牌
$0.50 / $1.50
GPT-3.5 Turbo
openai
16,385 令牌
$0.50 / $1.50
GPT-3.5 Turbo 16k
openai
16,385 令牌
$0.50 / $1.50