Llama 3.1 Nemotron Ultra 253B v1 (free) Confira informações detalhadas e preços dos modelos de AI

Contexto Comprimento 131,072 tokens, nvidia de fornecido

131,072
Tokens de Contexto
Grátis
Preço do Prompt
Grátis
Preço de saída
9/16
Suporte de Recursos

Introdução do Modelo

Llama-3.1-Nemotron-Ultra-253B-v1 is a large language model (LLM) optimized for advanced reasoning, human-interactive chat, retrieval-augmented generation (RAG), and tool-calling tasks. Derived from Meta’s Llama-3.1-405B-Instruct, it has been significantly customized using Neural Architecture Search (NAS), resulting in enhanced efficiency, reduced memory usage, and improved inference latency. The model supports a context length of up to 128K tokens and can operate efficiently on an 8x NVIDIA H100 node. Note: you must include `detailed thinking on` in the system prompt to enable reasoning. Please see [Usage Recommendations](https://huggingface.co/nvidia/Llama-3_1-Nemotron-Ultra-253B-v1#quick-start-and-usage-recommendations) for more.

Informações Básicas

Desenvolvedor
nvidia
Série de Modelos
Llama3
Data de lançamento
2025-04-08
Comprimento do Contexto
131,072 tokens
Variante
free

Informações de Preços

Este modelo é gratuito

Política de Dados

Termos de Serviço

학습 정책

1

Recursos Suportados

Suportado (9)

Top K
Seed
Penalidade de Frequência
Penalidade de Presença
Penalidade de Repetição
Min P
Viés Logit
Logprobs
Top Logprobs

Não suportado (7)

Entrada de Imagem
Formato de Resposta
Uso de Ferramentas
Saídas Estruturadas
Raciocínio
Opções de Pesquisa Web
Top A

Outras Variantes

Estatísticas de Uso Real

Nenhum dado de uso recente disponível.

Modelos do Mesmo Autor (nvidia)

Nemotron Nano 9B V2 (free)
128,000 tokens
Grátis
Nemotron Nano 9B V2
131,072 tokens
$0.04 / $0.16
Llama 3.1 Nemotron Nano 8B v1
131,072 tokens
$0.00 / $0.00
Llama 3.3 Nemotron Super 49B v1 (free)
131,072 tokens
Grátis
Llama 3.3 Nemotron Super 49B v1
131,072 tokens
$0.00 / $0.00