Llama 3.1 Nemotron Ultra 253B v1 (free) Consulta la información detallada y precios de los modelos de AI

Contexto Longitud 131,072 tokens, nvidia de proporcionado

131,072
Tokens de Contexto
Gratis
Precio del Prompt
Gratis
Precio de salida
9/16
Soporte de Funciones

Introducción del Modelo

Llama-3.1-Nemotron-Ultra-253B-v1 is a large language model (LLM) optimized for advanced reasoning, human-interactive chat, retrieval-augmented generation (RAG), and tool-calling tasks. Derived from Meta’s Llama-3.1-405B-Instruct, it has been significantly customized using Neural Architecture Search (NAS), resulting in enhanced efficiency, reduced memory usage, and improved inference latency. The model supports a context length of up to 128K tokens and can operate efficiently on an 8x NVIDIA H100 node. Note: you must include `detailed thinking on` in the system prompt to enable reasoning. Please see [Usage Recommendations](https://huggingface.co/nvidia/Llama-3_1-Nemotron-Ultra-253B-v1#quick-start-and-usage-recommendations) for more.

Información Básica

Desarrollador
nvidia
Serie de Modelos
Llama3
Fecha de lanzamiento
2025-04-08
Longitud de Contexto
131,072 tokens
Variante
free

Información de Precios

Este modelo es gratuito

Política de Datos

Términos de Servicio

학습 정책

1

Funciones Compatibles

Compatible (9)

Top K
Seed
Penalización de Frecuencia
Penalización de Presencia
Penalización de Repetición
Min P
Sesgo Logit
Logprobs
Top Logprobs

No compatible (7)

Entrada de Imagen
Formato de Respuesta
Uso de Herramientas
Salidas Estructuradas
Razonamiento
Opciones de Búsqueda Web
Top A

Otras Variantes

Estadísticas de Uso Real

No hay datos de uso recientes disponibles.

Modelos del Mismo Autor (nvidia)

Nemotron Nano 9B V2 (free)
128,000 tokens
Gratis
Nemotron Nano 9B V2
131,072 tokens
$0.04 / $0.16
Llama 3.1 Nemotron Nano 8B v1
131,072 tokens
$0.00 / $0.00
Llama 3.3 Nemotron Super 49B v1 (free)
131,072 tokens
Gratis
Llama 3.3 Nemotron Super 49B v1
131,072 tokens
$0.00 / $0.00