Llama 3.1 Nemotron Nano 8B v1 Consulta la información detallada y precios de los modelos de AI

Contexto Longitud 131,072 tokens, nvidia de proporcionado

131,072

Tokens de Contexto

$0.00

Precio del Prompt

$0.00

Precio de salida

0/16

Soporte de Funciones

Introducción del Modelo

Llama-3.1-Nemotron-Nano-8B-v1 is a compact large language model (LLM) derived from Meta's Llama-3.1-8B-Instruct, specifically optimized for reasoning tasks, conversational interactions, retrieval-augmented generation (RAG), and tool-calling applications. It balances accuracy and efficiency, fitting comfortably onto a single consumer-grade RTX GPU for local deployment. The model supports extended context lengths of up to 128K tokens. Note: you must include `detailed thinking on` in the system prompt to enable reasoning. Please see [Usage Recommendations](https://huggingface.co/nvidia/Llama-3_1-Nemotron-Ultra-253B-v1#quick-start-and-usage-recommendations) for more.

Información Básica

Desarrollador

nvidia

Serie de Modelos

Other

Fecha de lanzamiento

2025-04-08

Longitud de Contexto

131,072 tokens

Variante

standard

Información de Precios

Tokens de Prompt

$0.00 / 1M tokens

Tokens de Completado

$0.00 / 1M tokens

Funciones Compatibles

No compatible (16)

Entrada de Imagen

Top K

Seed

Penalización de Frecuencia

Penalización de Presencia

Penalización de Repetición

Formato de Respuesta

Min P

Sesgo Logit

Uso de Herramientas

Logprobs

Top Logprobs

Salidas Estructuradas

Razonamiento

Opciones de Búsqueda Web

Top A

Estadísticas de Uso Real

No hay datos de uso recientes disponibles.

Modelos del Mismo Autor (nvidia)

Nemotron Nano 9B V2 (free)

128,000 tokens

Gratis

Ver Detalles

Nemotron Nano 9B V2

131,072 tokens

$0.04 / $0.16

Ver Detalles

Llama 3.3 Nemotron Super 49B v1 (free)

131,072 tokens

Gratis

Ver Detalles

Llama 3.3 Nemotron Super 49B v1

131,072 tokens

$0.00 / $0.00

Ver Detalles