Llama 3.1 Nemotron Nano 8B v1 Confira informações detalhadas e preços dos modelos de AI

Contexto Comprimento 131,072 tokens, nvidia de fornecido

131,072

Tokens de Contexto

$0.00

Preço do Prompt

$0.00

Preço de saída

0/16

Suporte de Recursos

Introdução do Modelo

Llama-3.1-Nemotron-Nano-8B-v1 is a compact large language model (LLM) derived from Meta's Llama-3.1-8B-Instruct, specifically optimized for reasoning tasks, conversational interactions, retrieval-augmented generation (RAG), and tool-calling applications. It balances accuracy and efficiency, fitting comfortably onto a single consumer-grade RTX GPU for local deployment. The model supports extended context lengths of up to 128K tokens. Note: you must include `detailed thinking on` in the system prompt to enable reasoning. Please see [Usage Recommendations](https://huggingface.co/nvidia/Llama-3_1-Nemotron-Ultra-253B-v1#quick-start-and-usage-recommendations) for more.

Informações Básicas

Desenvolvedor

nvidia

Série de Modelos

Other

Data de lançamento

2025-04-08

Comprimento do Contexto

131,072 tokens

Variante

standard

Informações de Preços

Tokens de Prompt

$0.00 / 1M tokens

Tokens de Conclusão

$0.00 / 1M tokens

Recursos Suportados

Não suportado (16)

Entrada de Imagem

Top K

Seed

Penalidade de Frequência

Penalidade de Presença

Penalidade de Repetição

Formato de Resposta

Min P

Viés Logit

Uso de Ferramentas

Logprobs

Top Logprobs

Saídas Estruturadas

Raciocínio

Opções de Pesquisa Web

Top A

Estatísticas de Uso Real

Nenhum dado de uso recente disponível.

Modelos do Mesmo Autor (nvidia)

Nemotron Nano 9B V2 (free)

128,000 tokens

Grátis

Ver Detalhes

Nemotron Nano 9B V2

131,072 tokens

$0.04 / $0.16

Ver Detalhes

Llama 3.3 Nemotron Super 49B v1 (free)

131,072 tokens

Grátis

Ver Detalhes

Llama 3.3 Nemotron Super 49B v1

131,072 tokens

$0.00 / $0.00

Ver Detalhes