Llama 3.1 Nemotron Ultra 253B v1 (free) Detaillierte Informationen und Preise für AI-Modelle anzeigen

Kontext Länge 131,072 Token, nvidia von bereitgestellt

131,072
Kontext-Token
Kostenlos
Prompt-Preis
Kostenlos
Ausgabepreis
9/16
Funktionsunterstützung

Modell-Übersicht

Llama-3.1-Nemotron-Ultra-253B-v1 is a large language model (LLM) optimized for advanced reasoning, human-interactive chat, retrieval-augmented generation (RAG), and tool-calling tasks. Derived from Meta’s Llama-3.1-405B-Instruct, it has been significantly customized using Neural Architecture Search (NAS), resulting in enhanced efficiency, reduced memory usage, and improved inference latency. The model supports a context length of up to 128K tokens and can operate efficiently on an 8x NVIDIA H100 node. Note: you must include `detailed thinking on` in the system prompt to enable reasoning. Please see [Usage Recommendations](https://huggingface.co/nvidia/Llama-3_1-Nemotron-Ultra-253B-v1#quick-start-and-usage-recommendations) for more.

Grundinformationen

Entwickler
nvidia
Modellserie
Llama3
Veröffentlichungsdatum
2025-04-08
Kontextlänge
131,072 Token
Variante
free

Preisinformationen

Dieses Modell ist kostenlos nutzbar

Datenrichtlinie

Nutzungsbedingungen

학습 정책

1

Unterstützte Funktionen

Unterstützt (9)

Top K
Seed
Häufigkeitsstrafe
Presence Penalty
Wiederholungsstrafe
Min P
Logit-Bias
Logprobs
Top Logprobs

Nicht unterstützt (7)

Bildeingabe
Antwortformat
Tool-Nutzung
Strukturierte Ausgaben
Schlussfolgerung
Web-Suchoptionen
Top A

Andere Varianten

Tatsächliche Nutzungsstatistiken

Keine aktuellen Nutzungsdaten verfügbar.

Modelle desselben Autors (nvidia)

Llama 3.1 Nemotron Nano 8B v1
131,072 Token
$0.00 / $0.00
Llama 3.3 Nemotron Super 49B v1 (free)
131,072 Token
Kostenlos
Llama 3.3 Nemotron Super 49B v1
131,072 Token
$0.13 / $0.40
Llama 3.1 Nemotron 70B Instruct
131,072 Token
$0.12 / $0.30
Nemotron-4 340B Instruct
4,096 Token
$0.00 / $0.00