Llama 3.3 Nemotron Super 49B v1 Detaillierte Informationen und Preise für AI-Modelle anzeigen

Kontext Länge 131,072 Token, nvidia von bereitgestellt

131,072
Kontext-Token
$0.13
Prompt-Preis
$0.40
Ausgabepreis
7/16
Funktionsunterstützung

Modell-Übersicht

Llama-3.3-Nemotron-Super-49B-v1 is a large language model (LLM) optimized for advanced reasoning, conversational interactions, retrieval-augmented generation (RAG), and tool-calling tasks. Derived from Meta's Llama-3.3-70B-Instruct, it employs a Neural Architecture Search (NAS) approach, significantly enhancing efficiency and reducing memory requirements. This allows the model to support a context length of up to 128K tokens and fit efficiently on single high-performance GPUs, such as NVIDIA H200. Note: you must include `detailed thinking on` in the system prompt to enable reasoning. Please see [Usage Recommendations](https://huggingface.co/nvidia/Llama-3_1-Nemotron-Ultra-253B-v1#quick-start-and-usage-recommendations) for more.

Grundinformationen

Entwickler
nvidia
Modellserie
Other
Veröffentlichungsdatum
2025-04-08
Kontextlänge
131,072 Token
Variante
standard

Preisinformationen

Prompt-Token
$0.13 / 1M Token
Vervollständigungs-Token
$0.40 / 1M Token

Unterstützte Funktionen

Unterstützt (7)

Top K
Seed
Häufigkeitsstrafe
Presence Penalty
Logit-Bias
Logprobs
Top Logprobs

Nicht unterstützt (9)

Bildeingabe
Wiederholungsstrafe
Antwortformat
Min P
Tool-Nutzung
Strukturierte Ausgaben
Schlussfolgerung
Web-Suchoptionen
Top A

Andere Varianten

Tatsächliche Nutzungsstatistiken

#148
Von insgesamt 345 Modellen
990.63M
Gesamte Tokens der letzten 30 Tage
33.02M
Tägliche Durchschnittsnutzung
24%
Wöchentliche Nutzungsänderung

Nutzungstrend der letzten 30 Tage

Modelle desselben Autors (nvidia)

Llama 3.1 Nemotron Nano 8B v1
131,072 Token
$0.00 / $0.00
Llama 3.1 Nemotron Ultra 253B v1 (free)
131,072 Token
Kostenlos
Llama 3.1 Nemotron Ultra 253B v1
131,072 Token
$0.60 / $1.80
Llama 3.1 Nemotron 70B Instruct
131,072 Token
$0.12 / $0.30
Nemotron-4 340B Instruct
4,096 Token
$0.00 / $0.00

Modelle in ähnlicher Preisklasse

Qwen2.5 72B Instruct
qwen
32,768 Token
$0.12 / $0.39
Gemini 2.5 Flash Lite Preview 06-17
google
1,048,576 Token
$0.10 / $0.40
GPT-4.1 Nano
openai
1,047,576 Token
$0.10 / $0.40
Gemini 2.0 Flash
google
1,048,576 Token
$0.10 / $0.40
R1 Distill Llama 70B
deepseek
131,072 Token
$0.10 / $0.40