Llama 3.3 Nemotron Super 49B v1 AI 모델의 상세 정보와 가격을 확인하세요

컨텍스트 길이 131,072 토큰, nvidia 에서 제공

131,072
컨텍스트 토큰
$0.13
프롬프트 가격
$0.40
출력 가격
7/16
기능 지원

모델 소개

Llama-3.3-Nemotron-Super-49B-v1 is a large language model (LLM) optimized for advanced reasoning, conversational interactions, retrieval-augmented generation (RAG), and tool-calling tasks. Derived from Meta's Llama-3.3-70B-Instruct, it employs a Neural Architecture Search (NAS) approach, significantly enhancing efficiency and reducing memory requirements. This allows the model to support a context length of up to 128K tokens and fit efficiently on single high-performance GPUs, such as NVIDIA H200. Note: you must include `detailed thinking on` in the system prompt to enable reasoning. Please see [Usage Recommendations](https://huggingface.co/nvidia/Llama-3_1-Nemotron-Ultra-253B-v1#quick-start-and-usage-recommendations) for more.

기본 정보

개발사
nvidia
모델 시리즈
Other
출시일
2025-04-08
컨텍스트 길이
131,072 토큰
변형
standard

가격 정보

프롬프트 토큰
$0.13 / 1M 토큰
완료 토큰
$0.40 / 1M 토큰

지원 기능

지원됨 (7)

Top K
Seed
Frequency Penalty
Presence Penalty
Logit Bias
Logprobs
Top Logprobs

미지원 (9)

이미지 입력
Repetition Penalty
Response Format
Min P
도구 사용
구조화된 출력
추론
Web Search Options
Top A

다른 변형

실제 사용량 통계

#148
전체 345개 모델 중
990.63M
최근 30일 총 토큰
33.02M
일평균 사용량
24%
주간 사용량 변화

최근 30일 사용량 추이

동일 제작사 모델 (nvidia)

Llama 3.1 Nemotron Nano 8B v1
131,072 토큰
$0.00 / $0.00
Llama 3.1 Nemotron Ultra 253B v1 (free)
131,072 토큰
무료
Llama 3.1 Nemotron Ultra 253B v1
131,072 토큰
$0.60 / $1.80
Llama 3.1 Nemotron 70B Instruct
131,072 토큰
$0.12 / $0.30
Nemotron-4 340B Instruct
4,096 토큰
$0.00 / $0.00

유사 가격대 모델

Qwen2.5 72B Instruct
qwen
32,768 토큰
$0.12 / $0.39
Gemini 2.5 Flash Lite Preview 06-17
google
1,048,576 토큰
$0.10 / $0.40
GPT-4.1 Nano
openai
1,047,576 토큰
$0.10 / $0.40
Gemini 2.0 Flash
google
1,048,576 토큰
$0.10 / $0.40
R1 Distill Llama 70B
deepseek
131,072 토큰
$0.10 / $0.40