Llama 3.1 Nemotron Ultra 253B v1 Проверьте подробную информацию и цены на модели ИИ

Контекст Длина 131,072 токенов, nvidia от предоставлено

131,072
Контекстные токены
$0.60
Цена промпта
$1.80
Цена вывода
8/16
Поддержка Функций

Обзор модели

Llama-3.1-Nemotron-Ultra-253B-v1 is a large language model (LLM) optimized for advanced reasoning, human-interactive chat, retrieval-augmented generation (RAG), and tool-calling tasks. Derived from Meta’s Llama-3.1-405B-Instruct, it has been significantly customized using Neural Architecture Search (NAS), resulting in enhanced efficiency, reduced memory usage, and improved inference latency. The model supports a context length of up to 128K tokens and can operate efficiently on an 8x NVIDIA H100 node. Note: you must include `detailed thinking on` in the system prompt to enable reasoning. Please see [Usage Recommendations](https://huggingface.co/nvidia/Llama-3_1-Nemotron-Ultra-253B-v1#quick-start-and-usage-recommendations) for more.

Основная информация

Разработчик
nvidia
Серия моделей
Llama3
Дата выпуска
2025-04-08
Длина Контекста
131,072 токенов
Вариант
standard

Информация о Ценах

Токены Промпта
$0.60 / 1M токены
Токены завершения
$1.80 / 1M токены

Поддерживаемые Функции

Поддерживается (8)

Top K
Сид
Штраф за Частоту
Штраф за присутствие
Logit-смещение
Logprobs
Top Logprobs
Рассуждение

Не поддерживается (8)

Ввод Изображения
Штраф за Повторение
Формат Ответа
Min P
Использование Инструментов
Структурированные выходы
Параметры веб-поиска
Top A

Другие Варианты

Статистика фактического использования

#225
Из 345 моделей всего
183.32M
Общее количество токенов за последние 30 дней
7.97M
Среднесуточное использование
28%
Изменение недельного использования

Тенденция использования за последние 30 дней

Модели того же автора (nvidia)

Llama 3.1 Nemotron Nano 8B v1
131,072 токенов
$0.00 / $0.00
Llama 3.3 Nemotron Super 49B v1 (free)
131,072 токенов
Бесплатно
Llama 3.3 Nemotron Super 49B v1
131,072 токенов
$0.13 / $0.40
Llama 3.1 Nemotron 70B Instruct
131,072 токенов
$0.12 / $0.30
Nemotron-4 340B Instruct
4,096 токенов
$0.00 / $0.00

Модели схожего ценового диапазона

Command R
cohere
128,000 токенов
$0.50 / $1.50
Magistral Small 2506
mistralai
40,000 токенов
$0.50 / $1.50
Command R (03-2024)
cohere
128,000 токенов
$0.50 / $1.50
GPT-3.5 Turbo
openai
16,385 токенов
$0.50 / $1.50
GPT-3.5 Turbo 16k
openai
16,385 токенов
$0.50 / $1.50