Llama 3.1 Tulu 3 405B Consultez les informations détaillées et les prix des modèles d'IA

Contexte Longueur 0 tokens, allenai de fourni

0
Tokens de Contexte
$0.00
Prix du Prompt
$0.00
Prix de sortie
0/16
Support de Fonctionnalités

Présentation du Modèle

Tülu 3 405B is the largest model in the Tülu 3 family, applying fully open post-training recipes at a 405B parameter scale. Built on the Llama 3.1 405B base, it leverages Reinforcement Learning with Verifiable Rewards (RLVR) to enhance instruction following, MATH, GSM8K, and IFEval performance. As part of Tülu 3’s fully open-source approach, it offers state-of-the-art capabilities while surpassing prior open-weight models like Llama 3.1 405B Instruct and Nous Hermes 3 405B on multiple benchmarks. To read more, [click here.](https://allenai.org/blog/tulu-3-405B)

Informations de Base

Développeur
allenai
Série de Modèles
Other
Date de sortie
2025-02-08
Longueur de Contexte
0 tokens
Variante
standard

Informations sur les Prix

Jetons de Prompt
$0.00 / 1M jetons
Tokens de Complétion
$0.00 / 1M jetons

Fonctionnalités Prises en Charge

Non pris en charge (16)

Entrée d'Image
Top K
Seed
Pénalité de Fréquence
Pénalité de Présence
Pénalité de Répétition
Format de Réponse
Min P
Biais Logit
Utilisation d'Outils
Logprobs
Top Logprobs
Sorties Structurées
Raisonnement
Options de Recherche Web
Top A

Statistiques d'Utilisation Réelle

Aucune donnée d'utilisation récente disponible.

Modèles du Même Auteur (allenai)

Molmo 7B D
4,096 tokens
$0.10 / $0.20
Olmo 2 32B Instruct
4,096 tokens
$1.00 / $1.50
OLMo 7B Instruct
2,048 tokens
$0.00 / $0.00

Modèles de Gamme de Prix Similaire

Jamba 1.5 Large
ai21
256,000 tokens
$0.00 / $0.00
R1 Distill Qwen 7B
deepseek
131,072 tokens
$0.00 / $0.00
Deepseek R1 0528 Qwen3 8B (free)
deepseek
131,072 tokens
$0.00 / $0.00
Gemma 1 2B
google
8,192 tokens
$0.00 / $0.00
R1 0528 (free)
deepseek
163,840 tokens
$0.00 / $0.00