DeepSeek R1T2 Chimera Consultez les informations détaillées et les prix des modèles d'IA
Contexte Longueur 163,840 tokens, tngtech de fourni
163,840
Tokens de Contexte
$0.30
Prix du Prompt
$0.30
Prix de sortie
10/16
Support de Fonctionnalités
Présentation du Modèle
DeepSeek-TNG-R1T2-Chimera is the second-generation Chimera model from TNG Tech. It is a 671 B-parameter mixture-of-experts text-generation model assembled from DeepSeek-AI’s R1-0528, R1, and V3-0324 checkpoints with an Assembly-of-Experts merge. The tri-parent design yields strong reasoning performance while running roughly 20 % faster than the original R1 and more than 2× faster than R1-0528 under vLLM, giving a favorable cost-to-intelligence trade-off. The checkpoint supports contexts up to 60 k tokens in standard use (tested to ~130 k) and maintains consistent <think> token behaviour, making it suitable for long-context analysis, dialogue and other open-ended generation tasks.
Informations de Base
Développeur
tngtech
Série de Modèles
DeepSeek
Date de sortie
2025-07-08
Longueur de Contexte
163,840 tokens
Variante
standard
Informations sur les Prix
Jetons de Prompt
$0.30 / 1M jetons
Tokens de Complétion
$0.30 / 1M jetons
Politique de Données
Conditions d'utilisation
학습 정책
1
Fonctionnalités Prises en Charge
Pris en charge (10)
Top K
Seed
Pénalité de Fréquence
Pénalité de Présence
Pénalité de Répétition
Min P
Biais Logit
Logprobs
Top Logprobs
Raisonnement
Non pris en charge (6)
Entrée d'Image
Format de Réponse
Utilisation d'Outils
Sorties Structurées
Options de Recherche Web
Top A
Autres Variantes
Statistiques d'Utilisation Réelle
#174
Sur 353 modèles au total
948.38M
Total des Tokens des 30 derniers jours
63.23M
Usage Moyen Quotidien
13%
Changement d'Usage Hebdomadaire