DeepSeek R1T Chimera Consultez les informations détaillées et les prix des modèles d'IA
Contexte Longueur 163,840 tokens, tngtech de fourni
163,840
Tokens de Contexte
$0.20
Prix du Prompt
$0.80
Prix de sortie
10/16
Support de Fonctionnalités
Présentation du Modèle
DeepSeek-R1T-Chimera is created by merging DeepSeek-R1 and DeepSeek-V3 (0324), combining the reasoning capabilities of R1 with the token efficiency improvements of V3. It is based on a DeepSeek-MoE Transformer architecture and is optimized for general text generation tasks. The model merges pretrained weights from both source models to balance performance across reasoning, efficiency, and instruction-following tasks. It is released under the MIT license and intended for research and commercial use.
Informations de Base
Développeur
tngtech
Série de Modèles
DeepSeek
Date de sortie
2025-04-27
Longueur de Contexte
163,840 tokens
Variante
standard
Informations sur les Prix
Jetons de Prompt
$0.20 / 1M jetons
Tokens de Complétion
$0.80 / 1M jetons
Politique de Données
Conditions d'utilisation
학습 정책
1
Fonctionnalités Prises en Charge
Pris en charge (10)
Top K
Seed
Pénalité de Fréquence
Pénalité de Présence
Pénalité de Répétition
Min P
Biais Logit
Logprobs
Top Logprobs
Raisonnement
Non pris en charge (6)
Entrée d'Image
Format de Réponse
Utilisation d'Outils
Sorties Structurées
Options de Recherche Web
Top A
Autres Variantes
Statistiques d'Utilisation Réelle
#214
Sur 353 modèles au total
374.15M
Total des Tokens des 30 derniers jours
22.01M
Usage Moyen Quotidien
4%
Changement d'Usage Hebdomadaire