Deepseek R1 0528 Qwen3 8B Confira informações detalhadas e preços dos modelos de AI
Contexto Comprimento 131,072 tokens, deepseek de fornecido
131,072
Tokens de Contexto
$0.05
Preço do Prompt
$0.10
Preço de saída
5/16
Suporte de Recursos
jurídico #3
Raciocínio #14
Introdução do Modelo
DeepSeek-R1-0528 is a lightly upgraded release of DeepSeek R1 that taps more compute and smarter post-training tricks, pushing its reasoning and inference to the brink of flagship models like O3 and Gemini 2.5 Pro. It now tops math, programming, and logic leaderboards, showcasing a step-change in depth-of-thought. The distilled variant, DeepSeek-R1-0528-Qwen3-8B, transfers this chain-of-thought into an 8 B-parameter form, beating standard Qwen3 8B by +10 pp and tying the 235 B “thinking” giant on AIME 2024.
Informações Básicas
Desenvolvedor
deepseek
Série de Modelos
Qwen
Data de lançamento
2025-05-29
Comprimento do Contexto
131,072 tokens
Tokens de Conclusão Máximos
131,072 tokens
Variante
standard
Informações de Preços
Tokens de Prompt
$0.05 / 1M tokens
Tokens de Conclusão
$0.10 / 1M tokens
Política de Dados
Recursos Suportados
Suportado (5)
Top K
Penalidade de Frequência
Penalidade de Presença
Penalidade de Repetição
Raciocínio
Não suportado (11)
Entrada de Imagem
Seed
Formato de Resposta
Min P
Viés Logit
Uso de Ferramentas
Logprobs
Top Logprobs
Saídas Estruturadas
Opções de Pesquisa Web
Top A
Outras Variantes
Estatísticas de Uso Real
#96
De 346 modelos no total
4.4B
Total de Tokens Últimos 30 Dias
220.39M
Uso Médio Diário
192%
Mudança de Uso Semanal