Deepseek R1 0528 Qwen3 8B Confira informações detalhadas e preços dos modelos de AI
Contexto Comprimento 131,072 tokens, deepseek de fornecido
131,072
Tokens de Contexto
$0.02
Preço do Prompt
$0.07
Preço de saída
10/16
Suporte de Recursos
Raciocínio #12
Introdução do Modelo
DeepSeek-R1-0528 is a lightly upgraded release of DeepSeek R1 that taps more compute and smarter post-training tricks, pushing its reasoning and inference to the brink of flagship models like O3 and Gemini 2.5 Pro. It now tops math, programming, and logic leaderboards, showcasing a step-change in depth-of-thought. The distilled variant, DeepSeek-R1-0528-Qwen3-8B, transfers this chain-of-thought into an 8 B-parameter form, beating standard Qwen3 8B by +10 pp and tying the 235 B “thinking” giant on AIME 2024.
Informações Básicas
Desenvolvedor
deepseek
Série de Modelos
Qwen
Data de lançamento
2025-05-29
Comprimento do Contexto
131,072 tokens
Variante
standard
Informações de Preços
Tokens de Prompt
$0.02 / 1M tokens
Tokens de Conclusão
$0.07 / 1M tokens
Política de Dados
Termos de Serviço
학습 정책
1
Recursos Suportados
Suportado (10)
Top K
Seed
Penalidade de Frequência
Penalidade de Presença
Penalidade de Repetição
Min P
Viés Logit
Logprobs
Top Logprobs
Raciocínio
Não suportado (6)
Entrada de Imagem
Formato de Resposta
Uso de Ferramentas
Saídas Estruturadas
Opções de Pesquisa Web
Top A
Outras Variantes
Estatísticas de Uso Real
#78
De 353 modelos no total
14.3B
Total de Tokens Últimos 30 Dias
477.85M
Uso Médio Diário
12%
Mudança de Uso Semanal