LongCat Flash Chat Confira informações detalhadas e preços dos modelos de AI

Contexto Comprimento 131,072 tokens, meituan de fornecido

131,072
Tokens de Contexto
$0.15
Preço do Prompt
$0.75
Preço de saída
0/16
Suporte de Recursos

Introdução do Modelo

LongCat-Flash-Chat is a large-scale Mixture-of-Experts (MoE) model with 560B total parameters, of which 18.6B–31.3B (≈27B on average) are dynamically activated per input. It introduces a shortcut-connected MoE design to reduce communication overhead and achieve high throughput while maintaining training stability through advanced scaling strategies such as hyperparameter transfer, deterministic computation, and multi-stage optimization. This release, LongCat-Flash-Chat, is a non-thinking foundation model optimized for conversational and agentic tasks. It supports long context windows up to 128K tokens and shows competitive performance across reasoning, coding, instruction following, and domain benchmarks, with particular strengths in tool use and complex multi-step interactions.

Informações Básicas

Desenvolvedor
meituan
Série de Modelos
Other
Data de lançamento
2025-09-09
Comprimento do Contexto
131,072 tokens
Tokens de Conclusão Máximos
131,072 tokens
Variante
standard

Informações de Preços

Tokens de Prompt
$0.15 / 1M tokens
Tokens de Conclusão
$0.75 / 1M tokens

Política de Dados

Recursos Suportados

Não suportado (16)

Entrada de Imagem
Top K
Seed
Penalidade de Frequência
Penalidade de Presença
Penalidade de Repetição
Formato de Resposta
Min P
Viés Logit
Uso de Ferramentas
Logprobs
Top Logprobs
Saídas Estruturadas
Raciocínio
Opções de Pesquisa Web
Top A

Estatísticas de Uso Real

Nenhum dado de uso recente disponível.

Modelos de Faixa de Preço Similar

GLM 4.5 Air
z-ai
131,072 tokens
$0.14 / $0.86
GPT-4o-mini
openai
128,000 tokens
$0.15 / $0.60
GPT-4o-mini (2024-07-18)
openai
128,000 tokens
$0.15 / $0.60
Llama 4 Maverick
meta-llama
1,048,576 tokens
$0.15 / $0.60
GPT-4o-mini Search Preview
openai
128,000 tokens
$0.15 / $0.60