Shisa V2 Llama 3.3 70B Confira informações detalhadas e preços dos modelos de AI

Contexto Comprimento 32,768 tokens, shisa-ai de fornecido

32,768
Tokens de Contexto
$0.02
Preço do Prompt
$0.08
Preço de saída
9/16
Suporte de Recursos

Introdução do Modelo

Shisa V2 Llama 3.3 70B is a bilingual Japanese-English chat model fine-tuned by Shisa.AI on Meta’s Llama-3.3-70B-Instruct base. It prioritizes Japanese language performance while retaining strong English capabilities. The model was optimized entirely through post-training, using a refined mix of supervised fine-tuning (SFT) and DPO datasets including regenerated ShareGPT-style data, translation tasks, roleplaying conversations, and instruction-following prompts. Unlike earlier Shisa releases, this version avoids tokenizer modifications or extended pretraining. Shisa V2 70B achieves leading Japanese task performance across a wide range of custom and public benchmarks, including JA MT Bench, ELYZA 100, and Rakuda. It supports a 128K token context length and integrates smoothly with inference frameworks like vLLM and SGLang. While it inherits safety characteristics from its base model, no additional alignment was applied. The model is intended for high-performance bilingual chat, instruction following, and translation tasks across JA/EN.

Informações Básicas

Desenvolvedor
shisa-ai
Série de Modelos
Llama3
Data de lançamento
2025-04-15
Comprimento do Contexto
32,768 tokens
Variante
standard

Informações de Preços

Tokens de Prompt
$0.02 / 1M tokens
Tokens de Conclusão
$0.08 / 1M tokens

Política de Dados

Termos de Serviço

학습 정책

1

Recursos Suportados

Suportado (9)

Top K
Seed
Penalidade de Frequência
Penalidade de Presença
Penalidade de Repetição
Min P
Viés Logit
Logprobs
Top Logprobs

Não suportado (7)

Entrada de Imagem
Formato de Resposta
Uso de Ferramentas
Saídas Estruturadas
Raciocínio
Opções de Pesquisa Web
Top A

Outras Variantes

Estatísticas de Uso Real

#280
De 353 modelos no total
96.54M
Total de Tokens Últimos 30 Dias
3.22M
Uso Médio Diário
62%
Mudança de Uso Semanal

Tendência de uso dos últimos 30 dias

Modelos de Faixa de Preço Similar

Devstral Small 2505
mistralai
131,072 tokens
$0.02 / $0.08
Qwen3 30B A3B
qwen
40,960 tokens
$0.02 / $0.08
GLM Z1 32B
thudm
32,768 tokens
$0.02 / $0.08
Qwen2.5 VL 32B Instruct
qwen
16,384 tokens
$0.02 / $0.08
Mistral Small 3.1 24B
mistralai
131,072 tokens
$0.02 / $0.08