Shisa V2 Llama 3.3 70B (free) Consulta la información detallada y precios de los modelos de AI

Contexto Longitud 32,768 tokens, shisa-ai de proporcionado

32,768
Tokens de Contexto
Gratis
Precio del Prompt
Gratis
Precio de salida
9/16
Soporte de Funciones

Introducción del Modelo

Shisa V2 Llama 3.3 70B is a bilingual Japanese-English chat model fine-tuned by Shisa.AI on Meta’s Llama-3.3-70B-Instruct base. It prioritizes Japanese language performance while retaining strong English capabilities. The model was optimized entirely through post-training, using a refined mix of supervised fine-tuning (SFT) and DPO datasets including regenerated ShareGPT-style data, translation tasks, roleplaying conversations, and instruction-following prompts. Unlike earlier Shisa releases, this version avoids tokenizer modifications or extended pretraining. Shisa V2 70B achieves leading Japanese task performance across a wide range of custom and public benchmarks, including JA MT Bench, ELYZA 100, and Rakuda. It supports a 128K token context length and integrates smoothly with inference frameworks like vLLM and SGLang. While it inherits safety characteristics from its base model, no additional alignment was applied. The model is intended for high-performance bilingual chat, instruction following, and translation tasks across JA/EN.

Información Básica

Desarrollador
shisa-ai
Serie de Modelos
Llama3
Fecha de lanzamiento
2025-04-15
Longitud de Contexto
32,768 tokens
Variante
free

Información de Precios

Este modelo es gratuito

Política de Datos

Términos de Servicio

학습 정책

1

Funciones Compatibles

Compatible (9)

Top K
Seed
Penalización de Frecuencia
Penalización de Presencia
Penalización de Repetición
Min P
Sesgo Logit
Logprobs
Top Logprobs

No compatible (7)

Entrada de Imagen
Formato de Respuesta
Uso de Herramientas
Salidas Estructuradas
Razonamiento
Opciones de Búsqueda Web
Top A

Estadísticas de Uso Real

#203
De 346 modelos en total
294.03M
Total de Tokens Últimos 30 Días
9.80M
Uso Promedio Diario
21%
Cambio de Uso Semanal

Tendencia de uso de los últimos 30 días