Shisa V2 Llama 3.3 70B Consultez les informations détaillées et les prix des modèles d'IA

Contexte Longueur 32,768 tokens, shisa-ai de fourni

32,768
Tokens de Contexte
$0.02
Prix du Prompt
$0.08
Prix de sortie
9/16
Support de Fonctionnalités

Présentation du Modèle

Shisa V2 Llama 3.3 70B is a bilingual Japanese-English chat model fine-tuned by Shisa.AI on Meta’s Llama-3.3-70B-Instruct base. It prioritizes Japanese language performance while retaining strong English capabilities. The model was optimized entirely through post-training, using a refined mix of supervised fine-tuning (SFT) and DPO datasets including regenerated ShareGPT-style data, translation tasks, roleplaying conversations, and instruction-following prompts. Unlike earlier Shisa releases, this version avoids tokenizer modifications or extended pretraining. Shisa V2 70B achieves leading Japanese task performance across a wide range of custom and public benchmarks, including JA MT Bench, ELYZA 100, and Rakuda. It supports a 128K token context length and integrates smoothly with inference frameworks like vLLM and SGLang. While it inherits safety characteristics from its base model, no additional alignment was applied. The model is intended for high-performance bilingual chat, instruction following, and translation tasks across JA/EN.

Informations de Base

Développeur
shisa-ai
Série de Modèles
Llama3
Date de sortie
2025-04-15
Longueur de Contexte
32,768 tokens
Variante
standard

Informations sur les Prix

Jetons de Prompt
$0.02 / 1M jetons
Tokens de Complétion
$0.08 / 1M jetons

Politique de Données

Fonctionnalités Prises en Charge

Pris en charge (9)

Top K
Seed
Pénalité de Fréquence
Pénalité de Présence
Pénalité de Répétition
Min P
Biais Logit
Logprobs
Top Logprobs

Non pris en charge (7)

Entrée d'Image
Format de Réponse
Utilisation d'Outils
Sorties Structurées
Raisonnement
Options de Recherche Web
Top A

Autres Variantes

Statistiques d'Utilisation Réelle

#280
Sur 353 modèles au total
96.54M
Total des Tokens des 30 derniers jours
3.22M
Usage Moyen Quotidien
62%
Changement d'Usage Hebdomadaire

Tendance d'utilisation des 30 derniers jours

Modèles de Gamme de Prix Similaire

Devstral Small 2505
mistralai
131,072 tokens
$0.02 / $0.08
Qwen3 30B A3B
qwen
40,960 tokens
$0.02 / $0.08
GLM Z1 32B
thudm
32,768 tokens
$0.02 / $0.08
Qwen2.5 VL 32B Instruct
qwen
16,384 tokens
$0.02 / $0.08
Mistral Small 3.1 24B
mistralai
131,072 tokens
$0.02 / $0.08