Shisa V2 Llama 3.3 70B Detaillierte Informationen und Preise für AI-Modelle anzeigen

Kontext Länge 32,768 Token, shisa-ai von bereitgestellt

32,768
Kontext-Token
$0.02
Prompt-Preis
$0.08
Ausgabepreis
9/16
Funktionsunterstützung

Modell-Übersicht

Shisa V2 Llama 3.3 70B is a bilingual Japanese-English chat model fine-tuned by Shisa.AI on Meta’s Llama-3.3-70B-Instruct base. It prioritizes Japanese language performance while retaining strong English capabilities. The model was optimized entirely through post-training, using a refined mix of supervised fine-tuning (SFT) and DPO datasets including regenerated ShareGPT-style data, translation tasks, roleplaying conversations, and instruction-following prompts. Unlike earlier Shisa releases, this version avoids tokenizer modifications or extended pretraining. Shisa V2 70B achieves leading Japanese task performance across a wide range of custom and public benchmarks, including JA MT Bench, ELYZA 100, and Rakuda. It supports a 128K token context length and integrates smoothly with inference frameworks like vLLM and SGLang. While it inherits safety characteristics from its base model, no additional alignment was applied. The model is intended for high-performance bilingual chat, instruction following, and translation tasks across JA/EN.

Grundinformationen

Entwickler
shisa-ai
Modellserie
Llama3
Veröffentlichungsdatum
2025-04-15
Kontextlänge
32,768 Token
Variante
standard

Preisinformationen

Prompt-Token
$0.02 / 1M Token
Vervollständigungs-Token
$0.08 / 1M Token

Datenrichtlinie

Nutzungsbedingungen

학습 정책

1

Unterstützte Funktionen

Unterstützt (9)

Top K
Seed
Häufigkeitsstrafe
Presence Penalty
Wiederholungsstrafe
Min P
Logit-Bias
Logprobs
Top Logprobs

Nicht unterstützt (7)

Bildeingabe
Antwortformat
Tool-Nutzung
Strukturierte Ausgaben
Schlussfolgerung
Web-Suchoptionen
Top A

Andere Varianten

Tatsächliche Nutzungsstatistiken

#280
Von insgesamt 353 Modellen
96.54M
Gesamte Tokens der letzten 30 Tage
3.22M
Tägliche Durchschnittsnutzung
62%
Wöchentliche Nutzungsänderung

Nutzungstrend der letzten 30 Tage

Modelle in ähnlicher Preisklasse

Devstral Small 2505
mistralai
131,072 Token
$0.02 / $0.08
Qwen3 30B A3B
qwen
40,960 Token
$0.02 / $0.08
GLM Z1 32B
thudm
32,768 Token
$0.02 / $0.08
Qwen2.5 VL 32B Instruct
qwen
16,384 Token
$0.02 / $0.08
Mistral Small 3.1 24B
mistralai
131,072 Token
$0.02 / $0.08