R1 Distill Llama 70B AI 모델의 상세 정보와 가격을 확인하세요
컨텍스트 길이 131,072 토큰, deepseek 에서 제공
131,072
컨텍스트 토큰
$0.03
프롬프트 가격
$0.10
출력 가격
10/16
기능 지원
프로그래밍 18위
학계 18위
퀴즈 18위
롤플레이 18위
finance 18위
과학 18위
건강 18위
SEO 18위
법무 18위
기술 18위
마케팅 18위
번역 18위
추론 7위
모델 소개
DeepSeek R1 Distill Llama 70B is a distilled large language model based on [Llama-3.3-70B-Instruct](/meta-llama/llama-3.3-70b-instruct), using outputs from [DeepSeek R1](/deepseek/deepseek-r1). The model combines advanced distillation techniques to achieve high performance across multiple benchmarks, including: - AIME 2024 pass@1: 70.0 - MATH-500 pass@1: 94.5 - CodeForces Rating: 1633 The model leverages fine-tuning from DeepSeek R1's outputs, enabling competitive performance comparable to larger frontier models.
기본 정보
개발사
deepseek
모델 시리즈
Llama3
출시일
2025-01-23
컨텍스트 길이
131,072 토큰
변형
standard
가격 정보
프롬프트 토큰
$0.03 / 1M 토큰
완료 토큰
$0.10 / 1M 토큰
데이터 정책
이용약관
학습 정책
1
지원 기능
지원됨 (10)
Top K
Seed
Frequency Penalty
Presence Penalty
Repetition Penalty
Min P
Logit Bias
Logprobs
Top Logprobs
추론
미지원 (6)
이미지 입력
Response Format
도구 사용
구조화된 출력
Web Search Options
Top A
다른 변형
실제 사용량 통계
#70
전체 353개 모델 중
19.7B
최근 30일 총 토큰
658.17M
일평균 사용량
44%
주간 사용량 변화