DeepSeek: R1 Distill Llama 70B
deepseek/deepseek-r1-distill-llama-70b
Опис
DeepSeek R1 Distill Llama 70B — це дистильована велика мовна модель, заснована на Llama-3.3-70B-Instruct, яка використовує вихідні дані від DeepSeek R1. Модель поєднує передові методи дистиляції для досягнення високої продуктивності за різними бенчмарками, включаючи:
* AIME 2024 pass@1: 70.0
* MATH-500 pass@1: 94.5
* CodeForces Rating: 1633
Модель використовує доопрацювання на основі вихідних даних DeepSeek R1, що забезпечує конкурентоспроможну продуктивність, порівнянну з більшими передовими моделями.
Порівняння з каталогом
Загалом — увесь каталог. За тарифом — лише моделі, доступні на цьому рівні (ті самі правила, що й «доступні» у списку). Позиція в діапазоні мін–середнє–макс. Ціна — більша з prompt або completion за токен, за 1M токенів.
Ціна (за 1M токенів)
Мін
Макс
Ця модель
339 моделей у цій групіЦіна (за 1M токенів)
- Мін
- 0,04 USD
- Сер
- 12,395447 USD
- Макс
- 750,00 USD
Ця модель: 0,80 USD / 1M токенів
Довжина контексту (токени)
Мін
Макс
Ця модель
339 моделей у цій групіДовжина контексту (токени)
- Мін
- 4 095 токенів
- Сер
- 379 884,782 токенів
- Макс
- 10 000 000 токенів
Ця модель: 131 072 токенів
Можливості
Текст → ТекстКонтекст: 131,072 токенів
Вхід:
Текст
Вихід:
Текст