DeepSeek: R1 Distill Llama 70B

Опис

DeepSeek R1 Distill Llama 70B — це дистильована велика мовна модель, заснована на Llama-3.3-70B-Instruct, яка використовує вихідні дані від DeepSeek R1. Модель поєднує передові методи дистиляції для досягнення високої продуктивності за різними бенчмарками, включаючи: * AIME 2024 pass@1: 70.0 * MATH-500 pass@1: 94.5 * CodeForces Rating: 1633 Модель використовує доопрацювання на основі вихідних даних DeepSeek R1, що забезпечує конкурентоспроможну продуктивність, порівнянну з більшими передовими моделями.

Порівняння з каталогом

Загалом — увесь каталог. За тарифом — лише моделі, доступні на цьому рівні (ті самі правила, що й «доступні» у списку). Позиція в діапазоні мін–середнє–макс. Ціна — більша з prompt або completion за токен, за 1M токенів.

Ціна (за 1M токенів)

Мін

Макс

Ця модель

332 моделей у цій групіЦіна (за 1M токенів)

Мін: 0,04 USD
Сер: 12,655889 USD
Макс: 750,00 USD

Ця модель: 0,80 USD / 1M токенів

Довжина контексту (токени)

Мін

Макс

Ця модель

332 моделей у цій групіДовжина контексту (токени)

Мін: 4 095 токенів
Сер: 424 110,593 токенів
Макс: 10 000 000 токенів

Ця модель: 128 000 токенів

Опис

Порівняння з каталогом

Ціна (за 1M токенів)

Довжина контексту (токени)

Можливості