DeepSeek: R1 Distill Qwen 32B

deepseek/deepseek-r1-distill-qwen-32b

Опис

DeepSeek R1 Distill Qwen 32B – це дистильована велика мовна модель, заснована на Qwen 2.5 32B, що використовує вихідні дані з DeepSeek R1. Вона перевершує o1-mini від OpenAI за різними бенчмарками, досягаючи нових найсучасніших результатів для щільних моделей. Інші результати бенчмарків включають: AIME 2024 pass@1: 72.6 MATH-500 pass@1: 94.3 CodeForces Rating: 1691. Модель використовує тонке налаштування на основі вихідних даних DeepSeek R1, що забезпечує конкурентоспроможну продуктивність, порівнянну з більшими передовими моделями.

Порівняння з каталогом

Загалом — увесь каталог. За тарифом — лише моделі, доступні на цьому рівні (ті самі правила, що й «доступні» у списку). Позиція в діапазоні мін–середнє–макс. Ціна — більша з prompt або completion за токен, за 1M токенів.

Ціна (за 1M токенів)

Мін
Макс
Ця модель
339 моделей у цій групіЦіна (за 1M токенів)
Мін
0,04 USD
Сер
12,395447 USD
Макс
750,00 USD
Ця модель: 0,29 USD / 1M токенів

Довжина контексту (токени)

Мін
Макс
Ця модель
339 моделей у цій групіДовжина контексту (токени)
Мін
4 095 токенів
Сер
379 884,782 токенів
Макс
10 000 000 токенів
Ця модель: 128 000 токенів

Можливості

Текст → ТекстКонтекст: 32,768 токенів
Вхід:
Текст
Вихід:
Текст
    DeepSeek: R1 Distill Qwen 32B