NVIDIA: Nemotron 3 Super

nvidia/nemotron-3-super-120b-a12b

Опис

NVIDIA Nemotron 3 Super — це відкрита гібридна модель MoE з 120 мільярдами параметрів, яка активує лише 12 мільярдів параметрів для максимальної обчислювальної ефективності та точності у складних багатоагентних застосунках. Побудована на гібридній архітектурі Mamba-Transformer Mixture-of-Experts з багатотокенним передбаченням (MTP), вона забезпечує понад 50% вищу швидкість генерації токенів порівняно з провідними відкритими моделями. Модель має вікно контексту в 1 мільйон токенів для довгострокової узгодженості агента, міждокументного аналізу та багатоетапного планування завдань. Прихована MoE дозволяє викликати 4 експертів за вартість інференсу лише одного, покращуючи інтелект та узагальнення. Навчання з підкріпленням у понад 10 середовищах забезпечує провідну точність у бенчмарках, включаючи AIME 2025, TerminalBench та SWE-Bench Verified. Повністю відкрита з вагами, наборами даних та рецептами за ліцензією NVIDIA Open License, Nemotron 3 Super дозволяє легке налаштування та безпечне розгортання будь-де — від робочої станції до хмари.

Порівняння з каталогом

Загалом — увесь каталог. За тарифом — лише моделі, доступні на цьому рівні (ті самі правила, що й «доступні» у списку). Позиція в діапазоні мін–середнє–макс. Ціна — більша з prompt або completion за токен, за 1M токенів.

Ціна (за 1M токенів)

Мін
Макс
Ця модель
336 моделей у цій групіЦіна (за 1M токенів)
Мін
0,04 USD
Сер
12,381012 USD
Макс
750,00 USD
Ця модель: 0,45 USD / 1M токенів

Довжина контексту (токени)

Мін
Макс
Ця модель
336 моделей у цій групіДовжина контексту (токени)
Мін
4 095 токенів
Сер
382 115,467 токенів
Макс
10 000 000 токенів
Ця модель: 1 000 000 токенів

Можливості

Текст → ТекстКонтекст: 262,144 токенів
Вхід:
Текст
Вихід:
Текст
    NVIDIA: Nemotron 3 Super