Inception: Mercury 2

Опис

Mercury 2 — це надзвичайно швидка LLM для міркувань, і перша LLM для міркувань за допомогою дифузії (dLLM). Замість послідовної генерації токенів, Mercury 2 продукує та вдосконалює декілька токенів паралельно, досягаючи понад 1000 токенів на секунду на стандартних графічних процесорах. Mercury 2 у 5 разів швидший за провідні LLM, оптимізовані за швидкістю, такі як Claude 4.5 Haiku та GPT 5 Mini. Mercury 2 підтримує налаштовувані рівні міркувань, контекст 128K, власне використання інструментів та JSON-вихід, вирівняний за схемою. Створений для робочих процесів кодування, де затримка ускладнюється, голосового/пошукового доступу в реальному часі та циклів агентів. Сумісний з API OpenAI.

Порівняння з каталогом

Загалом — увесь каталог. За тарифом — лише моделі, доступні на цьому рівні (ті самі правила, що й «доступні» у списку). Позиція в діапазоні мін–середнє–макс. Ціна — більша з prompt або completion за токен, за 1M токенів.

Ціна (за 1M токенів)

Мін

Макс

Ця модель

336 моделей у цій групіЦіна (за 1M токенів)

Мін: 0,04 USD
Сер: 12,571466 USD
Макс: 750,00 USD

Ця модель: 0,75 USD / 1M токенів

Довжина контексту (токени)

Мін

Макс

Ця модель

336 моделей у цій групіДовжина контексту (токени)

Мін: 4 095 токенів
Сер: 398 336,839 токенів
Макс: 2 000 000 токенів

Ця модель: 128 000 токенів

Опис

Порівняння з каталогом

Ціна (за 1M токенів)

Довжина контексту (токени)

Можливості