Inception: Mercury 2

inception/mercury-2

Опис

Mercury 2 — це надзвичайно швидка LLM для міркувань, і перша LLM для міркувань за допомогою дифузії (dLLM). Замість послідовної генерації токенів, Mercury 2 продукує та вдосконалює декілька токенів паралельно, досягаючи понад 1000 токенів на секунду на стандартних графічних процесорах. Mercury 2 у 5 разів швидший за провідні LLM, оптимізовані за швидкістю, такі як Claude 4.5 Haiku та GPT 5 Mini. Mercury 2 підтримує налаштовувані рівні міркувань, контекст 128K, власне використання інструментів та JSON-вихід, вирівняний за схемою. Створений для робочих процесів кодування, де затримка ускладнюється, голосового/пошукового доступу в реальному часі та циклів агентів. Сумісний з API OpenAI.

Порівняння з каталогом

Загалом — увесь каталог. За тарифом — лише моделі, доступні на цьому рівні (ті самі правила, що й «доступні» у списку). Позиція в діапазоні мін–середнє–макс. Ціна — більша з prompt або completion за токен, за 1M токенів.

Ціна (за 1M токенів)

Мін
Макс
Ця модель
336 моделей у цій групіЦіна (за 1M токенів)
Мін
0,04 USD
Сер
12,381012 USD
Макс
750,00 USD
Ця модель: 0,75 USD / 1M токенів

Довжина контексту (токени)

Мін
Макс
Ця модель
336 моделей у цій групіДовжина контексту (токени)
Мін
4 095 токенів
Сер
382 115,467 токенів
Макс
10 000 000 токенів
Ця модель: 128 000 токенів

Можливості

Текст → ТекстКонтекст: 128,000 токенів
Вхід:
Текст
Вихід:
Текст
    Inception: Mercury 2