Inception: Mercury 2
inception/mercury-2
Опис
Mercury 2 — це надзвичайно швидка LLM для міркувань, і перша LLM для міркувань за допомогою дифузії (dLLM). Замість послідовної генерації токенів, Mercury 2 продукує та вдосконалює декілька токенів паралельно, досягаючи понад 1000 токенів на секунду на стандартних графічних процесорах. Mercury 2 у 5 разів швидший за провідні LLM, оптимізовані за швидкістю, такі як Claude 4.5 Haiku та GPT 5 Mini. Mercury 2 підтримує налаштовувані рівні міркувань, контекст 128K, власне використання інструментів та JSON-вихід, вирівняний за схемою. Створений для робочих процесів кодування, де затримка ускладнюється, голосового/пошукового доступу в реальному часі та циклів агентів. Сумісний з API OpenAI.
Порівняння з каталогом
Загалом — увесь каталог. За тарифом — лише моделі, доступні на цьому рівні (ті самі правила, що й «доступні» у списку). Позиція в діапазоні мін–середнє–макс. Ціна — більша з prompt або completion за токен, за 1M токенів.
Ціна (за 1M токенів)
Мін
Макс
Ця модель
336 моделей у цій групіЦіна (за 1M токенів)
- Мін
- 0,04 USD
- Сер
- 12,381012 USD
- Макс
- 750,00 USD
Ця модель: 0,75 USD / 1M токенів
Довжина контексту (токени)
Мін
Макс
Ця модель
336 моделей у цій групіДовжина контексту (токени)
- Мін
- 4 095 токенів
- Сер
- 382 115,467 токенів
- Макс
- 10 000 000 токенів
Ця модель: 128 000 токенів
Можливості
Текст → ТекстКонтекст: 128,000 токенів
Вхід:
Текст
Вихід:
Текст