Qwen: Qwen3 235B A22B Instruct 2507

qwen/qwen3-235b-a22b-2507

Опис

Qwen3-235B-A22B-Instruct-2507 — це багатомовна, інструктивно-налаштована мовна модель із архітектурою "суміш експертів" (mixture-of-experts), що базується на архітектурі Qwen3-235B, з 22 мільярдами активних параметрів за один прямий прохід. Вона оптимізована для генерації тексту загального призначення, включаючи виконання інструкцій, логічне мислення, математику, написання коду та використання інструментів. Модель підтримує нативну довжину контексту 262 тис. і не реалізує "режим мислення" (блоки <think>). Порівняно зі своїм базовим варіантом, ця версія демонструє значні покращення у покритті знань, міркуваннях у довгому контексті, показниках у кодуванні та відповідності до завдань відкритого типу. Вона особливо сильна у багатомовному розумінні, математичних міркуваннях (наприклад, AIME, HMMT) та оцінках відповідності, таких як Arena-Hard та WritingBench.

Порівняння з каталогом

Загалом — увесь каталог. За тарифом — лише моделі, доступні на цьому рівні (ті самі правила, що й «доступні» у списку). Позиція в діапазоні мін–середнє–макс. Ціна — більша з prompt або completion за токен, за 1M токенів.

Ціна (за 1M токенів)

Мін
Макс
Ця модель
339 моделей у цій групіЦіна (за 1M токенів)
Мін
0,04 USD
Сер
12,395447 USD
Макс
750,00 USD
Ця модель: 0,10 USD / 1M токенів

Довжина контексту (токени)

Мін
Макс
Ця модель
339 моделей у цій групіДовжина контексту (токени)
Мін
4 095 токенів
Сер
379 884,782 токенів
Макс
10 000 000 токенів
Ця модель: 262 144 токенів

Можливості

Текст → ТекстКонтекст: 262,144 токенів
Вхід:
Текст
Вихід:
Текст
    Qwen: Qwen3 235B A22B Instruct 2507