Qwen: Qwen3 235B A22B Instruct 2507

Qwen3-235B-A22B-Instruct-2507 — це багатомовна, інструктивно-налаштована мовна модель із архітектурою "суміш експертів" (mixture-of-experts), що базується на архітектурі Qwen3-235B, з 22 мільярдами активних параметрів за один прямий прохід. Вона оптимізована для генерації тексту загального призначення, включаючи виконання інструкцій, логічне мислення, математику, написання коду та використання інструментів. Модель підтримує нативну довжину контексту 262 тис. і не реалізує "режим мислення" (блоки <think>). Порівняно зі своїм базовим варіантом, ця версія демонструє значні покращення у покритті знань, міркуваннях у довгому контексті, показниках у кодуванні та відповідності до завдань відкритого типу. Вона особливо сильна у багатомовному розумінні, математичних міркуваннях (наприклад, AIME, HMMT) та оцінках відповідності, таких як Arena-Hard та WritingBench.

Qwen: Qwen3 235B A22B Instruct 2507

Опис

Порівняння з каталогом

Ціна (за 1M токенів)

Довжина контексту (токени)

Можливості