Qwen: Qwen3 VL 235B A22B Thinking
qwen/qwen3-vl-235b-a22b-thinking
Опис
Qwen3-VL-235B-A22B Thinking — це мультимодальна модель, яка поєднує потужну генерацію тексту з візуальним розумінням зображень і відео. Модель Thinking оптимізована для мультимодальних міркувань у сферах STEM та математики. Серія наголошує на надійному сприйнятті (розпізнавання різноманітних реальних та синтетичних категорій), просторовому розумінні (прив'язка 2D/3D) та довготривалому візуальному розумінні, демонструючи конкурентоспроможні результати на публічних мультимодальних бенчмарках як для сприйняття, так і для міркувань.
Окрім аналізу, Qwen3-VL підтримує агентну взаємодію та використання інструментів: вона може виконувати складні інструкції в багатозображувальних, багатоходових діалогах; зіставляти текст з часовими шкалами відео для точних часових запитів; та керувати елементами графічного інтерфейсу користувача (GUI) для завдань автоматизації. Моделі також уможливлюють робочі процеси візуального кодування, перетворюючи ескізи або макети в код та допомагаючи з налагодженням інтерфейсу користувача, зберігаючи при цьому високу продуктивність лише для тексту, порівнянну з флагманськими мовними моделями Qwen3. Це робить Qwen3-VL придатною для виробничих сценаріїв, що охоплюють ШІ для документів, багатомовне оптичне розпізнавання символів (OCR), допомогу програмному забезпеченню/інтерфейсу користувача, просторові/втілені завдання та дослідження візіомовних агентів.
Порівняння з каталогом
Загалом — увесь каталог. За тарифом — лише моделі, доступні на цьому рівні (ті самі правила, що й «доступні» у списку). Позиція в діапазоні мін–середнє–макс. Ціна — більша з prompt або completion за токен, за 1M токенів.
Ціна (за 1M токенів)
Мін
Макс
Ця модель
336 моделей у цій групіЦіна (за 1M токенів)
- Мін
- 0,04 USD
- Сер
- 12,381012 USD
- Макс
- 750,00 USD
Ця модель: 2,60 USD / 1M токенів
Довжина контексту (токени)
Мін
Макс
Ця модель
336 моделей у цій групіДовжина контексту (токени)
- Мін
- 4 095 токенів
- Сер
- 382 115,467 токенів
- Макс
- 10 000 000 токенів
Ця модель: 131 072 токенів
Можливості
Текст + Зображення → ТекстКонтекст: 131,072 токенів
Вхід:
ТекстЗображення
Вихід:
Текст