Qwen: Qwen3 VL 30B A3B Instruct

Qwen3-VL-30B-A3B-Instruct — це мультимодальна модель, яка поєднує потужну генерацію тексту з візуальним розумінням для зображень та відео. Її варіант Instruct оптимізує виконання інструкцій для загальних мультимодальних завдань. Вона чудово справляється з розпізнаванням реальних/синтетичних категорій, просторовою прив'язкою 2D/3D та глибоким візуальним розумінням, досягаючи конкурентних результатів у мультимодальних бенчмарках. Для використання в агентних системах, вона обробляє багатозображувальні багатоетапні інструкції, вирівнювання часових шкал відео, автоматизацію графічного інтерфейсу та візуальне кодування від ескізів до налагодженого інтерфейсу. Продуктивність тексту відповідає флагманським моделям Qwen3, що робить її придатною для штучного інтелекту документів, оптичного розпізнавання символів (OCR), допомоги з інтерфейсом користувача, просторових завдань та досліджень агентних систем.

Qwen: Qwen3 VL 30B A3B Instruct

Опис

Порівняння з каталогом

Ціна (за 1M токенів)

Довжина контексту (токени)

Можливості