Qwen: Qwen3.5-Flash
qwen/qwen3.5-flash-02-23
Опис
Власні візуально-мовні моделі Qwen3.5 Flash побудовані на гібридній архітектурі, яка інтегрує механізм лінійної уваги з моделлю розрідженої суміші експертів, досягаючи вищої ефективності інференсу. Порівняно з серією 3, ці моделі забезпечують значний стрибок у продуктивності як для суто текстових, так і для мультимодальних завдань, пропонуючи швидкий час відгуку, балансуючи між швидкістю інференсу та загальною продуктивністю.
Порівняння з каталогом
Загалом — увесь каталог. За тарифом — лише моделі, доступні на цьому рівні (ті самі правила, що й «доступні» у списку). Позиція в діапазоні мін–середнє–макс. Ціна — більша з prompt або completion за токен, за 1M токенів.
Ціна (за 1M токенів)
Мін
Макс
Ця модель
336 моделей у цій групіЦіна (за 1M токенів)
- Мін
- 0,04 USD
- Сер
- 12,385977 USD
- Макс
- 750,00 USD
Ця модель: 0,26 USD / 1M токенів
Довжина контексту (токени)
Мін
Макс
Ця модель
336 моделей у цій групіДовжина контексту (токени)
- Мін
- 4 095 токенів
- Сер
- 382 115,467 токенів
- Макс
- 10 000 000 токенів
Ця модель: 1 000 000 токенів
Можливості
text+image+video->textКонтекст: 1,000,000 токенів
Вхід:
ТекстЗображенняВідео
Вихід:
Текст