Baidu: ERNIE 4.5 VL 28B A3B
baidu/ernie-4.5-vl-28b-a3b
Опис
Потужна мультимодальна чат-модель на базі архітектури Mixture-of-Experts, що має 28 мільярдів загальних параметрів, з яких 3 мільярди активуються на кожен токен. Вона забезпечує виняткове розуміння тексту та зображень завдяки своїй інноваційній гетерогенній структурі MoE з маршрутизацією, ізольованою за модальністю. Створена з масштабованою інфраструктурою для високопродуктивного навчання та висновків, модель використовує передові методи пост-навчання, включаючи SFT, DPO та UPO, для оптимізованої продуктивності. Вона підтримує вражаючу довжину контексту в 131 тисячу токенів та вирівнювання за допомогою RLVR для чудових міжмодальних можливостей міркування та генерації.
Порівняння з каталогом
Загалом — увесь каталог. За тарифом — лише моделі, доступні на цьому рівні (ті самі правила, що й «доступні» у списку). Позиція в діапазоні мін–середнє–макс. Ціна — більша з prompt або completion за токен, за 1M токенів.
Ціна (за 1M токенів)
Мін
Макс
Ця модель
339 моделей у цій групіЦіна (за 1M токенів)
- Мін
- 0,04 USD
- Сер
- 12,395447 USD
- Макс
- 750,00 USD
Ця модель: 0,56 USD / 1M токенів
Довжина контексту (токени)
Мін
Макс
Ця модель
339 моделей у цій групіДовжина контексту (токени)
- Мін
- 4 095 токенів
- Сер
- 379 884,782 токенів
- Макс
- 10 000 000 токенів
Ця модель: 131 072 токенів
Можливості
Текст + Зображення → ТекстКонтекст: 30,000 токенів
Вхід:
ТекстЗображення
Вихід:
Текст