Google: Gemma 3n 4B
google/gemma-3n-e4b-it
Опис
Gemma 3n E4B оптимізована для ефективного виконання на мобільних пристроях та пристроях з обмеженими ресурсами, таких як телефони, ноутбуки та планшети. Вона підтримує мультимодальні входи, включаючи текст, візуальні дані та аудіо, що уможливлює виконання різноманітних завдань, таких як генерація тексту, розпізнавання мовлення, переклад та аналіз зображень. Використовуючи інновації, такі як кешування вбудованих шарів (Per-Layer Embedding, PLE) та архітектуру MatFormer, Gemma 3n динамічно керує використанням пам'яті та обчислювальним навантаженням шляхом вибіркової активації параметрів моделі, значно зменшуючи вимоги до ресурсів під час виконання.
Ця модель підтримує широкий лінгвістичний діапазон (навчена на понад 140 мовах) і має гнучке вікно контексту в 32 тис. токенів. Gemma 3n може вибірково завантажувати параметри, оптимізуючи пам'ять та обчислювальну ефективність на основі завдання або можливостей пристрою, що робить її добре придатною для додатків, орієнтованих на конфіденційність, автономних застосувань та рішень ШІ на пристрої.
Порівняння з каталогом
Загалом — увесь каталог. За тарифом — лише моделі, доступні на цьому рівні (ті самі правила, що й «доступні» у списку). Позиція в діапазоні мін–середнє–макс. Ціна — більша з prompt або completion за токен, за 1M токенів.
Ціна (за 1M токенів)
Мін
Макс
Ця модель
339 моделей у цій групіЦіна (за 1M токенів)
- Мін
- 0,04 USD
- Сер
- 12,395447 USD
- Макс
- 750,00 USD
Ця модель: 0,12 USD / 1M токенів
Довжина контексту (токени)
Мін
Макс
Ця модель
339 моделей у цій групіДовжина контексту (токени)
- Мін
- 4 095 токенів
- Сер
- 379 884,782 токенів
- Макс
- 10 000 000 токенів
Ця модель: 32 768 токенів
Можливості
Текст → ТекстКонтекст: 32,768 токенів
Вхід:
Текст
Вихід:
Текст