Google: Gemma 3n 4B

google/gemma-3n-e4b-it

Опис

Gemma 3n E4B оптимізована для ефективного виконання на мобільних пристроях та пристроях з обмеженими ресурсами, таких як телефони, ноутбуки та планшети. Вона підтримує мультимодальні входи, включаючи текст, візуальні дані та аудіо, що уможливлює виконання різноманітних завдань, таких як генерація тексту, розпізнавання мовлення, переклад та аналіз зображень. Використовуючи інновації, такі як кешування вбудованих шарів (Per-Layer Embedding, PLE) та архітектуру MatFormer, Gemma 3n динамічно керує використанням пам'яті та обчислювальним навантаженням шляхом вибіркової активації параметрів моделі, значно зменшуючи вимоги до ресурсів під час виконання. Ця модель підтримує широкий лінгвістичний діапазон (навчена на понад 140 мовах) і має гнучке вікно контексту в 32 тис. токенів. Gemma 3n може вибірково завантажувати параметри, оптимізуючи пам'ять та обчислювальну ефективність на основі завдання або можливостей пристрою, що робить її добре придатною для додатків, орієнтованих на конфіденційність, автономних застосувань та рішень ШІ на пристрої.

Порівняння з каталогом

Загалом — увесь каталог. За тарифом — лише моделі, доступні на цьому рівні (ті самі правила, що й «доступні» у списку). Позиція в діапазоні мін–середнє–макс. Ціна — більша з prompt або completion за токен, за 1M токенів.

Ціна (за 1M токенів)

Мін
Макс
Ця модель
339 моделей у цій групіЦіна (за 1M токенів)
Мін
0,04 USD
Сер
12,395447 USD
Макс
750,00 USD
Ця модель: 0,12 USD / 1M токенів

Довжина контексту (токени)

Мін
Макс
Ця модель
339 моделей у цій групіДовжина контексту (токени)
Мін
4 095 токенів
Сер
379 884,782 токенів
Макс
10 000 000 токенів
Ця модель: 32 768 токенів

Можливості

Текст → ТекстКонтекст: 32,768 токенів
Вхід:
Текст
Вихід:
Текст
    Google: Gemma 3n 4B