Google: Gemma 3n 4B

Gemma 3n E4B оптимізована для ефективного виконання на мобільних пристроях та пристроях з обмеженими ресурсами, таких як телефони, ноутбуки та планшети. Вона підтримує мультимодальні входи, включаючи текст, візуальні дані та аудіо, що уможливлює виконання різноманітних завдань, таких як генерація тексту, розпізнавання мовлення, переклад та аналіз зображень. Використовуючи інновації, такі як кешування вбудованих шарів (Per-Layer Embedding, PLE) та архітектуру MatFormer, Gemma 3n динамічно керує використанням пам'яті та обчислювальним навантаженням шляхом вибіркової активації параметрів моделі, значно зменшуючи вимоги до ресурсів під час виконання. Ця модель підтримує широкий лінгвістичний діапазон (навчена на понад 140 мовах) і має гнучке вікно контексту в 32 тис. токенів. Gemma 3n може вибірково завантажувати параметри, оптимізуючи пам'ять та обчислювальну ефективність на основі завдання або можливостей пристрою, що робить її добре придатною для додатків, орієнтованих на конфіденційність, автономних застосувань та рішень ШІ на пристрої.

Google: Gemma 3n 4B

Опис

Порівняння з каталогом

Ціна (за 1M токенів)

Довжина контексту (токени)

Можливості