Скопировано в буфер обмена!
Gemma 4 26B A4B IT — это модель Mixture-of-Experts (MoE) от Google DeepMind, настроенная на выполнение инструкций. Несмотря на общий объем в 25,2 миллиарда параметров, во время вывода активируется только 3,8 миллиарда параметров на каждый токен, что обеспечивает качество, близкое к 31 миллиарду, при значительно меньших вычислительных затратах. Поддерживает мультимодальный ввод, включая текст, изображения и видео (до 60 секунд при 1 кадре в секунду). Имеет контекстное окно на 256 тысяч токенов, возможность вызова встроенных функций, настраиваемый режим мышления/рассуждения и поддержку структурированного вывода. Выпущена под лицензией Apache 2.0.