Загрузка...

Google: Gemma 4 26B A4B

Идентификатор:
Скопировано!
Чат

Характеристики

Контекстное окно 262K

Дата релиза 03 апреля 2026

Мультимодальность

Входящие данные:

  • Изображения
  • Текст
  • Видео

Исходящие данные:

  • Текст

Цены

Оплата производится по факту за использованные токены.

Тип
Стоимость
Входящие токены
Токены, полученные и обработанные моделью при анализе пользовательского запроса и контекста. Включают текст сообщения, предыдущую историю диалога и все передаваемые данные.
6 ₽ / 1M токенов
Подробнее

Цены по провайдерам

RouterAI работает с несколькими провайдерами для обеспечения максимальной доступности и оптимальных цен.

  • 1
    DeepInfra

    7 ₽
    Входящие
  • 2
    Novita

    13 ₽
    Входящие
  • 3
    Wafer

    13 ₽
    Входящие
  • 4
    NextBit

    13 ₽
    Входящие
  • 5
    Parasail

    13 ₽
    Входящие
  • 6
    Google

    15 ₽
    Входящие
  • 7
    Venice

    13 ₽
    Входящие
  • 8
    SiliconFlow

    12 ₽
    Входящие
  • 9
    Cloudflare

    10 ₽
    Входящие
  • 10
    DekaLLM

    6 ₽
    Входящие

Умная маршрутизация запросов

Ваши запросы автоматически направляются к провайдеру с самой низкой ценой. Если провайдер недоступен, система мгновенно переключается на следующего по цене, обеспечивая непрерывную работу вашего приложения без потери запросов.

  • Автоматический выбор
  • Отказоустойчивость
  • Лучшая цена
Исходящие токены
Токены, генерируемые моделью в виде ответа пользователю. Каждый символ, слово или часть ответа, созданные моделью, включаются в подсчёт выходных токенов.
33 ₽ / 1M токенов
Подробнее

Цены по провайдерам

RouterAI работает с несколькими провайдерами для обеспечения максимальной доступности и оптимальных цен.

  • 1
    DeepInfra

    34 ₽
    Исходящие
  • 2
    Novita

    40 ₽
    Исходящие
  • 3
    Wafer

    40 ₽
    Исходящие
  • 4
    NextBit

    40 ₽
    Исходящие
  • 5
    Parasail

    40 ₽
    Исходящие
  • 6
    Google

    60 ₽
    Исходящие
  • 7
    Venice

    40 ₽
    Исходящие
  • 8
    SiliconFlow

    40 ₽
    Исходящие
  • 9
    Cloudflare

    30 ₽
    Исходящие
  • 10
    DekaLLM

    33 ₽
    Исходящие

Умная маршрутизация запросов

Ваши запросы автоматически направляются к провайдеру с самой низкой ценой. Если провайдер недоступен, система мгновенно переключается на следующего по цене, обеспечивая непрерывную работу вашего приложения без потери запросов.

  • Автоматический выбор
  • Отказоустойчивость
  • Лучшая цена

Цены указаны в рублях и могут меняться в зависимости от курса валют

Описание модели

Gemma 4 26B A4B IT — это модель Mixture-of-Experts (MoE) от Google DeepMind, настроенная на выполнение инструкций. Несмотря на общий объем в 25,2 миллиарда параметров, во время вывода активируется только 3,8 миллиарда параметров на каждый токен, что обеспечивает качество, близкое к 31 миллиарду, при значительно меньших вычислительных затратах. Поддерживает мультимодальный ввод, включая текст, изображения и видео (до 60 секунд при 1 кадре в секунду). Имеет контекстное окно на 256 тысяч токенов, возможность вызова встроенных функций, настраиваемый режим мышления/рассуждения и поддержку структурированного вывода. Выпущена под лицензией Apache 2.0.

API и примеры кода

Наш сервис предоставляет единый API, совместимый с OpenAI SDK. Просто укажите наш base_url и используйте ключ, полученный в личном кабинете.

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://routerai.ru/api/v1"
)

response = client.chat.completions.create(
    model="google/gemma-4-26b-a4b-it",
    messages=[
        {"role": "user", "content": "Hello, how are you?"}
    ]
)

print(response.choices[0].message.content)
import requests
import json

url = "https://routerai.ru/api/v1/chat/completions"
headers = {
    "Authorization": "Bearer YOUR_API_KEY",
    "Content-Type": "application/json"
}

data = {
    "model": "google/gemma-4-26b-a4b-it",
    "messages": [
        {"role": "user", "content": "Hello, how are you?"}
    ]
}

response = requests.post(url, headers=headers, json=data)
result = response.json()
print(json.dumps(result, indent=2))
curl -X POST "https://routerai.ru/api/v1/chat/completions" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "google/gemma-4-26b-a4b-it",
    "messages": [
      {"role": "user", "content": "Hello, how are you?"}
    ]
  }'

Эндпоинты

Отправляет сообщения модели и получает ответ. Поддерживает потоковый и непотоковый режимы.

POST https://routerai.ru/api/v1/chat/completions
Документация
Authorization
Bearer YOUR_API_KEY
Content-Type
application/json
Model
google/gemma-4-26b-a4b-it

Создаёт ответ в формате OpenAI Responses API. Поддерживает потоковый и непотоковый режимы.

POST https://routerai.ru/api/v1/responses
Документация
Authorization
Bearer YOUR_API_KEY
Content-Type
application/json
Model
google/gemma-4-26b-a4b-it

Создаёт сообщение в формате Anthropic Messages API. Поддерживает текст, изображения, инструменты и размышления (thinking).

POST https://routerai.ru/api/v1/messages
Документация
Authorization
Bearer YOUR_API_KEY
Content-Type
application/json
Model
google/gemma-4-26b-a4b-it

Параметры

Параметр
Тип
По умолчанию
Описание
max_tokens
integer
Верхний предел количества токенов, которые модель может сгенерировать в ответе.
temperature
float
1
Влияет на разнообразие ответов модели: чем выше, тем более случайным будет вывод.
top_p
float
1
Ограничивает выбор модели долей наиболее вероятных токенов: учитываются только токены, чьи вероятности в сумме дают P.
seed
integer
Если задан, инференс выполняется детерминированно — повторные запросы с тем же seed и параметрами должны давать одинаковый результат.
logprobs
boolean
Возвращать ли логарифмы вероятностей выходных токенов.
top_logprobs
integer
Число от 0 до 20: сколько наиболее вероятных токенов возвращать на каждой позиции, каждый с логарифмом вероятности.
response_format
map
Заставляет модель выдавать ответ в определённом формате.
stop
array
Немедленно останавливает генерацию, если модель встречает любой из токенов, указанных в массиве stop.
frequency_penalty
float
0
Управляет повторением токенов в зависимости от того, как часто они встречаются во входных данных.
presence_penalty
float
0
Регулирует, насколько часто модель повторяет токены, уже встречавшиеся во входных данных.
repetition_penalty
float
Снижает вероятность повторения токенов из входных данных, пропорционально тому, как часто они встречаются.
top_k
integer
Ограничивает выбор модели K наиболее вероятными токенами на каждом шаге.
min_p
float
Минимальная вероятность токена относительно вероятности самого вероятного токена, чтобы он был рассмотрен.
logit_bias
map
Изменяет вероятность появления указанных токенов в ответе.
structured_outputs
boolean
Поддержка ответа по строгой JSON-схеме.
tool_choice
map
Управляет тем, какую функцию (инструмент) вызовет модель, если они переданы.
tools
array
Список инструментов (функций), которые модель может вызвать.
reasoning
map
Настройки рассуждений модели (бюджет токенов, уровень усилий).
include_reasoning
boolean
Возвращать ли в ответе цепочку рассуждений модели.