Загрузка...

Google: Gemma 4 31B

Идентификатор:
Скопировано!
Чат

Характеристики

Контекстное окно 262K

Дата релиза 02 апреля 2026

Мультимодальность

Входящие данные:

  • Изображения
  • Текст
  • Видео

Исходящие данные:

  • Текст

Цены

Оплата производится по факту за использованные токены.

Тип
Стоимость
Входящие токены
Токены, полученные и обработанные моделью при анализе пользовательского запроса и контекста. Включают текст сообщения, предыдущую историю диалога и все передаваемые данные.
12 ₽ / 1M токенов
Подробнее

Цены по провайдерам

RouterAI работает с несколькими провайдерами для обеспечения максимальной доступности и оптимальных цен.

  • 1
    Novita

    14 ₽
    Входящие
  • 2
    Parasail

    15 ₽
    Входящие
  • 3
    Phala

    15 ₽
    Входящие
  • 4
    Chutes

    12 ₽
    Входящие
  • 5
    Venice

    12 ₽
    Входящие
  • 6
    SiliconFlow

    13 ₽
    Входящие
  • 7
    SambaNova

    22 ₽
    Входящие
  • 8
    WandB

    12 ₽
    Входящие
  • 9
    ModelRun

    22 ₽
    Входящие
  • 10
    DeepInfra

    12 ₽
    Входящие
  • 11
    Together

    28 ₽
    Входящие

Умная маршрутизация запросов

Ваши запросы автоматически направляются к провайдеру с самой низкой ценой. Если провайдер недоступен, система мгновенно переключается на следующего по цене, обеспечивая непрерывную работу вашего приложения без потери запросов.

  • Автоматический выбор
  • Отказоустойчивость
  • Лучшая цена
Исходящие токены
Токены, генерируемые моделью в виде ответа пользователю. Каждый символ, слово или часть ответа, созданные моделью, включаются в подсчёт выходных токенов.
35 ₽ / 1M токенов
Подробнее

Цены по провайдерам

RouterAI работает с несколькими провайдерами для обеспечения максимальной доступности и оптимальных цен.

  • 1
    Novita

    40 ₽
    Исходящие
  • 2
    Parasail

    40 ₽
    Исходящие
  • 3
    Phala

    46 ₽
    Исходящие
  • 4
    Chutes

    37 ₽
    Исходящие
  • 5
    Venice

    36 ₽
    Исходящие
  • 6
    SiliconFlow

    40 ₽
    Исходящие
  • 7
    SambaNova

    59 ₽
    Исходящие
  • 8
    WandB

    35 ₽
    Исходящие
  • 9
    ModelRun

    55 ₽
    Исходящие
  • 10
    DeepInfra

    37 ₽
    Исходящие
  • 11
    Together

    86 ₽
    Исходящие

Умная маршрутизация запросов

Ваши запросы автоматически направляются к провайдеру с самой низкой ценой. Если провайдер недоступен, система мгновенно переключается на следующего по цене, обеспечивая непрерывную работу вашего приложения без потери запросов.

  • Автоматический выбор
  • Отказоустойчивость
  • Лучшая цена
Чтение кеша
Повторное использование кэшированного контента снижает затраты благодаря применению пониженного тарифа на эти токены.
9 ₽ / 1M токенов
Подробнее

Цены по провайдерам

RouterAI работает с несколькими провайдерами для обеспечения максимальной доступности и оптимальных цен.

  • 1
    Novita

    9 ₽
    Чтение кеша
  • 2
    Parasail

    6 ₽
    Чтение кеша
  • 3
    Phala

    7 ₽
    Чтение кеша
  • 4
    Chutes

    6 ₽
    Чтение кеша
  • 5
    Venice

    9 ₽
    Чтение кеша
  • 6
    SiliconFlow

    9 ₽
    Чтение кеша
  • 7
    SambaNova

    9 ₽
    Чтение кеша
  • 8
    WandB

    9 ₽
    Чтение кеша
  • 9
    ModelRun

    12 ₽
    Чтение кеша
  • 10
    DeepInfra

    9 ₽
    Чтение кеша
  • 11
    Together

    9 ₽
    Чтение кеша

Умная маршрутизация запросов

Ваши запросы автоматически направляются к провайдеру с самой низкой ценой. Если провайдер недоступен, система мгновенно переключается на следующего по цене, обеспечивая непрерывную работу вашего приложения без потери запросов.

  • Автоматический выбор
  • Отказоустойчивость
  • Лучшая цена

Цены указаны в рублях и могут меняться в зависимости от курса валют

Описание модели

Gemma 4 31B Instruct — это плотная мультимодальная модель от Google DeepMind с 30,7 миллиардами параметров, поддерживающая текстовый и визуальный ввод с текстовым выводом. Обладает контекстным окном на 256 тысяч токенов, настраиваемым режимом мышления/рассуждения, возможностью нативного вызова функций и многоязычной поддержкой более чем на 140 языках. Сильна в задачах программирования, рассуждения и понимания документов. Лицензия Apache 2.0.

API и примеры кода

Наш сервис предоставляет единый API, совместимый с OpenAI SDK. Просто укажите наш base_url и используйте ключ, полученный в личном кабинете.

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://routerai.ru/api/v1"
)

response = client.chat.completions.create(
    model="google/gemma-4-31b-it",
    messages=[
        {"role": "user", "content": "Hello, how are you?"}
    ]
)

print(response.choices[0].message.content)
import requests
import json

url = "https://routerai.ru/api/v1/chat/completions"
headers = {
    "Authorization": "Bearer YOUR_API_KEY",
    "Content-Type": "application/json"
}

data = {
    "model": "google/gemma-4-31b-it",
    "messages": [
        {"role": "user", "content": "Hello, how are you?"}
    ]
}

response = requests.post(url, headers=headers, json=data)
result = response.json()
print(json.dumps(result, indent=2))
curl -X POST "https://routerai.ru/api/v1/chat/completions" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "google/gemma-4-31b-it",
    "messages": [
      {"role": "user", "content": "Hello, how are you?"}
    ]
  }'

Эндпоинты

Отправляет сообщения модели и получает ответ. Поддерживает потоковый и непотоковый режимы.

POST https://routerai.ru/api/v1/chat/completions
Документация
Authorization
Bearer YOUR_API_KEY
Content-Type
application/json
Model
google/gemma-4-31b-it

Создаёт ответ в формате OpenAI Responses API. Поддерживает потоковый и непотоковый режимы.

POST https://routerai.ru/api/v1/responses
Документация
Authorization
Bearer YOUR_API_KEY
Content-Type
application/json
Model
google/gemma-4-31b-it

Создаёт сообщение в формате Anthropic Messages API. Поддерживает текст, изображения, инструменты и размышления (thinking).

POST https://routerai.ru/api/v1/messages
Документация
Authorization
Bearer YOUR_API_KEY
Content-Type
application/json
Model
google/gemma-4-31b-it

Параметры

Параметр
Тип
По умолчанию
Описание
max_tokens
integer
Верхний предел количества токенов, которые модель может сгенерировать в ответе.
temperature
float
1
Влияет на разнообразие ответов модели: чем выше, тем более случайным будет вывод.
top_p
float
1
Ограничивает выбор модели долей наиболее вероятных токенов: учитываются только токены, чьи вероятности в сумме дают P.
seed
integer
Если задан, инференс выполняется детерминированно — повторные запросы с тем же seed и параметрами должны давать одинаковый результат.
logprobs
boolean
Возвращать ли логарифмы вероятностей выходных токенов.
top_logprobs
integer
Число от 0 до 20: сколько наиболее вероятных токенов возвращать на каждой позиции, каждый с логарифмом вероятности.
response_format
map
Заставляет модель выдавать ответ в определённом формате.
stop
array
Немедленно останавливает генерацию, если модель встречает любой из токенов, указанных в массиве stop.
frequency_penalty
float
0
Управляет повторением токенов в зависимости от того, как часто они встречаются во входных данных.
presence_penalty
float
0
Регулирует, насколько часто модель повторяет токены, уже встречавшиеся во входных данных.
repetition_penalty
float
Снижает вероятность повторения токенов из входных данных, пропорционально тому, как часто они встречаются.
top_k
integer
Ограничивает выбор модели K наиболее вероятными токенами на каждом шаге.
min_p
float
Минимальная вероятность токена относительно вероятности самого вероятного токена, чтобы он был рассмотрен.
logit_bias
map
Изменяет вероятность появления указанных токенов в ответе.
structured_outputs
boolean
Поддержка ответа по строгой JSON-схеме.
tool_choice
map
Управляет тем, какую функцию (инструмент) вызовет модель, если они переданы.
tools
array
Список инструментов (функций), которые модель может вызвать.
reasoning
map
Настройки рассуждений модели (бюджет токенов, уровень усилий).
include_reasoning
boolean
Возвращать ли в ответе цепочку рассуждений модели.