Google: Gemma 4 31B

Name: Google Google: Gemma 4 31B API
Brand: RouterAI
Price: 0.01 RUB
Availability: InStock

Идентификатор:

Чат

Характеристики

Контекстное окно 262K

Дата релиза 02 апреля 2026

Мультимодальность

Входящие данные:

Изображения
Текст
Видео

Исходящие данные:

Текст

Цены

Оплата производится по факту за использованные токены.

Тип

Стоимость

Входящие токены

12 ₽ / 1M токенов

Подробнее

Цены по провайдерам

RouterAI работает с несколькими провайдерами для обеспечения максимальной доступности и оптимальных цен.

1

Novita

14 ₽

Входящие
2

Parasail

15 ₽

Входящие
3

Phala

15 ₽

Входящие
4

Chutes

12 ₽

Входящие
5

Venice

12 ₽

Входящие
6

SiliconFlow

13 ₽

Входящие
7

SambaNova

22 ₽

Входящие
8

WandB

12 ₽

Входящие
9

ModelRun

22 ₽

Входящие
10

DeepInfra

12 ₽

Входящие
11

Together

28 ₽

Входящие

Умная маршрутизация запросов

Ваши запросы автоматически направляются к провайдеру с самой низкой ценой. Если провайдер недоступен, система мгновенно переключается на следующего по цене, обеспечивая непрерывную работу вашего приложения без потери запросов.

Автоматический выбор
Отказоустойчивость
Лучшая цена

Исходящие токены

35 ₽ / 1M токенов

Подробнее

Цены по провайдерам

RouterAI работает с несколькими провайдерами для обеспечения максимальной доступности и оптимальных цен.

1

Novita

40 ₽

Исходящие
2

Parasail

40 ₽

Исходящие
3

Phala

46 ₽

Исходящие
4

Chutes

37 ₽

Исходящие
5

Venice

36 ₽

Исходящие
6

SiliconFlow

40 ₽

Исходящие
7

SambaNova

59 ₽

Исходящие
8

WandB

35 ₽

Исходящие
9

ModelRun

55 ₽

Исходящие
10

DeepInfra

37 ₽

Исходящие
11

Together

86 ₽

Исходящие

Умная маршрутизация запросов

Автоматический выбор
Отказоустойчивость
Лучшая цена

Чтение кеша

9 ₽ / 1M токенов

Подробнее

Цены по провайдерам

RouterAI работает с несколькими провайдерами для обеспечения максимальной доступности и оптимальных цен.

1

Novita

9 ₽

Чтение кеша
2

Parasail

6 ₽

Чтение кеша
3

Phala

7 ₽

Чтение кеша
4

Chutes

6 ₽

Чтение кеша
5

Venice

9 ₽

Чтение кеша
6

SiliconFlow

9 ₽

Чтение кеша
7

SambaNova

9 ₽

Чтение кеша
8

WandB

9 ₽

Чтение кеша
9

ModelRun

12 ₽

Чтение кеша
10

DeepInfra

9 ₽

Чтение кеша
11

Together

9 ₽

Чтение кеша

Умная маршрутизация запросов

Автоматический выбор
Отказоустойчивость
Лучшая цена

Цены указаны в рублях и могут меняться в зависимости от курса валют

Описание модели

Gemma 4 31B Instruct — это плотная мультимодальная модель от Google DeepMind с 30,7 миллиардами параметров, поддерживающая текстовый и визуальный ввод с текстовым выводом. Обладает контекстным окном на 256 тысяч токенов, настраиваемым режимом мышления/рассуждения, возможностью нативного вызова функций и многоязычной поддержкой более чем на 140 языках. Сильна в задачах программирования, рассуждения и понимания документов. Лицензия Apache 2.0.

API и примеры кода

Наш сервис предоставляет единый API, совместимый с OpenAI SDK. Просто укажите наш base_url и используйте ключ, полученный в личном кабинете.

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://routerai.ru/api/v1"
)

response = client.chat.completions.create(
    model="google/gemma-4-31b-it",
    messages=[
        {"role": "user", "content": "Hello, how are you?"}
    ]
)

print(response.choices[0].message.content)

import requests
import json

url = "https://routerai.ru/api/v1/chat/completions"
headers = {
    "Authorization": "Bearer YOUR_API_KEY",
    "Content-Type": "application/json"
}

data = {
    "model": "google/gemma-4-31b-it",
    "messages": [
        {"role": "user", "content": "Hello, how are you?"}
    ]
}

response = requests.post(url, headers=headers, json=data)
result = response.json()
print(json.dumps(result, indent=2))

curl -X POST "https://routerai.ru/api/v1/chat/completions" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "google/gemma-4-31b-it",
    "messages": [
      {"role": "user", "content": "Hello, how are you?"}
    ]
  }'

Эндпоинты

Отправляет сообщения модели и получает ответ. Поддерживает потоковый и непотоковый режимы.

POST https://routerai.ru/api/v1/chat/completions

Документация

Authorization

Bearer YOUR_API_KEY

Content-Type

application/json

Model

google/gemma-4-31b-it

Создаёт ответ в формате OpenAI Responses API. Поддерживает потоковый и непотоковый режимы.

POST https://routerai.ru/api/v1/responses

Документация

Authorization

Bearer YOUR_API_KEY

Content-Type

application/json

Model

google/gemma-4-31b-it

Создаёт сообщение в формате Anthropic Messages API. Поддерживает текст, изображения, инструменты и размышления (thinking).

POST https://routerai.ru/api/v1/messages

Документация

Authorization

Bearer YOUR_API_KEY

Content-Type

application/json

Model

google/gemma-4-31b-it

Параметры

Параметр

Тип

По умолчанию

Описание

max_tokens

integer

—

Верхний предел количества токенов, которые модель может сгенерировать в ответе.

temperature

float

Влияет на разнообразие ответов модели: чем выше, тем более случайным будет вывод.

top_p

float

Ограничивает выбор модели долей наиболее вероятных токенов: учитываются только токены, чьи вероятности в сумме дают P.

seed

integer

—

Если задан, инференс выполняется детерминированно — повторные запросы с тем же seed и параметрами должны давать одинаковый результат.

logprobs

boolean

—

Возвращать ли логарифмы вероятностей выходных токенов.

top_logprobs

integer

—

Число от 0 до 20: сколько наиболее вероятных токенов возвращать на каждой позиции, каждый с логарифмом вероятности.

response_format

map

—

Заставляет модель выдавать ответ в определённом формате.

stop

array

—

Немедленно останавливает генерацию, если модель встречает любой из токенов, указанных в массиве stop.

frequency_penalty

float

Управляет повторением токенов в зависимости от того, как часто они встречаются во входных данных.

presence_penalty

float

Регулирует, насколько часто модель повторяет токены, уже встречавшиеся во входных данных.

repetition_penalty

float

—

Снижает вероятность повторения токенов из входных данных, пропорционально тому, как часто они встречаются.

top_k

integer

—

Ограничивает выбор модели K наиболее вероятными токенами на каждом шаге.

min_p

float

—

Минимальная вероятность токена относительно вероятности самого вероятного токена, чтобы он был рассмотрен.

logit_bias

map

—

Изменяет вероятность появления указанных токенов в ответе.

structured_outputs

boolean

—

Поддержка ответа по строгой JSON-схеме.

tool_choice

map

—

Управляет тем, какую функцию (инструмент) вызовет модель, если они переданы.

tools

array

—

Список инструментов (функций), которые модель может вызвать.

reasoning

map

—

Настройки рассуждений модели (бюджет токенов, уровень усилий).

include_reasoning

boolean

—

Возвращать ли в ответе цепочку рассуждений модели.

Вернуться к списку моделей

Google: Gemma 4 31B

Характеристики

Мультимодальность

Входящие данные:

Исходящие данные:

Цены

Цены по провайдерам

Novita

Parasail

Phala

Chutes

Venice

SiliconFlow

SambaNova

WandB

ModelRun

DeepInfra

Together

Умная маршрутизация запросов

Цены по провайдерам

Novita

Parasail

Phala

Chutes

Venice

SiliconFlow

SambaNova

WandB

ModelRun

DeepInfra

Together

Умная маршрутизация запросов

Цены по провайдерам

Novita

Parasail

Phala

Chutes

Venice

SiliconFlow

SambaNova

WandB

ModelRun

DeepInfra

Together

Умная маршрутизация запросов

Описание модели

API и примеры кода

Эндпоинты

Параметры