Загрузка...

Z.ai: GLM 5V Turbo

Идентификатор:
Скопировано!
Чат

Характеристики

Контекстное окно 203K

Дата релиза 01 апреля 2026

Мультимодальность

Входящие данные:

  • Изображения
  • Текст
  • Видео

Исходящие данные:

  • Текст

Цены

Оплата производится по факту за использованные токены.

Тип
Стоимость
Входящие токены
Токены, полученные и обработанные моделью при анализе пользовательского запроса и контекста. Включают текст сообщения, предыдущую историю диалога и все передаваемые данные.
121 ₽ / 1M токенов

Цены по провайдерам

RouterAI работает с несколькими провайдерами для обеспечения максимальной доступности и оптимальных цен.

  • 1
    Z.AI

    121 ₽
    Входящие

Умная маршрутизация запросов

Ваши запросы автоматически направляются к провайдеру с самой низкой ценой. Если провайдер недоступен, система мгновенно переключается на следующего по цене, обеспечивая непрерывную работу вашего приложения без потери запросов.

  • Автоматический выбор
  • Отказоустойчивость
  • Лучшая цена
Исходящие токены
Токены, генерируемые моделью в виде ответа пользователю. Каждый символ, слово или часть ответа, созданные моделью, включаются в подсчёт выходных токенов.
404 ₽ / 1M токенов

Цены по провайдерам

RouterAI работает с несколькими провайдерами для обеспечения максимальной доступности и оптимальных цен.

  • 1
    Z.AI

    404 ₽
    Исходящие

Умная маршрутизация запросов

Ваши запросы автоматически направляются к провайдеру с самой низкой ценой. Если провайдер недоступен, система мгновенно переключается на следующего по цене, обеспечивая непрерывную работу вашего приложения без потери запросов.

  • Автоматический выбор
  • Отказоустойчивость
  • Лучшая цена
Чтение кеша
Повторное использование кэшированного контента снижает затраты благодаря применению пониженного тарифа на эти токены.
24 ₽ / 1M токенов

Цены по провайдерам

RouterAI работает с несколькими провайдерами для обеспечения максимальной доступности и оптимальных цен.

  • 1
    Z.AI

    24 ₽
    Чтение кеша

Умная маршрутизация запросов

Ваши запросы автоматически направляются к провайдеру с самой низкой ценой. Если провайдер недоступен, система мгновенно переключается на следующего по цене, обеспечивая непрерывную работу вашего приложения без потери запросов.

  • Автоматический выбор
  • Отказоустойчивость
  • Лучшая цена

Цены указаны в рублях и могут меняться в зависимости от курса валют

Описание модели

GLM-5V-Turbo — это первая нативная мультимодальная модель-основа агента от Z.ai, созданная для задач, основанных на зрении и управляемых агентами. Она нативно обрабатывает изображения, видео и текстовые данные, превосходно справляется с планированием на длительный срок, сложным кодированием и выполнением задач, и безупречно взаимодействует с агентами для завершения полного цикла «восприятие → планирование → выполнение».

API и примеры кода

Наш сервис предоставляет единый API, совместимый с OpenAI SDK. Просто укажите наш base_url и используйте ключ, полученный в личном кабинете.

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://routerai.ru/api/v1"
)

response = client.chat.completions.create(
    model="z-ai/glm-5v-turbo",
    messages=[
        {"role": "user", "content": "Hello, how are you?"}
    ]
)

print(response.choices[0].message.content)
import requests
import json

url = "https://routerai.ru/api/v1/chat/completions"
headers = {
    "Authorization": "Bearer YOUR_API_KEY",
    "Content-Type": "application/json"
}

data = {
    "model": "z-ai/glm-5v-turbo",
    "messages": [
        {"role": "user", "content": "Hello, how are you?"}
    ]
}

response = requests.post(url, headers=headers, json=data)
result = response.json()
print(json.dumps(result, indent=2))
curl -X POST "https://routerai.ru/api/v1/chat/completions" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "z-ai/glm-5v-turbo",
    "messages": [
      {"role": "user", "content": "Hello, how are you?"}
    ]
  }'

Эндпоинт

Отправляет сообщения модели и получает ответ. Поддерживает потоковый и непотоковый режимы. Документация

POST https://routerai.ru/api/v1/chat/completions
Authorization
Bearer YOUR_API_KEY
Content-Type
application/json
Model
z-ai/glm-5v-turbo

Параметры

Параметр
Тип
По умолчанию
Описание
max_tokens
integer
Верхний предел количества токенов, которые модель может сгенерировать в ответе.
temperature
float
1
Влияет на разнообразие ответов модели: чем выше, тем более случайным будет вывод.
top_p
float
1
Ограничивает выбор модели долей наиболее вероятных токенов: учитываются только токены, чьи вероятности в сумме дают P.
response_format
map
Заставляет модель выдавать ответ в определённом формате.
top_k
integer
Ограничивает выбор модели K наиболее вероятными токенами на каждом шаге.
tool_choice
map
Управляет тем, какую функцию (инструмент) вызовет модель, если они переданы.
tools
array
Список инструментов (функций), которые модель может вызвать.
reasoning
map
Настройки рассуждений модели (бюджет токенов, уровень усилий).
include_reasoning
boolean
Возвращать ли в ответе цепочку рассуждений модели.