Z.ai: GLM 4.6 (exacto)

Name: Z AI Z.ai: GLM 4.6 (exacto) API
Brand: RouterAI
Price: 0.01 RUB
Availability: InStock

Идентификатор:

Чат

Характеристики

Контекстное окно 205K

Дата релиза 30 сентября 2025

Мультимодальность

Входящие данные:

Текст

Исходящие данные:

Текст

Цены

Оплата производится по факту за использованные токены.

Тип

Стоимость

Входящие токены

42 ₽ / 1M токенов

Подробнее

Цены по провайдерам

RouterAI работает с несколькими провайдерами для обеспечения максимальной доступности и оптимальных цен.

1

Venice

42 ₽

Входящие
2

AtlasCloud

59 ₽

Входящие
3

Novita

54 ₽

Входящие
4

Z.AI

59 ₽

Входящие
5

DeepInfra

42 ₽

Входящие

Умная маршрутизация запросов

Ваши запросы автоматически направляются к провайдеру с самой низкой ценой. Если провайдер недоступен, система мгновенно переключается на следующего по цене, обеспечивая непрерывную работу вашего приложения без потери запросов.

Автоматический выбор
Отказоустойчивость
Лучшая цена

Исходящие токены

171 ₽ / 1M токенов

Подробнее

Цены по провайдерам

RouterAI работает с несколькими провайдерами для обеспечения максимальной доступности и оптимальных цен.

1

Venice

172 ₽

Исходящие
2

AtlasCloud

217 ₽

Исходящие
3

Novita

217 ₽

Исходящие
4

Z.AI

217 ₽

Исходящие
5

DeepInfra

171 ₽

Исходящие

Умная маршрутизация запросов

Автоматический выбор
Отказоустойчивость
Лучшая цена

Чтение кеша

7 ₽ / 1M токенов

Подробнее

Цены по провайдерам

RouterAI работает с несколькими провайдерами для обеспечения максимальной доступности и оптимальных цен.

1

Venice

7 ₽

Чтение кеша
2

AtlasCloud

10 ₽

Чтение кеша
3

Novita

10 ₽

Чтение кеша
4

Z.AI

10 ₽

Чтение кеша
5

DeepInfra

7 ₽

Чтение кеша

Умная маршрутизация запросов

Автоматический выбор
Отказоустойчивость
Лучшая цена

Цены указаны в рублях и могут меняться в зависимости от курса валют

Описание модели

По сравнению с GLM-4.5, это поколение вносит несколько ключевых улучшений:

Увеличенное окно контекста: Окно контекста расширено с 128K до 200K токенов, что позволяет модели справляться с более сложными агентными задачами.
Улучшенная производительность в кодировании: Модель достигает более высоких результатов в тестах на код и демонстрирует лучшую производительность в реальных приложениях, таких как Claude Code, Cline, Roo Code и Kilo Code, включая улучшения в создании визуально отточенных фронт-энд страниц.
Продвинутое рассуждение: GLM-4.6 показывает явное улучшение в производительности рассуждений и поддерживает использование инструментов во время вывода, что приводит к более сильным общим возможностям.
Более способные агенты: GLM-4.6 демонстрирует более высокую производительность в использовании инструментов и поисковых агентов, и более эффективно интегрируется в агентные фреймворки.
Усовершенствованное написание: Лучше соответствует человеческим предпочтениям в стиле и читаемости, и действует более естественно в сценариях ролевых игр.

API и примеры кода

Наш сервис предоставляет единый API, совместимый с OpenAI SDK. Просто укажите наш base_url и используйте ключ, полученный в личном кабинете.

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://routerai.ru/api/v1"
)

response = client.chat.completions.create(
    model="z-ai/glm-4.6:exacto",
    messages=[
        {"role": "user", "content": "Hello, how are you?"}
    ]
)

print(response.choices[0].message.content)

import requests
import json

url = "https://routerai.ru/api/v1/chat/completions"
headers = {
    "Authorization": "Bearer YOUR_API_KEY",
    "Content-Type": "application/json"
}

data = {
    "model": "z-ai/glm-4.6:exacto",
    "messages": [
        {"role": "user", "content": "Hello, how are you?"}
    ]
}

response = requests.post(url, headers=headers, json=data)
result = response.json()
print(json.dumps(result, indent=2))

curl -X POST "https://routerai.ru/api/v1/chat/completions" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "z-ai/glm-4.6:exacto",
    "messages": [
      {"role": "user", "content": "Hello, how are you?"}
    ]
  }'

Эндпоинты

Отправляет сообщения модели и получает ответ. Поддерживает потоковый и непотоковый режимы.

POST https://routerai.ru/api/v1/chat/completions

Документация

Authorization

Bearer YOUR_API_KEY

Content-Type

application/json

Model

z-ai/glm-4.6:exacto

Создаёт ответ в формате OpenAI Responses API. Поддерживает потоковый и непотоковый режимы.

POST https://routerai.ru/api/v1/responses

Документация

Authorization

Bearer YOUR_API_KEY

Content-Type

application/json

Model

z-ai/glm-4.6:exacto

Создаёт сообщение в формате Anthropic Messages API. Поддерживает текст, изображения, инструменты и размышления (thinking).

POST https://routerai.ru/api/v1/messages

Документация

Authorization

Bearer YOUR_API_KEY

Content-Type

application/json

Model

z-ai/glm-4.6:exacto

Параметры

Параметр

Тип

По умолчанию

Описание

max_tokens

integer

—

Верхний предел количества токенов, которые модель может сгенерировать в ответе.

temperature

float

Влияет на разнообразие ответов модели: чем выше, тем более случайным будет вывод.

top_p

float

Ограничивает выбор модели долей наиболее вероятных токенов: учитываются только токены, чьи вероятности в сумме дают P.

seed

integer

—

Если задан, инференс выполняется детерминированно — повторные запросы с тем же seed и параметрами должны давать одинаковый результат.

response_format

map

—

Заставляет модель выдавать ответ в определённом формате.

stop

array

—

Немедленно останавливает генерацию, если модель встречает любой из токенов, указанных в массиве stop.

frequency_penalty

float

Управляет повторением токенов в зависимости от того, как часто они встречаются во входных данных.

presence_penalty

float

Регулирует, насколько часто модель повторяет токены, уже встречавшиеся во входных данных.

repetition_penalty

float

—

Снижает вероятность повторения токенов из входных данных, пропорционально тому, как часто они встречаются.

top_k

integer

—

Ограничивает выбор модели K наиболее вероятными токенами на каждом шаге.

structured_outputs

boolean

—

Поддержка ответа по строгой JSON-схеме.

tool_choice

map

—

Управляет тем, какую функцию (инструмент) вызовет модель, если они переданы.

tools

array

—

Список инструментов (функций), которые модель может вызвать.

reasoning

map

—

Настройки рассуждений модели (бюджет токенов, уровень усилий).

include_reasoning

boolean

—

Возвращать ли в ответе цепочку рассуждений модели.

Вернуться к списку моделей

Z.ai: GLM 4.6 (exacto)

Характеристики

Мультимодальность

Входящие данные:

Исходящие данные:

Цены

Цены по провайдерам

Venice

AtlasCloud

Novita

Z.AI

DeepInfra

Умная маршрутизация запросов

Цены по провайдерам

Venice

AtlasCloud

Novita

Z.AI

DeepInfra

Умная маршрутизация запросов

Цены по провайдерам

Venice

AtlasCloud

Novita

Z.AI

DeepInfra

Умная маршрутизация запросов

Описание модели

API и примеры кода

Эндпоинты

Параметры