Характеристики
Контекстное окно 262K
Дата релиза 23 июля 2025
Мультимодальность
Входящие данные:
- Текст
Исходящие данные:
- Текст
Цены
Оплата производится по факту за использованные токены.
Цены по провайдерам
RouterAI работает с несколькими провайдерами для обеспечения максимальной доступности и оптимальных цен.
-
1
DeepInfra
40 ₽Входящие -
2
Alibaba
151 ₽Входящие -
3
Chutes
22 ₽Входящие -
4
SiliconFlow
25 ₽Входящие -
5
Novita
30 ₽Входящие -
6
BaseTen
38 ₽Входящие -
7
AtlasCloud
69 ₽Входящие -
8
Nebius
40 ₽Входящие -
9
Fireworks
45 ₽Входящие -
10
WandB
101 ₽Входящие -
11
Google
22 ₽Входящие -
12
Hyperbolic
202 ₽Входящие -
13
Together
202 ₽Входящие
Умная маршрутизация запросов
Ваши запросы автоматически направляются к провайдеру с самой низкой ценой. Если провайдер недоступен, система мгновенно переключается на следующего по цене, обеспечивая непрерывную работу вашего приложения без потери запросов.
- Автоматический выбор
- Отказоустойчивость
- Лучшая цена
Цены по провайдерам
RouterAI работает с несколькими провайдерами для обеспечения максимальной доступности и оптимальных цен.
-
1
DeepInfra
161 ₽Исходящие -
2
Alibaba
758 ₽Исходящие -
3
Chutes
96 ₽Исходящие -
4
SiliconFlow
101 ₽Исходящие -
5
Novita
131 ₽Исходящие -
6
BaseTen
154 ₽Исходящие -
7
AtlasCloud
272 ₽Исходящие -
8
Nebius
181 ₽Исходящие -
9
Fireworks
181 ₽Исходящие -
10
WandB
151 ₽Исходящие -
11
Google
181 ₽Исходящие -
12
Hyperbolic
202 ₽Исходящие -
13
Together
202 ₽Исходящие
Умная маршрутизация запросов
Ваши запросы автоматически направляются к провайдеру с самой низкой ценой. Если провайдер недоступен, система мгновенно переключается на следующего по цене, обеспечивая непрерывную работу вашего приложения без потери запросов.
- Автоматический выбор
- Отказоустойчивость
- Лучшая цена
Цены указаны в рублях и могут меняться в зависимости от курса валют
Описание модели
Qwen3-Coder-480B-A35B-Instruct — это модель генерации кода типа Mixture-of-Experts (MoE), разработанная командой Qwen. Она оптимизирована для агентных задач программирования, таких как вызов функций, использование инструментов и рассуждение в длинном контексте по репозиториям. Модель имеет 480 миллиардов общих параметров, из которых 35 миллиардов активны при каждом прямом проходе (8 из 160 экспертов).
Цены на конечные точки Alibaba зависят от длины контекста. Как только запрос превышает 128 тысяч входных токенов, применяется более высокая цена.
API и примеры кода
Наш сервис предоставляет единый API, совместимый с OpenAI SDK. Просто укажите наш base_url и используйте ключ, полученный в личном кабинете.
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://routerai.ru/api/v1"
)
response = client.chat.completions.create(
model="qwen/qwen3-coder:exacto",
messages=[
{"role": "user", "content": "Hello, how are you?"}
]
)
print(response.choices[0].message.content)
import requests
import json
url = "https://routerai.ru/api/v1/chat/completions"
headers = {
"Authorization": "Bearer YOUR_API_KEY",
"Content-Type": "application/json"
}
data = {
"model": "qwen/qwen3-coder:exacto",
"messages": [
{"role": "user", "content": "Hello, how are you?"}
]
}
response = requests.post(url, headers=headers, json=data)
result = response.json()
print(json.dumps(result, indent=2))
curl -X POST "https://routerai.ru/api/v1/chat/completions" \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen/qwen3-coder:exacto",
"messages": [
{"role": "user", "content": "Hello, how are you?"}
]
}'