Характеристики
Контекстное окно 262K
Дата релиза 23 июля 2025
Мультимодальность
Входящие данные:
- Текст
Исходящие данные:
- Текст
Цены
Оплата производится по факту за использованные токены.
Цены по провайдерам
RouterAI работает с несколькими провайдерами для обеспечения максимальной доступности и оптимальных цен.
-
1
Chutes
22 ₽Входящие -
2
SiliconFlow
25 ₽Входящие -
3
Novita
30 ₽Входящие -
4
BaseTen
38 ₽Входящие -
5
AtlasCloud
69 ₽Входящие -
6
Nebius
40 ₽Входящие -
7
Fireworks
45 ₽Входящие -
8
WandB
101 ₽Входящие -
9
Google
22 ₽Входящие -
10
Together
202 ₽Входящие -
11
Hyperbolic
202 ₽Входящие -
12
DeepInfra
40 ₽Входящие -
13
Alibaba
151 ₽Входящие
Умная маршрутизация запросов
Ваши запросы автоматически направляются к провайдеру с самой низкой ценой. Если провайдер недоступен, система мгновенно переключается на следующего по цене, обеспечивая непрерывную работу вашего приложения без потери запросов.
- Автоматический выбор
- Отказоустойчивость
- Лучшая цена
Цены по провайдерам
RouterAI работает с несколькими провайдерами для обеспечения максимальной доступности и оптимальных цен.
-
1
Chutes
96 ₽Исходящие -
2
SiliconFlow
101 ₽Исходящие -
3
Novita
131 ₽Исходящие -
4
BaseTen
154 ₽Исходящие -
5
AtlasCloud
272 ₽Исходящие -
6
Nebius
181 ₽Исходящие -
7
Fireworks
181 ₽Исходящие -
8
WandB
151 ₽Исходящие -
9
Google
181 ₽Исходящие -
10
Together
202 ₽Исходящие -
11
Hyperbolic
202 ₽Исходящие -
12
DeepInfra
161 ₽Исходящие -
13
Alibaba
758 ₽Исходящие
Умная маршрутизация запросов
Ваши запросы автоматически направляются к провайдеру с самой низкой ценой. Если провайдер недоступен, система мгновенно переключается на следующего по цене, обеспечивая непрерывную работу вашего приложения без потери запросов.
- Автоматический выбор
- Отказоустойчивость
- Лучшая цена
Цены указаны в рублях и могут меняться в зависимости от курса валют
Описание модели
Qwen3-Coder-480B-A35B-Instruct — это модель генерации кода типа Mixture-of-Experts (MoE), разработанная командой Qwen. Она оптимизирована для агентных задач программирования, таких как вызов функций, использование инструментов и рассуждение в длинных контекстах по репозиториям. Модель включает 480 миллиардов параметров, из которых 35 миллиардов активны на каждый прямой проход (8 из 160 экспертов).
Цены на конечные точки Alibaba зависят от длины контекста. Когда запрос превышает 128 тысяч входных токенов, применяется более высокая цена.
API и примеры кода
Наш сервис предоставляет единый API, совместимый с OpenAI SDK. Просто укажите наш base_url и используйте ключ, полученный в личном кабинете.
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://routerai.ru/api/v1"
)
response = client.chat.completions.create(
model="qwen/qwen3-coder",
messages=[
{"role": "user", "content": "Hello, how are you?"}
]
)
print(response.choices[0].message.content)
import requests
import json
url = "https://routerai.ru/api/v1/chat/completions"
headers = {
"Authorization": "Bearer YOUR_API_KEY",
"Content-Type": "application/json"
}
data = {
"model": "qwen/qwen3-coder",
"messages": [
{"role": "user", "content": "Hello, how are you?"}
]
}
response = requests.post(url, headers=headers, json=data)
result = response.json()
print(json.dumps(result, indent=2))
curl -X POST "https://routerai.ru/api/v1/chat/completions" \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen/qwen3-coder",
"messages": [
{"role": "user", "content": "Hello, how are you?"}
]
}'