Характеристики
Контекстное окно 262K
Дата релиза 23 июля 2025
Мультимодальность
Входящие данные:
- Текст
Исходящие данные:
- Текст
Цены
Оплата производится по факту за использованные токены.
Цены по провайдерам
RouterAI работает с несколькими провайдерами для обеспечения максимальной доступности и оптимальных цен.
-
1
Venice
35 ₽Входящие -
2
SiliconFlow
25 ₽Входящие -
3
Novita
30 ₽Входящие -
4
DeepInfra
40 ₽Входящие -
5
AtlasCloud
78 ₽Входящие -
6
WandB
101 ₽Входящие -
7
Google
22 ₽Входящие -
8
Together
202 ₽Входящие -
9
Alibaba
98 ₽Входящие
Умная маршрутизация запросов
Ваши запросы автоматически направляются к провайдеру с самой низкой ценой. Если провайдер недоступен, система мгновенно переключается на следующего по цене, обеспечивая непрерывную работу вашего приложения без потери запросов.
- Автоматический выбор
- Отказоустойчивость
- Лучшая цена
Цены по провайдерам
RouterAI работает с несколькими провайдерами для обеспечения максимальной доступности и оптимальных цен.
-
1
Venice
151 ₽Исходящие -
2
SiliconFlow
101 ₽Исходящие -
3
Novita
131 ₽Исходящие -
4
DeepInfra
161 ₽Исходящие -
5
AtlasCloud
384 ₽Исходящие -
6
WandB
151 ₽Исходящие -
7
Google
182 ₽Исходящие -
8
Together
202 ₽Исходящие -
9
Alibaba
493 ₽Исходящие
Умная маршрутизация запросов
Ваши запросы автоматически направляются к провайдеру с самой низкой ценой. Если провайдер недоступен, система мгновенно переключается на следующего по цене, обеспечивая непрерывную работу вашего приложения без потери запросов.
- Автоматический выбор
- Отказоустойчивость
- Лучшая цена
Цены указаны в рублях и могут меняться в зависимости от курса валют
Описание модели
Qwen3-Coder-480B-A35B-Instruct — это модель генерации кода типа Mixture-of-Experts (MoE), разработанная командой Qwen. Она оптимизирована для агентных задач программирования, таких как вызов функций, использование инструментов и рассуждение в длинном контексте по репозиториям. Модель имеет 480 миллиардов общих параметров, из которых 35 миллиардов активны при каждом прямом проходе (8 из 160 экспертов).
Цены на конечные точки Alibaba зависят от длины контекста. Как только запрос превышает 128 тысяч входных токенов, применяется более высокая цена.
API и примеры кода
Наш сервис предоставляет единый API, совместимый с OpenAI SDK. Просто укажите наш base_url и используйте ключ, полученный в личном кабинете.
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://routerai.ru/api/v1"
)
response = client.chat.completions.create(
model="qwen/qwen3-coder:exacto",
messages=[
{"role": "user", "content": "Hello, how are you?"}
]
)
print(response.choices[0].message.content)
import requests
import json
url = "https://routerai.ru/api/v1/chat/completions"
headers = {
"Authorization": "Bearer YOUR_API_KEY",
"Content-Type": "application/json"
}
data = {
"model": "qwen/qwen3-coder:exacto",
"messages": [
{"role": "user", "content": "Hello, how are you?"}
]
}
response = requests.post(url, headers=headers, json=data)
result = response.json()
print(json.dumps(result, indent=2))
curl -X POST "https://routerai.ru/api/v1/chat/completions" \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen/qwen3-coder:exacto",
"messages": [
{"role": "user", "content": "Hello, how are you?"}
]
}'