Характеристики
Контекстное окно 262K
Дата релиза 23 июля 2025
Мультимодальность
Входящие данные:
- Текст
Исходящие данные:
- Текст
Цены
Оплата производится по факту за использованные токены.
Цены по провайдерам
RouterAI работает с несколькими провайдерами для обеспечения максимальной доступности и оптимальных цен.
-
1
Venice
34 ₽Входящие -
2
Alibaba
95 ₽Входящие -
3
SiliconFlow
24 ₽Входящие -
4
Novita
29 ₽Входящие -
5
Together
195 ₽Входящие -
6
AtlasCloud
76 ₽Входящие -
7
WandB
97 ₽Входящие -
8
Google
21 ₽Входящие -
9
DeepInfra
39 ₽Входящие
Умная маршрутизация запросов
Ваши запросы автоматически направляются к провайдеру с самой низкой ценой. Если провайдер недоступен, система мгновенно переключается на следующего по цене, обеспечивая непрерывную работу вашего приложения без потери запросов.
- Автоматический выбор
- Отказоустойчивость
- Лучшая цена
Цены по провайдерам
RouterAI работает с несколькими провайдерами для обеспечения максимальной доступности и оптимальных цен.
-
1
Venice
146 ₽Исходящие -
2
Alibaba
476 ₽Исходящие -
3
SiliconFlow
97 ₽Исходящие -
4
Novita
127 ₽Исходящие -
5
Together
195 ₽Исходящие -
6
AtlasCloud
371 ₽Исходящие -
7
WandB
146 ₽Исходящие -
8
Google
176 ₽Исходящие -
9
DeepInfra
156 ₽Исходящие
Умная маршрутизация запросов
Ваши запросы автоматически направляются к провайдеру с самой низкой ценой. Если провайдер недоступен, система мгновенно переключается на следующего по цене, обеспечивая непрерывную работу вашего приложения без потери запросов.
- Автоматический выбор
- Отказоустойчивость
- Лучшая цена
Цены указаны в рублях и могут меняться в зависимости от курса валют
Описание модели
Qwen3-Coder-480B-A35B-Instruct — это модель генерации кода типа Mixture-of-Experts (MoE), разработанная командой Qwen. Она оптимизирована для агентных задач программирования, таких как вызов функций, использование инструментов и рассуждение в длинных контекстах по репозиториям. Модель включает 480 миллиардов параметров, из которых 35 миллиардов активны на каждый прямой проход (8 из 160 экспертов).
Цены на конечные точки Alibaba зависят от длины контекста. Когда запрос превышает 128 тысяч входных токенов, применяется более высокая цена.
API и примеры кода
Наш сервис предоставляет единый API, совместимый с OpenAI SDK. Просто укажите наш base_url и используйте ключ, полученный в личном кабинете.
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://routerai.ru/api/v1"
)
response = client.chat.completions.create(
model="qwen/qwen3-coder",
messages=[
{"role": "user", "content": "Hello, how are you?"}
]
)
print(response.choices[0].message.content)
import requests
import json
url = "https://routerai.ru/api/v1/chat/completions"
headers = {
"Authorization": "Bearer YOUR_API_KEY",
"Content-Type": "application/json"
}
data = {
"model": "qwen/qwen3-coder",
"messages": [
{"role": "user", "content": "Hello, how are you?"}
]
}
response = requests.post(url, headers=headers, json=data)
result = response.json()
print(json.dumps(result, indent=2))
curl -X POST "https://routerai.ru/api/v1/chat/completions" \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen/qwen3-coder",
"messages": [
{"role": "user", "content": "Hello, how are you?"}
]
}'