Загрузка...

Qwen: Qwen3 Coder 480B A35B (exacto)

Идентификатор:
Скопировано в буфер обмена!
Чат

Характеристики

Контекстное окно 262K

Дата релиза 23 июля 2025

Мультимодальность

Входящие данные:

  • Текст

Исходящие данные:

  • Текст

Цены

Оплата производится по факту за использованные токены.

Тип
Стоимость
Входящие токены
Токены, полученные и обработанные моделью при анализе пользовательского запроса и контекста. Включают текст сообщения, предыдущую историю диалога и все передаваемые данные.
27 ₽ / 1M токенов
Подробнее

Цены по провайдерам

RouterAI работает с несколькими провайдерами для обеспечения максимальной доступности и оптимальных цен.

  • 1
    Venice

    32 ₽
    Входящие
  • 2
    Novita

    35 ₽
    Входящие
  • 3
    DeepInfra

    27 ₽
    Входящие
  • 4
    AtlasCloud

    72 ₽
    Входящие
  • 5
    WandB

    93 ₽
    Входящие
  • 6
    Google

    20 ₽
    Входящие
  • 7
    Together

    186 ₽
    Входящие
  • 8
    Alibaba

    90 ₽
    Входящие

Умная маршрутизация запросов

Ваши запросы автоматически направляются к провайдеру с самой низкой ценой. Если провайдер недоступен, система мгновенно переключается на следующего по цене, обеспечивая непрерывную работу вашего приложения без потери запросов.

  • Автоматический выбор
  • Отказоустойчивость
  • Лучшая цена
Исходящие токены
Токены, генерируемые моделью в виде ответа пользователю. Каждый символ, слово или часть ответа, созданные моделью, включаются в подсчёт выходных токенов.
93 ₽ / 1M токенов
Подробнее

Цены по провайдерам

RouterAI работает с несколькими провайдерами для обеспечения максимальной доступности и оптимальных цен.

  • 1
    Venice

    139 ₽
    Исходящие
  • 2
    Novita

    144 ₽
    Исходящие
  • 3
    DeepInfra

    93 ₽
    Исходящие
  • 4
    AtlasCloud

    353 ₽
    Исходящие
  • 5
    WandB

    139 ₽
    Исходящие
  • 6
    Google

    167 ₽
    Исходящие
  • 7
    Together

    186 ₽
    Исходящие
  • 8
    Alibaba

    453 ₽
    Исходящие

Умная маршрутизация запросов

Ваши запросы автоматически направляются к провайдеру с самой низкой ценой. Если провайдер недоступен, система мгновенно переключается на следующего по цене, обеспечивая непрерывную работу вашего приложения без потери запросов.

  • Автоматический выбор
  • Отказоустойчивость
  • Лучшая цена
Чтение кеша
Повторное использование кэшированного контента снижает затраты благодаря применению пониженного тарифа на эти токены.
9 ₽ / 1M токенов
Подробнее

Цены по провайдерам

RouterAI работает с несколькими провайдерами для обеспечения максимальной доступности и оптимальных цен.

  • 1
    Venice

    3 ₽
    Чтение кеша
  • 2
    Novita

    9 ₽
    Чтение кеша
  • 3
    DeepInfra

    9 ₽
    Чтение кеша
  • 4
    AtlasCloud

    18 ₽
    Чтение кеша
  • 5
    WandB

    93 ₽
    Чтение кеша
  • 6
    Google

    9 ₽
    Чтение кеша
  • 7
    Together

    9 ₽
    Чтение кеша
  • 8
    Alibaba

    9 ₽
    Чтение кеша

Умная маршрутизация запросов

Ваши запросы автоматически направляются к провайдеру с самой низкой ценой. Если провайдер недоступен, система мгновенно переключается на следующего по цене, обеспечивая непрерывную работу вашего приложения без потери запросов.

  • Автоматический выбор
  • Отказоустойчивость
  • Лучшая цена

Цены указаны в рублях и могут меняться в зависимости от курса валют

Описание модели

Qwen3-Coder-480B-A35B-Instruct — это модель генерации кода типа Mixture-of-Experts (MoE), разработанная командой Qwen. Она оптимизирована для агентных задач программирования, таких как вызов функций, использование инструментов и рассуждение в длинном контексте по репозиториям. Модель имеет 480 миллиардов общих параметров, из которых 35 миллиардов активны при каждом прямом проходе (8 из 160 экспертов).

Цены на конечные точки Alibaba зависят от длины контекста. Как только запрос превышает 128 тысяч входных токенов, применяется более высокая цена.

API и примеры кода

Наш сервис предоставляет единый API, совместимый с OpenAI SDK. Просто укажите наш base_url и используйте ключ, полученный в личном кабинете.

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://routerai.ru/api/v1"
)

response = client.chat.completions.create(
    model="qwen/qwen3-coder:exacto",
    messages=[
        {"role": "user", "content": "Hello, how are you?"}
    ]
)

print(response.choices[0].message.content)
import requests
import json

url = "https://routerai.ru/api/v1/chat/completions"
headers = {
    "Authorization": "Bearer YOUR_API_KEY",
    "Content-Type": "application/json"
}

data = {
    "model": "qwen/qwen3-coder:exacto",
    "messages": [
        {"role": "user", "content": "Hello, how are you?"}
    ]
}

response = requests.post(url, headers=headers, json=data)
result = response.json()
print(json.dumps(result, indent=2))
curl -X POST "https://routerai.ru/api/v1/chat/completions" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen/qwen3-coder:exacto",
    "messages": [
      {"role": "user", "content": "Hello, how are you?"}
    ]
  }'