Выбор провайдера
RouterAI маршрутизирует запросы к оптимальным провайдерам для вашей модели. По умолчанию выполняется балансировка нагрузки между топ-провайдерами для максимизации аптайма.
Стратегия балансировки
Для каждой модели RouterAI распределяет нагрузку между провайдерами, отдавая приоритет низкой цене
Когда вы отправляете запрос с параметрами `tools` или `tool_choice`, RouterAI будет маршрутизировать его только к тем провайдерам, которые поддерживают использование инструментов.
Аналогично, если вы установите `max_tokens`, RouterAI будет маршрутизировать запрос только к провайдерам, поддерживающим ответ такой длины.
Стандартный алгоритм балансировки нагрузки RouterAI работает следующим образом:
- Приоритет стабильности: В первую очередь выбираются провайдеры, у которых не наблюдалось значительных сбоев за последние 30 секунд.
- Выбор по цене: Среди стабильных провайдеров рассматриваются кандидаты с наименьшей стоимостью.
- Резервные варианты: Оставшиеся провайдеры используются в качестве запасных (fallbacks).
Выбор страны
Если вам критично, чтобы обработка данных происходила на территории России, передайте объект provider в теле запроса
curl -X POST "https://routerai.ru/api/v1/chat/completions" \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "openai/gpt-oss-120b",
"messages": [
{"role": "user", "content": "Hello, how are you?"}
],
"provider": {
"country": "ru"
}
}'