Загрузка...

Аудио входные данные

Отправляйте аудиофайлы моделям с поддержкой речи через API RouterAI.

RouterAI поддерживает отправку аудиофайлов совместимым моделям через API. Это руководство покажет вам, как работать с аудио, используя наш API.

Примечание: Аудиофайлы должны быть закодированы в base64 - прямые URL не поддерживаются для аудиоконтента.

Аудио входные данные

Запросы с аудиофайлами к совместимым моделям доступны через API /api/v1/chat/completion с типом контента input_audio. Аудиофайлы должны быть закодированы в base64 и включать спецификацию формата. Обратите внимание, что только модели с возможностями обработки аудио будут обрабатывать эти запросы.

Вы можете найти модели с поддержкой аудио, отфильтровав по модальности аудио входа на нашей странице моделей.

Отправка аудиофайлов

Вот как отправить аудиофайл для обработки:

Кодирование аудиофайла в base64 (Linux)

Сначала закодируйте ваш аудиофайл в base64:

# Кодирование аудиофайла в base64 и сохранение в переменную
BASE64_AUDIO=$(base64 -w 0 path/to/your/audio.wav)

# Или сохранение в файл для последующего использования
base64 -w 0 path/to/your/audio.wav > audio_base64.txt

Пример запроса cURL

curl https://routerai.ru/api/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $ROUTERAI_API_KEY" \
  -d '{
    "model": "google/gemini-2.5-flash",
    "messages": [
      {
        "role": "user",
        "content": [
          {
            "type": "text",
            "text": "Пожалуйста, расшифруйте этот аудиофайл."
          },
          {
            "type": "input_audio",
            "input_audio": {
              "data": "'"$BASE64_AUDIO"'",
              "format": "wav"
            }
          }
        ]
      }
    ]
  }'

Альтернативный способ с файлом base64

Если вы сохранили base64 в файл:

# Сначала создайте JSON с base64 данными
cat > request.json << 'EOF'
{
  "model": "google/gemini-2.5-flash",
  "messages": [
    {
      "role": "user",
      "content": [
        {
          "type": "text",
          "text": "Пожалуйста, расшифруйте этот аудиофайл."
        },
        {
          "type": "input_audio",
          "input_audio": {
            "data": "BASE64_PLACEHOLDER",
            "format": "wav"
          }
        }
      ]
    }
  ]
}
EOF

# Замените плейсхолдер на реальные base64 данные
BASE64_AUDIO=$(base64 -w 0 path/to/your/audio.wav)
sed "s|BASE64_PLACEHOLDER|$BASE64_AUDIO|" request.json > request_final.json

# Отправьте запрос
curl https://routerai.ru/api/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $ROUTERAI_API_KEY" \
  -d @request_final.json

Поддерживаемые форматы аудио

Поддерживаемые форматы аудио различаются в зависимости от провайдера. Распространенные форматы включают:

  • wav - WAV аудио
  • mp3 - MP3 аудио
  • aiff - AIFF аудио
  • aac - AAC аудио
  • ogg - OGG Vorbis аудио
  • flac - FLAC аудио
  • m4a - M4A аудио
  • pcm16 - PCM16 аудио
  • pcm24 - PCM24 аудио

Примечание: Проверьте документацию вашей модели, чтобы подтвердить, какие форматы аудио она поддерживает. Не все модели поддерживают все форматы.