Аудио входные данные
Отправляйте аудиофайлы моделям с поддержкой речи через API RouterAI.
RouterAI поддерживает отправку аудиофайлов совместимым моделям через API. Это руководство покажет вам, как работать с аудио, используя наш API.
Примечание: Аудиофайлы должны быть закодированы в base64 - прямые URL не поддерживаются для аудиоконтента.
Аудио входные данные
Запросы с аудиофайлами к совместимым моделям доступны через API /api/v1/chat/completion с типом контента input_audio. Аудиофайлы должны быть закодированы в base64 и включать спецификацию формата. Обратите внимание, что только модели с возможностями обработки аудио будут обрабатывать эти запросы.
Вы можете найти модели с поддержкой аудио, отфильтровав по модальности аудио входа на нашей странице моделей.
Отправка аудиофайлов
Вот как отправить аудиофайл для обработки:
Кодирование аудиофайла в base64 (Linux)
Сначала закодируйте ваш аудиофайл в base64:
# Кодирование аудиофайла в base64 и сохранение в переменную
BASE64_AUDIO=$(base64 -w 0 path/to/your/audio.wav)
# Или сохранение в файл для последующего использования
base64 -w 0 path/to/your/audio.wav > audio_base64.txt
Пример запроса cURL
curl https://routerai.ru/api/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $ROUTERAI_API_KEY" \
-d '{
"model": "google/gemini-2.5-flash",
"messages": [
{
"role": "user",
"content": [
{
"type": "text",
"text": "Пожалуйста, расшифруйте этот аудиофайл."
},
{
"type": "input_audio",
"input_audio": {
"data": "'"$BASE64_AUDIO"'",
"format": "wav"
}
}
]
}
]
}'
Альтернативный способ с файлом base64
Если вы сохранили base64 в файл:
# Сначала создайте JSON с base64 данными
cat > request.json << 'EOF'
{
"model": "google/gemini-2.5-flash",
"messages": [
{
"role": "user",
"content": [
{
"type": "text",
"text": "Пожалуйста, расшифруйте этот аудиофайл."
},
{
"type": "input_audio",
"input_audio": {
"data": "BASE64_PLACEHOLDER",
"format": "wav"
}
}
]
}
]
}
EOF
# Замените плейсхолдер на реальные base64 данные
BASE64_AUDIO=$(base64 -w 0 path/to/your/audio.wav)
sed "s|BASE64_PLACEHOLDER|$BASE64_AUDIO|" request.json > request_final.json
# Отправьте запрос
curl https://routerai.ru/api/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $ROUTERAI_API_KEY" \
-d @request_final.json
Поддерживаемые форматы аудио
Поддерживаемые форматы аудио различаются в зависимости от провайдера. Распространенные форматы включают:
wav- WAV аудиоmp3- MP3 аудиоaiff- AIFF аудиоaac- AAC аудиоogg- OGG Vorbis аудиоflac- FLAC аудиоm4a- M4A аудиоpcm16- PCM16 аудиоpcm24- PCM24 аудио
Примечание: Проверьте документацию вашей модели, чтобы подтвердить, какие форматы аудио она поддерживает. Не все модели поддерживают все форматы.