Характеристики
Контекстное окно 33K
Дата релиза 28 августа 2024
Мультимодальность
Входящие данные:
- Текст
- Изображения
Исходящие данные:
- Текст
Цены
Оплата производится по факту за использованные токены. Цены зависят от размера контекста в промпте.
Цены указаны в рублях и могут меняться в зависимости от курса валют
Описание модели
Qwen2.5 VL 7B — это мультимодальная LLM от команды Qwen с следующими ключевыми улучшениями:
-
Передовое понимание изображений различного разрешения и соотношения сторон: Qwen2.5-VL достигает передовых результатов в тестах на визуальное понимание, включая MathVista, DocVQA, RealWorldQA, MTVQA и другие.
-
Понимание видео длительностью более 20 минут: Qwen2.5-VL может понимать видео продолжительностью более 20 минут для высококачественного ответа на вопросы, основанные на видео, диалогов, создания контента и т.д.
-
Агент, который может управлять вашими мобильными устройствами, роботами и т.д.: благодаря способностям к сложным рассуждениям и принятию решений, Qwen2.5-VL может быть интегрирован с устройствами, такими как мобильные телефоны, роботы и т.д., для автоматической работы на основе визуальной среды и текстовых инструкций.
-
Поддержка нескольких языков: для обслуживания глобальных пользователей, помимо английского и китайского, Qwen2.5-VL теперь поддерживает понимание текстов на разных языках внутри изображений, включая большинство европейских языков, японский, корейский, арабский, вьетнамский и другие.
Для получения более подробной информации смотрите этот пост в блоге и репозиторий на GitHub.
Использование этой модели регулируется ЛИЦЕНЗИОННЫМ СОГЛАШЕНИЕМ Tongyi Qianwen.
API и примеры кода
Наш сервис предоставляет единый API, совместимый с OpenAI SDK. Просто укажите наш base_url и используйте ключ, полученный в личном кабинете.
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://routerai.ru/api/v1"
)
response = client.chat.completions.create(
model="qwen/qwen-2.5-vl-7b-instruct",
messages=[
{"role": "user", "content": "Hello, how are you?"}
]
)
print(response.choices[0].message.content)
import requests
import json
url = "https://routerai.ru/api/v1/chat/completions"
headers = {
"Authorization": "Bearer YOUR_API_KEY",
"Content-Type": "application/json"
}
data = {
"model": "qwen/qwen-2.5-vl-7b-instruct",
"messages": [
{"role": "user", "content": "Hello, how are you?"}
]
}
response = requests.post(url, headers=headers, json=data)
result = response.json()
print(json.dumps(result, indent=2))
curl -X POST "https://routerai.ru/api/v1/chat/completions" \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen/qwen-2.5-vl-7b-instruct",
"messages": [
{"role": "user", "content": "Hello, how are you?"}
]
}'