Google: Gemini 2.5 Flash Lite

Name: Google Google: Gemini 2.5 Flash Lite API
Brand: RouterAI
Price: 0.01 RUB
Availability: InStock

Идентификатор:

Чат

Характеристики

Контекстное окно 1M

Дата релиза 22 июля 2025

Мультимодальность

Входящие данные:

Текст
Изображения
Файл
Аудио
Видео

Исходящие данные:

Текст

Цены

Оплата производится по факту за использованные токены.

Тип

Стоимость

Входящие токены

9 ₽ / 1M токенов

Подробнее

Цены по провайдерам

RouterAI работает с несколькими провайдерами для обеспечения максимальной доступности и оптимальных цен.

1

Google AI Studio

9 ₽

Входящие
2

Google AI Studio

9 ₽

Входящие
3

Google

9 ₽

Входящие

Умная маршрутизация запросов

Ваши запросы автоматически направляются к провайдеру с самой низкой ценой. Если провайдер недоступен, система мгновенно переключается на следующего по цене, обеспечивая непрерывную работу вашего приложения без потери запросов.

Автоматический выбор
Отказоустойчивость
Лучшая цена

Исходящие токены

39 ₽ / 1M токенов

Подробнее

Цены по провайдерам

RouterAI работает с несколькими провайдерами для обеспечения максимальной доступности и оптимальных цен.

1

Google AI Studio

39 ₽

Исходящие
2

Google AI Studio

39 ₽

Исходящие
3

Google

39 ₽

Исходящие

Умная маршрутизация запросов

Автоматический выбор
Отказоустойчивость
Лучшая цена

Чтение кеша

0,99 ₽ / 1M токенов

Подробнее

Цены по провайдерам

RouterAI работает с несколькими провайдерами для обеспечения максимальной доступности и оптимальных цен.

1

Google AI Studio

0,99 ₽

Чтение кеша
2

Google AI Studio

0,99 ₽

Чтение кеша
3

Google

0,99 ₽

Чтение кеша

Умная маршрутизация запросов

Автоматический выбор
Отказоустойчивость
Лучшая цена

Запись кеша

8 ₽ / 1M токенов

Входящие изображения

0,01 ₽ / 1K токенов

Входящие аудио

29 ₽ / 1M токенов

Размышления

39,48 ₽ / 1M токенов

Цены указаны в рублях и могут меняться в зависимости от курса валют

Описание модели

Gemini 2.5 Flash-Lite — это облегчённая модель рассуждений в семействе Gemini 2.5, оптимизированная для сверхнизкой задержки и экономической эффективности. Она обеспечивает улучшенную пропускную способность, более быстрое генерирование токенов и лучшую производительность по общим тестам по сравнению с более ранними моделями Flash. По умолчанию “мышление” (т.е. многократное рассуждение) отключено, чтобы приоритет отдавался скорости, но разработчики могут включить его через параметр Reasoning API, чтобы избирательно обменивать стоимость на интеллект.

API и примеры кода

Наш сервис предоставляет единый API, совместимый с OpenAI SDK. Просто укажите наш base_url и используйте ключ, полученный в личном кабинете.

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://routerai.ru/api/v1"
)

response = client.chat.completions.create(
    model="google/gemini-2.5-flash-lite",
    messages=[
        {"role": "user", "content": "Hello, how are you?"}
    ]
)

print(response.choices[0].message.content)

import requests
import json

url = "https://routerai.ru/api/v1/chat/completions"
headers = {
    "Authorization": "Bearer YOUR_API_KEY",
    "Content-Type": "application/json"
}

data = {
    "model": "google/gemini-2.5-flash-lite",
    "messages": [
        {"role": "user", "content": "Hello, how are you?"}
    ]
}

response = requests.post(url, headers=headers, json=data)
result = response.json()
print(json.dumps(result, indent=2))

curl -X POST "https://routerai.ru/api/v1/chat/completions" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "google/gemini-2.5-flash-lite",
    "messages": [
      {"role": "user", "content": "Hello, how are you?"}
    ]
  }'

Эндпоинты

Отправляет сообщения модели и получает ответ. Поддерживает потоковый и непотоковый режимы.

POST https://routerai.ru/api/v1/chat/completions

Документация

Authorization

Bearer YOUR_API_KEY

Content-Type

application/json

Model

google/gemini-2.5-flash-lite

Создаёт ответ в формате OpenAI Responses API. Поддерживает потоковый и непотоковый режимы.

POST https://routerai.ru/api/v1/responses

Документация

Authorization

Bearer YOUR_API_KEY

Content-Type

application/json

Model

google/gemini-2.5-flash-lite

Создаёт сообщение в формате Anthropic Messages API. Поддерживает текст, изображения, инструменты и размышления (thinking).

POST https://routerai.ru/api/v1/messages

Документация

Authorization

Bearer YOUR_API_KEY

Content-Type

application/json

Model

google/gemini-2.5-flash-lite

Параметры

Параметр

Тип

По умолчанию

Описание

max_tokens

integer

—

Верхний предел количества токенов, которые модель может сгенерировать в ответе.

temperature

float

Влияет на разнообразие ответов модели: чем выше, тем более случайным будет вывод.

top_p

float

Ограничивает выбор модели долей наиболее вероятных токенов: учитываются только токены, чьи вероятности в сумме дают P.

seed

integer

—

Если задан, инференс выполняется детерминированно — повторные запросы с тем же seed и параметрами должны давать одинаковый результат.

response_format

map

—

Заставляет модель выдавать ответ в определённом формате.

stop

array

—

Немедленно останавливает генерацию, если модель встречает любой из токенов, указанных в массиве stop.

structured_outputs

boolean

—

Поддержка ответа по строгой JSON-схеме.

tool_choice

map

—

Управляет тем, какую функцию (инструмент) вызовет модель, если они переданы.

tools

array

—

Список инструментов (функций), которые модель может вызвать.

reasoning

map

—

Настройки рассуждений модели (бюджет токенов, уровень усилий).

include_reasoning

boolean

—

Возвращать ли в ответе цепочку рассуждений модели.

Вернуться к списку моделей

Google: Gemini 2.5 Flash Lite

Характеристики

Мультимодальность

Входящие данные:

Исходящие данные:

Цены

Цены по провайдерам

Google AI Studio

Google AI Studio

Google

Умная маршрутизация запросов

Цены по провайдерам

Google AI Studio

Google AI Studio

Google

Умная маршрутизация запросов

Цены по провайдерам

Google AI Studio

Google AI Studio

Google

Умная маршрутизация запросов

Описание модели

API и примеры кода

Эндпоинты

Параметры