Каталог AI моделей и нейросетей: сравнение и цены

Каталог нейросетей с описанием возможностей и ценами в рублях. Сравните стоимость токенов и выберите лучшее решение.

OpenAI

400K

17 марта 2026

GPT-5.4 nano является самой легкой и экономичной версией в семействе GPT-5.4, оптимизированной для задач, критичных к скорости и большому объему. Она поддерживает текстовые и графические вводы и предназначена для использования в случаях с низкой задержкой, таких как классификация, извлечение данных, ранжирование и выполнение подагентов.

Модель отдает приоритет отзывчивости и эффективности, а не глубокому анализу, что делает ее идеальной для конвейеров, требующих быстрых и надежных результатов в большом масштабе. GPT-5.4 nano хорошо подходит для фоновых задач, систем реального времени и распределенных архитектур агентов, где минимизация затрат и задержек имеет решающее значение.

Входные данные:

20 ₽ / 1M

Файл

Изображения

Текст

Исходящие данные:

126 ₽ / 1M

Текст

400K

Контекст

17 марта 2026

Входящие токены за 1M:

20 ₽

Исходящие токены за 1M:

126 ₽

Чат Детали

OpenAI GPT-5.4 Mini

OpenAI

400K

17 марта 2026

GPT-5.4 mini приносит основные возможности GPT-5.4 в более быструю и эффективную модель, оптимизированную для высокопроизводительных рабочих нагрузок. Она поддерживает текстовые и графические вводы, демонстрируя высокую производительность в области рассуждений, кодирования и использования инструментов, при этом снижая задержку и затраты для крупномасштабных развертываний.

Модель разработана для производственных сред, где требуется баланс между возможностями и эффективностью, что делает её хорошо подходящей для чат-приложений, помощников по кодированию и агентских рабочих процессов, работающих в большом масштабе. GPT-5.4 mini обеспечивает надежное следование инструкциям, уверенное многократное рассуждение и стабильную производительность в различных задачах с улучшенной экономической эффективностью.

Входные данные:

76 ₽ / 1M

Файл

Изображения

Текст

Исходящие данные:

456 ₽ / 1M

Текст

400K

Контекст

17 марта 2026

Входящие токены за 1M:

76 ₽

Исходящие токены за 1M:

456 ₽

Чат Детали

Mistral Mistral Small 4

Mistral AI

262K

16 марта 2026

Mistral Small 4 — это следующий крупный выпуск в семействе Mistral Small, объединяющий возможности нескольких флагманских моделей Mistral в единую систему. Он сочетает в себе мощное логическое мышление от Magistral, мультимодальное понимание от Pixtral и агентные возможности кодирования от Devstral, позволяя одной модели справляться со сложным анализом, разработкой программного обеспечения и визуальными задачами в рамках одного рабочего процесса.

Входные данные:

15 ₽ / 1M

Текст

Изображения

Исходящие данные:

60 ₽ / 1M

Текст

262K

Контекст

16 марта 2026

Входящие токены за 1M:

15 ₽

Исходящие токены за 1M:

60 ₽

Чат Детали

Perplexity Embed V1 4B

Perplexity

32K

16 марта 2026

pplx-embed-v1 -4B — это одна из передовых моделей текстового встраивания Perplexity, созданная для работы с данными в реальном мире и в масштабах сети. pplx-embed-v1 оптимизирована для стандартного плотного поиска текста, а модель с 4 миллиардами параметров максимизирует качество поиска.

Входные данные:

3,04 ₽ / 1M

Текст

Исходящие данные:

0 ₽ / 1M

Embeddings

32K

Контекст

16 марта 2026

Входящие токены за 1M:

3,04 ₽

Исходящие токены за 1M:

0 ₽

Чат Детали

Perplexity Embed V1 4B

Perplexity

32K

16 марта 2026

pplx-embed-v1 -4B является одной из передовых моделей текстового встраивания от Perplexity, созданной для извлечения информации в реальном мире и в масштабах интернета. pplx-embed-v1 оптимизирована для стандартного плотного извлечения текста, а модель с параметром 4B максимизирует качество извлечения.

Входные данные:

3,04 ₽ / 1M

Текст

Исходящие данные:

0 ₽ / 1M

Embeddings

32K

Контекст

16 марта 2026

Входящие токены за 1M:

3,04 ₽

Исходящие токены за 1M:

0 ₽

Чат Детали

Perplexity Embed V1 0.6B

Perplexity

32K

16 марта 2026

pplx-embed-v1-0.6B is one of Perplexity’s state-of-the-art text embedding models built for real-world, web-scale retrieval. pplx-embed-v1 is optimized for standard dense text retrieval with the 0.6B parameter model targeting lightweight, low-latency embedding generation.

Входные данные:

0,41 ₽ / 1M

Текст

Исходящие данные:

0 ₽ / 1M

Embeddings

32K

Контекст

16 марта 2026

Входящие токены за 1M:

0,41 ₽

Исходящие токены за 1M:

0 ₽

Чат Детали

Perplexity Embed V1 0.6B

Perplexity

32K

16 марта 2026

pplx-embed-v1-0.6B является одной из передовых моделей текстового встраивания от Perplexity, созданной для реального использования в веб-масштабном поиске. pplx-embed-v1 оптимизирована для стандартного плотного текстового поиска с моделью на 0.6B параметров, ориентированной на легковесное и низкозатратное по времени создание встраиваний.

Входные данные:

0,41 ₽ / 1M

Текст

Исходящие данные:

0 ₽ / 1M

Embeddings

32K

Контекст

16 марта 2026

Входящие токены за 1M:

0,41 ₽

Исходящие токены за 1M:

0 ₽

Чат Детали

Z.ai GLM 5 Turbo

Z AI

262K

15 марта 2026

GLM-5 Turbo — это новая модель от Z.ai, разработанная для быстрой инференции и высокой производительности в средах, управляемых агентами, таких как сценарии OpenClaw. Она глубоко оптимизирована для рабочих процессов агентов в реальном мире, которые включают длинные цепочки выполнения, с улучшенной декомпозицией сложных инструкций, использованием инструментов, запланированным и постоянным выполнением, а также общей стабильностью при выполнении длительных задач.

Входные данные:

121 ₽ / 1M

Текст

Исходящие данные:

405 ₽ / 1M

Текст

262K

Контекст

15 марта 2026

Входящие токены за 1M:

121 ₽

Исходящие токены за 1M:

405 ₽

Чат Детали

NVIDIA Nemotron 3 Super

NVIDIA

11 марта 2026

NVIDIA Nemotron 3 Super — это открытая гибридная модель MoE с 120 миллиардами параметров, активирующая всего 12 миллиардов параметров для максимальной вычислительной эффективности и точности в сложных многоагентных приложениях. Построенная на гибридной архитектуре Mamba-Transformer Mixture-of-Experts с многотокеновым предсказанием (MTP), она обеспечивает более чем на 50% более высокую генерацию токенов по сравнению с ведущими открытыми моделями.

Модель обладает контекстным окном на 1 миллион токенов для долгосрочной согласованности агентов, междокументального рассуждения и многократного планирования задач. Латентный MoE позволяет вызывать 4 эксперта по стоимости вывода всего одного, улучшая интеллект и обобщение. Обучение с подкреплением в нескольких средах, охватывающее более 10 сред, обеспечивает ведущую точность на бенчмарках, включая AIME 2025, TerminalBench и SWE-Bench Verified.

Полностью открытая с весами, наборами данных и рецептами под лицензией NVIDIA Open License, Nemotron 3 Super позволяет легко настраивать и безопасно развертывать её в любом месте — от рабочей станции до облака.

Входные данные:

8 ₽ / 1M

Текст

Исходящие данные:

40 ₽ / 1M

Текст

Контекст

11 марта 2026

Входящие токены за 1M:

8 ₽

Исходящие токены за 1M:

40 ₽

Чат Детали

ByteDance Seed Seed-2.0-Lite

Bytedance-seed

262K

10 марта 2026

Seed-2.0-Lite — это сбалансированная модель, разработанная для высокочастотных корпоративных рабочих нагрузок, оптимизируя как возможности, так и затраты. Ее общая производительность превосходит предыдущую версию Seed-1.8. Она хорошо подходит для производственных задач, таких как обработка неструктурированной информации, создание текстового контента, поиск и рекомендации, а также анализ данных. Модель поддерживает обработку с длинным контекстом, слияние информации из нескольких источников, выполнение многошаговых инструкций и создание высокоточных структурированных выходных данных, обеспечивая стабильное качество при значительном снижении затрат.

Входные данные:

25 ₽ / 1M

Текст

Изображения

Видео

Исходящие данные:

202 ₽ / 1M

Текст

262K

Контекст

10 марта 2026

Входящие токены за 1M:

25 ₽

Исходящие токены за 1M:

202 ₽

Чат Детали

Qwen Qwen3.5-9B

Qwen

262K

10 марта 2026

Qwen3.5-9B — это мультимодальная базовая модель из семейства Qwen3.5, разработанная для обеспечения мощных возможностей в области рассуждений, программирования и визуального понимания в эффективной архитектуре с 9 миллиардами параметров. Она использует унифицированный дизайн для работы с визуальной и языковой информацией с ранним объединением мультимодальных токенов, что позволяет модели обрабатывать и анализировать текст и изображения в одном контексте.

Входные данные:

10 ₽ / 1M

Текст

Изображения

Видео

Исходящие данные:

15 ₽ / 1M

Текст

262K

Контекст

10 марта 2026

Входящие токены за 1M:

10 ₽

Исходящие токены за 1M:

15 ₽

Чат Детали

OpenAI GPT-5.4 Pro

OpenAI

05 марта 2026

GPT-5.4 Pro — это самая продвинутая модель OpenAI, основанная на единой архитектуре GPT-5.4 с улучшенными возможностями рассуждения для выполнения сложных и ответственных задач. Она обладает контекстным окном более 1 миллиона токенов (922K на входе, 128K на выходе) с поддержкой текстовых и визуальных данных. Оптимизированная для пошагового рассуждения, следования инструкциям и точности, GPT-5.4 Pro превосходно справляется с агентским кодированием, рабочими процессами с длинным контекстом и многошаговым решением задач.

Входные данные:

3648 ₽ / 1M

Текст

Изображения

Файл

Исходящие данные:

21893 ₽ / 1M

Текст

Контекст

05 марта 2026

Входящие токены за 1M:

3648 ₽

Исходящие токены за 1M:

21893 ₽

Чат Детали

OpenAI GPT-5.4

OpenAI

05 марта 2026

GPT-5.4 — это новейшая модель от OpenAI, объединяющая линии Codex и GPT в единую систему. Она обладает контекстным окном более чем на 1 миллион токенов (922 тыс. на вход и 128 тыс. на выход) с поддержкой текстовых и графических входных данных, что позволяет выполнять высококонтекстное рассуждение, программирование и мультимодальный анализ в рамках одного рабочего процесса.

Модель обеспечивает улучшенную производительность в программировании, понимании документов, использовании инструментов и следовании инструкциям. Она разработана как мощный инструмент по умолчанию как для общих задач, так и для программной инженерии, способная генерировать код производственного качества, синтезировать информацию из множества источников и выполнять сложные многоэтапные рабочие процессы с меньшим числом итераций и большей эффективностью использования токенов.

Входные данные:

253 ₽ / 1M

Текст

Изображения

Файл

Исходящие данные:

1520 ₽ / 1M

Текст

Контекст

05 марта 2026

Входящие токены за 1M:

253 ₽

Исходящие токены за 1M:

1520 ₽

Чат Детали

Inception Mercury 2

Inception

128K

04 марта 2026

Mercury 2 — это чрезвычайно быстрое LLM для рассуждений и первое LLM с диффузией рассуждений (dLLM). Вместо последовательной генерации токенов, Mercury 2 производит и уточняет несколько токенов параллельно, достигая более 1000 токенов в секунду на стандартных GPU. Mercury 2 работает в 5 раз быстрее, чем ведущие оптимизированные по скорости LLM, такие как Claude 4.5 Haiku и GPT 5 Mini, при этом стоимость значительно ниже. Mercury 2 поддерживает настраиваемые уровни рассуждений, контекст на 128K, использование инструментов на родном уровне и вывод JSON, выровненный по схеме. Создан для рабочих процессов программирования, где задержка накапливается, а также для работы в реальном времени с голосом/поиском и агентными циклами. Совместим с OpenAI API. Подробнее читайте в блоге.

Входные данные:

25 ₽ / 1M

Текст

Исходящие данные:

76 ₽ / 1M

Текст

128K

Контекст

04 марта 2026

Входящие токены за 1M:

25 ₽

Исходящие токены за 1M:

76 ₽

Чат Детали

OpenAI GPT-5.3 Chat

OpenAI

128K

03 марта 2026

GPT-5.3 Chat — это обновление самой популярной модели ChatGPT, которое делает повседневные разговоры более плавными, полезными и более непосредственно полезными. Оно предоставляет более точные ответы с лучшей контекстуализацией и значительно сокращает количество ненужных отказов, оговорок и чрезмерно осторожных формулировок, которые могут прерывать течение беседы.

Входные данные:

177 ₽ / 1M

Текст

Изображения

Файл

Исходящие данные:

1419 ₽ / 1M

Текст

128K

Контекст

03 марта 2026

Входящие токены за 1M:

177 ₽

Исходящие токены за 1M:

1419 ₽

Чат Детали