Загрузка...

Каталог AI моделей и нейросетей: сравнение и цены

Каталог нейросетей с описанием возможностей и ценами в рублях. Сравните стоимость токенов и выберите лучшее решение.

Показать фильтр
Разработчики
Показать все (69)
Входные данные
Исходящие данные
Поддерживаемые параметры
Показать все (18)
Скопировано в буфер обмена!
OpenAI
400K

GPT-5.4 mini приносит основные возможности GPT-5.4 в более быструю и эффективную модель, оптимизированную для высокопроизводительных рабочих нагрузок. Она поддерживает текстовые и графические вводы, демонстрируя высокую производительность в области рассуждений, кодирования и использования инструментов, при этом снижая задержку и затраты для крупномасштабных развертываний.

Модель разработана для производственных сред, где требуется баланс между возможностями и эффективностью, что делает её хорошо подходящей для чат-приложений, помощников по кодированию и агентских рабочих процессов, работающих в большом масштабе. GPT-5.4 mini обеспечивает надежное следование инструкциям, уверенное многократное рассуждение и стабильную производительность в различных задачах с улучшенной экономической эффективностью.

Входные данные:
72 ₽ / 1M
Файл
Изображения
Текст
Исходящие данные:
434 ₽ / 1M
Текст
Контекст:
400K
Входящие токены за 1M:
72 ₽
Исходящие токены за 1M:
434 ₽
Скопировано в буфер обмена!
Mistral AI
262K

Mistral Small 4 — это следующий крупный выпуск в семействе Mistral Small, объединяющий возможности нескольких флагманских моделей Mistral в единую систему. Он сочетает в себе мощное логическое мышление от Magistral, мультимодальное понимание от Pixtral и агентные возможности кодирования от Devstral, позволяя одной модели справляться со сложным анализом, разработкой программного обеспечения и визуальными задачами в рамках одного рабочего процесса.

Входные данные:
14 ₽ / 1M
Текст
Изображения
Исходящие данные:
57 ₽ / 1M
Текст
Контекст:
262K
Входящие токены за 1M:
14 ₽
Исходящие токены за 1M:
57 ₽
Скопировано в буфер обмена!
Perplexity
32K

pplx-embed-v1 -4B является одной из передовых моделей текстового встраивания от Perplexity, созданной для извлечения информации в реальном мире и в масштабах интернета. pplx-embed-v1 оптимизирована для стандартного плотного извлечения текста, а модель с параметром 4B максимизирует качество извлечения.

Входные данные:
2 ₽ / 1M
Текст
Исходящие данные:
0 ₽ / 1M
Embeddings
Контекст:
32K
Входящие токены за 1M:
2 ₽
Исходящие токены за 1M:
0 ₽
Скопировано в буфер обмена!
Perplexity
32K

pplx-embed-v1 -4B — это одна из передовых моделей текстового встраивания Perplexity, созданная для работы с данными в реальном мире и в масштабах сети. pplx-embed-v1 оптимизирована для стандартного плотного поиска текста, а модель с 4 миллиардами параметров максимизирует качество поиска.

Входные данные:
2 ₽ / 1M
Текст
Исходящие данные:
0 ₽ / 1M
Embeddings
Контекст:
32K
Входящие токены за 1M:
2 ₽
Исходящие токены за 1M:
0 ₽
Скопировано в буфер обмена!
Perplexity
32K

pplx-embed-v1-0.6B является одной из передовых моделей текстового встраивания от Perplexity, созданной для реального использования в веб-масштабном поиске. pplx-embed-v1 оптимизирована для стандартного плотного текстового поиска с моделью на 0.6B параметров, ориентированной на легковесное и низкозатратное по времени создание встраиваний.

Входные данные:
0,39 ₽ / 1M
Текст
Исходящие данные:
0 ₽ / 1M
Embeddings
Контекст:
32K
Входящие токены за 1M:
0,39 ₽
Исходящие токены за 1M:
0 ₽
Скопировано в буфер обмена!
Perplexity
32K

pplx-embed-v1-0.6B is one of Perplexity’s state-of-the-art text embedding models built for real-world, web-scale retrieval. pplx-embed-v1 is optimized for standard dense text retrieval with the 0.6B parameter model targeting lightweight, low-latency embedding generation.

Входные данные:
0,39 ₽ / 1M
Текст
Исходящие данные:
0 ₽ / 1M
Embeddings
Контекст:
32K
Входящие токены за 1M:
0,39 ₽
Исходящие токены за 1M:
0 ₽
Скопировано в буфер обмена!
Z AI
203K

GLM-5 Turbo — это новая модель от Z.ai, разработанная для быстрой инференции и высокой производительности в средах, управляемых агентами, таких как сценарии OpenClaw. Она глубоко оптимизирована для рабочих процессов агентов в реальном мире, которые включают длинные цепочки выполнения, с улучшенной декомпозицией сложных инструкций, использованием инструментов, запланированным и постоянным выполнением, а также общей стабильностью при выполнении длительных задач.

Входные данные:
115 ₽ / 1M
Текст
Исходящие данные:
386 ₽ / 1M
Текст
Контекст:
203K
Входящие токены за 1M:
115 ₽
Исходящие токены за 1M:
386 ₽
Скопировано в буфер обмена!
NVIDIA
262K

NVIDIA Nemotron 3 Super — это открытая гибридная модель MoE с 120 миллиардами параметров, активирующая всего 12 миллиардов параметров для максимальной вычислительной эффективности и точности в сложных многоагентных приложениях. Построенная на гибридной архитектуре Mamba-Transformer Mixture-of-Experts с многотокеновым предсказанием (MTP), она обеспечивает более чем на 50% более высокую генерацию токенов по сравнению с ведущими открытыми моделями.

Модель обладает контекстным окном на 1 миллион токенов для долгосрочной согласованности агентов, междокументального рассуждения и многократного планирования задач. Латентный MoE позволяет вызывать 4 эксперта по стоимости вывода всего одного, улучшая интеллект и обобщение. Обучение с подкреплением в нескольких средах, охватывающее более 10 сред, обеспечивает ведущую точность на бенчмарках, включая AIME 2025, TerminalBench и SWE-Bench Verified.

Полностью открытая с весами, наборами данных и рецептами под лицензией NVIDIA Open License, Nemotron 3 Super позволяет легко настраивать и безопасно развертывать её в любом месте — от рабочей станции до облака.

Входные данные:
8 ₽ / 1M
Текст
Исходящие данные:
43 ₽ / 1M
Текст
Контекст:
262K
Входящие токены за 1M:
8 ₽
Исходящие токены за 1M:
43 ₽
Скопировано в буфер обмена!
Bytedance-seed
262K

Seed-2.0-Lite — это сбалансированная модель, разработанная для высокочастотных корпоративных рабочих нагрузок, оптимизируя как возможности, так и затраты. Ее общая производительность превосходит предыдущую версию Seed-1.8. Она хорошо подходит для производственных задач, таких как обработка неструктурированной информации, создание текстового контента, поиск и рекомендации, а также анализ данных. Модель поддерживает обработку с длинным контекстом, слияние информации из нескольких источников, выполнение многошаговых инструкций и создание высокоточных структурированных выходных данных, обеспечивая стабильное качество при значительном снижении затрат.

Входные данные:
24 ₽ / 1M
Текст
Изображения
Видео
Исходящие данные:
193 ₽ / 1M
Текст
Контекст:
262K
Входящие токены за 1M:
24 ₽
Исходящие токены за 1M:
193 ₽
Скопировано в буфер обмена!
Qwen
262K

Qwen3.5-9B — это мультимодальная базовая модель из семейства Qwen3.5, разработанная для обеспечения мощных возможностей в области рассуждений, программирования и визуального понимания в эффективной архитектуре с 9 миллиардами параметров. Она использует унифицированный дизайн для работы с визуальной и языковой информацией с ранним объединением мультимодальных токенов, что позволяет модели обрабатывать и анализировать текст и изображения в одном контексте.

Входные данные:
3 ₽ / 1M
Текст
Изображения
Видео
Исходящие данные:
14 ₽ / 1M
Текст
Контекст:
262K
Входящие токены за 1M:
3 ₽
Исходящие токены за 1M:
14 ₽
Скопировано в буфер обмена!
OpenAI
1M

GPT-5.4 Pro — это самая продвинутая модель OpenAI, основанная на единой архитектуре GPT-5.4 с улучшенными возможностями рассуждения для выполнения сложных и ответственных задач. Она обладает контекстным окном более 1 миллиона токенов (922K на входе, 128K на выходе) с поддержкой текстовых и визуальных данных. Оптимизированная для пошагового рассуждения, следования инструкциям и точности, GPT-5.4 Pro превосходно справляется с агентским кодированием, рабочими процессами с длинным контекстом и многошаговым решением задач.

Входные данные:
2897 ₽ / 1M
Текст
Изображения
Файл
Исходящие данные:
17385 ₽ / 1M
Текст
Контекст:
1M
Входящие токены за 1M:
2897 ₽
Исходящие токены за 1M:
17385 ₽
Скопировано в буфер обмена!
OpenAI
1M

GPT-5.4 — это новейшая модель от OpenAI, объединяющая линии Codex и GPT в единую систему. Она обладает контекстным окном более чем на 1 миллион токенов (922 тыс. на вход и 128 тыс. на выход) с поддержкой текстовых и графических входных данных, что позволяет выполнять высококонтекстное рассуждение, программирование и мультимодальный анализ в рамках одного рабочего процесса.

Модель обеспечивает улучшенную производительность в программировании, понимании документов, использовании инструментов и следовании инструкциям. Она разработана как мощный инструмент по умолчанию как для общих задач, так и для программной инженерии, способная генерировать код производственного качества, синтезировать информацию из множества источников и выполнять сложные многоэтапные рабочие процессы с меньшим числом итераций и большей эффективностью использования токенов.

Входные данные:
241 ₽ / 1M
Текст
Изображения
Файл
Исходящие данные:
1448 ₽ / 1M
Текст
Контекст:
1M
Входящие токены за 1M:
241 ₽
Исходящие токены за 1M:
1448 ₽
Скопировано в буфер обмена!
Inception
128K

Mercury 2 — это чрезвычайно быстрое LLM для рассуждений и первое LLM с диффузией рассуждений (dLLM). Вместо последовательной генерации токенов, Mercury 2 производит и уточняет несколько токенов параллельно, достигая более 1000 токенов в секунду на стандартных GPU. Mercury 2 работает в 5 раз быстрее, чем ведущие оптимизированные по скорости LLM, такие как Claude 4.5 Haiku и GPT 5 Mini, при этом стоимость значительно ниже. Mercury 2 поддерживает настраиваемые уровни рассуждений, контекст на 128K, использование инструментов на родном уровне и вывод JSON, выровненный по схеме. Создан для рабочих процессов программирования, где задержка накапливается, а также для работы в реальном времени с голосом/поиском и агентными циклами. Совместим с OpenAI API. Подробнее читайте в блоге.

Входные данные:
24 ₽ / 1M
Текст
Исходящие данные:
72 ₽ / 1M
Текст
Контекст:
128K
Входящие токены за 1M:
24 ₽
Исходящие токены за 1M:
72 ₽
Скопировано в буфер обмена!
OpenAI
128K

GPT-5.3 Chat — это обновление самой популярной модели ChatGPT, которое делает повседневные разговоры более плавными, полезными и более непосредственно полезными. Оно предоставляет более точные ответы с лучшей контекстуализацией и значительно сокращает количество ненужных отказов, оговорок и чрезмерно осторожных формулировок, которые могут прерывать течение беседы.

Входные данные:
169 ₽ / 1M
Текст
Изображения
Файл
Исходящие данные:
1352 ₽ / 1M
Текст
Контекст:
128K
Входящие токены за 1M:
169 ₽
Исходящие токены за 1M:
1352 ₽
Скопировано в буфер обмена!
Google
1M

Gemini 3.1 Flash Lite Preview — это высокоэффективная модель от Google, оптимизированная для случаев использования с большим объемом данных. Она превосходит Gemini 2.5 Flash Lite по общему качеству и приближается к производительности Gemini 2.5 Flash по ключевым возможностям. Улучшения охватывают аудиоввод/распознавание речи, ранжирование фрагментов RAG, перевод, извлечение данных и автозаполнение кода. Поддерживает полные уровни мышления (минимальный, низкий, средний, высокий) для точной настройки соотношения затрат и производительности. Стоимость составляет половину от цены Gemini 3 Flash.

Входные данные:
24 ₽ / 1M
Текст
Изображения
Видео
Файл
Аудио
Исходящие данные:
144 ₽ / 1M
Текст
Контекст:
1M
Входящие токены за 1M:
24 ₽
Исходящие токены за 1M:
144 ₽