Каталог AI моделей и нейросетей: сравнение и цены

Каталог нейросетей с описанием возможностей и ценами в рублях. Сравните стоимость токенов и выберите лучшее решение.

Moonshot AI

262K

Kimi K2 0905 — это обновление за сентябрь Kimi K2 0711. Это крупномасштабная языковая модель Mixture-of-Experts (MoE), разработанная Moonshot AI, с общим числом параметров в 1 триллион и 32 миллиардами активных параметров на каждый проход. Она поддерживает инференс с длинным контекстом до 256 тысяч токенов, что является расширением по сравнению с предыдущими 128 тысячами.

Это обновление улучшает агентное кодирование с более высокой точностью и лучшей обобщаемостью на различных структурах, а также улучшает фронтенд-кодирование с более эстетичными и функциональными результатами для веб, 3D и связанных задач. Kimi K2 оптимизирована для агентных возможностей, включая продвинутое использование инструментов, рассуждение и синтез кода. Она превосходит в кодировании (LiveCodeBench, SWE-bench), рассуждении (ZebraLogic, GPQA) и использовании инструментов (Tau2, AceBench). Модель обучена с использованием новой стекировки, включающей оптимизатор MuonClip для стабильного крупномасштабного обучения MoE.

Входные данные:

57 ₽ / 1M

Текст

Исходящие данные:

238 ₽ / 1M

Текст

Контекст:

262K

Входящие токены за 1M:

57 ₽

Исходящие токены за 1M:

238 ₽

Чат Детали

MoonshotAI Kimi K2 0905

Moonshot AI

262K

Kimi K2 0905 — это сентябрьское обновление Kimi K2 0711. Это крупномасштабная языковая модель типа Mixture-of-Experts (MoE), разработанная Moonshot AI, с общим числом параметров в 1 триллион и 32 миллиардами активных параметров на каждый прямой проход. Она поддерживает вывод с длинным контекстом до 256 тысяч токенов, что больше по сравнению с предыдущими 128 тысячами.

Это обновление улучшает агентное кодирование с более высокой точностью и лучшей обобщаемостью по различным шаблонам, а также улучшает фронтенд-кодирование с более эстетичными и функциональными результатами для веб, 3D и связанных задач. Kimi K2 оптимизирована для агентных возможностей, включая продвинутое использование инструментов, рассуждение и синтез кода. Она превосходит в кодировании (LiveCodeBench, SWE-bench), рассуждении (ZebraLogic, GPQA) и использовании инструментов (Tau2, AceBench) по различным тестам. Модель обучена с использованием новой стеки, включающей оптимизатор MuonClip для стабильного крупномасштабного обучения MoE.

Входные данные:

57 ₽ / 1M

Текст

Исходящие данные:

238 ₽ / 1M

Текст

Контекст:

262K

Входящие токены за 1M:

57 ₽

Исходящие токены за 1M:

238 ₽

Чат Детали

Qwen Qwen3 30B A3B Thinking 2507

Qwen

131K

Qwen3-30B-A3B-Thinking-2507 — это модель рассуждений с 30 миллиардами параметров, основанная на смеси экспертов, оптимизированная для сложных задач, требующих расширенного многошагового мышления. Модель специально разработана для “режима мышления”, где внутренние рассуждения отделены от окончательных ответов.

По сравнению с предыдущими версиями Qwen3-30B, эта версия улучшает производительность в области логического мышления, математики, науки, программирования и многоязычных тестов. Она также демонстрирует более сильное следование инструкциям, использование инструментов и соответствие человеческим предпочтениям. Благодаря более высокой эффективности рассуждений и расширенным бюджетам вывода, она лучше всего подходит для передовых исследований, конкурентного решения проблем и агентных приложений, требующих структурированного долгосрочного мышления.

Входные данные:

7 ₽ / 1M

Текст

Исходящие данные:

38 ₽ / 1M

Текст

Контекст:

131K

Входящие токены за 1M:

7 ₽

Исходящие токены за 1M:

38 ₽

Чат Детали

YandexGPT Pro 5.1

Yandex

33K

Обновлённая YandexGPT 5.1 Pro — лучшая модель Яндекса для обработки текстов. На потоке, в котором сочетаются вопросы пользователей и сложные задачи, востребованные в бизнес-сфере, она превосходит предыдущую модель и достигает уровня GPT-4.1 компании OpenAI. Также YandexGPT 5.1 Pro эффективнее работает с системным промтом и почти вдвое реже прошлой версии даёт выдуманные ответы.

Входные данные:

506 ₽ / 1M

Текст

Исходящие данные:

506 ₽ / 1M

Текст

Контекст:

33K

Входящие токены за 1M:

506 ₽

Исходящие токены за 1M:

506 ₽

Чат Детали

Nous Hermes 4 70B

Nous Research

131K

Hermes 4 70B — это гибридная модель рассуждений от Nous Research, основанная на Meta-Llama-3.1-70B. Она вводит тот же гибридный режим, что и более крупный выпуск 405B, позволяя модели либо отвечать напрямую, либо генерировать явные следы рассуждений ... перед ответом. Пользователи могут управлять поведением рассуждений с помощью булевой переменной reasoning enabled.

Этот вариант 70B обучен на расширенном корпусе пост-тренировочных данных (~60 миллиардов токенов), с акцентом на проверенные данные рассуждений, что приводит к улучшениям в математике, программировании, STEM, логике и структурированных выходах, сохраняя при этом общую производительность ассистента. Он поддерживает режим JSON, соблюдение схем, вызов функций и использование инструментов, и разработан для большей управляемости с уменьшением количества отказов.

Входные данные:

12 ₽ / 1M

Текст

Исходящие данные:

38 ₽ / 1M

Текст

Контекст:

131K

Входящие токены за 1M:

12 ₽

Исходящие токены за 1M:

38 ₽

Чат Детали

Nous Hermes 4 405B

Nous Research

131K

Hermes 4 — это крупномасштабная модель рассуждений, построенная на базе Meta-Llama-3.1-405B и выпущенная Nous Research. Она вводит гибридный режим рассуждений, где модель может выбирать между внутренним обдумыванием с использованием следов ... или прямым ответом, предлагая гибкость между скоростью и глубиной. Пользователи могут управлять поведением рассуждений с помощью булевой переменной reasoning enabled.

Модель настроена на выполнение инструкций с расширенным корпусом пост-тренировочных данных (~60 миллиардов токенов), акцентируя внимание на следах рассуждений, что улучшает производительность в математике, программировании, STEM и логических рассуждениях, сохраняя при этом широкую полезность в качестве ассистента. Она также поддерживает структурированные выводы, включая режим JSON, соблюдение схем, вызов функций и использование инструментов. Hermes 4 обучена для управляемости, снижения частоты отказов и выравнивания в сторону нейтрального, ориентированного на пользователя поведения.

Входные данные:

95 ₽ / 1M

Текст

Исходящие данные:

286 ₽ / 1M

Текст

Контекст:

131K

Входящие токены за 1M:

95 ₽

Исходящие токены за 1M:

286 ₽

Чат Детали

DeepSeek DeepSeek V3.1

DeepSeek

164K

DeepSeek-V3.1 — это крупная гибридная модель рассуждений (671 миллиард параметров, 37 миллиардов активных), поддерживающая как режимы мышления, так и немышления с помощью шаблонов подсказок. Она расширяет базу DeepSeek-V3 с помощью двухфазного процесса обучения на длинных контекстах, достигая до 128 тысяч токенов, и использует микромасштабирование FP8 для эффективного вывода. Пользователи могут управлять поведением рассуждений с помощью булевой переменной reasoning enabled.

Модель улучшает использование инструментов, генерацию кода и эффективность рассуждений, достигая производительности, сопоставимой с DeepSeek-R1 на сложных тестах, при этом реагируя быстрее. Она поддерживает структурированные вызовы инструментов, кодовые агенты и поисковые агенты, что делает её подходящей для исследований, программирования и агентных рабочих процессов.

Она является преемником модели DeepSeek V3-0324 и хорошо справляется с разнообразными задачами.

Входные данные:

20 ₽ / 1M

Текст

Исходящие данные:

75 ₽ / 1M

Текст

Контекст:

164K

Входящие токены за 1M:

20 ₽

Исходящие токены за 1M:

75 ₽

Чат Детали

Mistral Mistral Medium 3.1

Mistral AI

131K

Mistral Medium 3.1 — это обновленная версия Mistral Medium 3, высокопроизводительной языковой модели корпоративного уровня, разработанной для предоставления передовых возможностей при значительно сниженных операционных затратах. Она сочетает в себе передовые возможности логического мышления и мультимодальной производительности с в 8 раз меньшими затратами по сравнению с традиционными крупными моделями, что делает ее подходящей для масштабируемых развертываний в профессиональных и промышленных сценариях использования.

Модель превосходно работает в таких областях, как программирование, логическое мышление в STEM и адаптация для предприятий. Она поддерживает гибридные, локальные и в-VPC развертывания и оптимизирована для интеграции в пользовательские рабочие процессы. Mistral Medium 3.1 предлагает конкурентоспособную точность по сравнению с более крупными моделями, такими как Claude Sonnet 3.5/3.7, Llama 4 Maverick и Command R+, при этом сохраняя широкую совместимость в облачных средах.

Входные данные:

38 ₽ / 1M

Текст

Изображения

Файл

Исходящие данные:

191 ₽ / 1M

Текст

Контекст:

131K

Входящие токены за 1M:

38 ₽

Исходящие токены за 1M:

191 ₽

Чат Детали

Z.ai GLM 4.5V

Z AI

66K

GLM-4.5V — это базовая модель для работы с визуально-языковыми данными в приложениях мультимодальных агентов. Построенная на архитектуре Mixture-of-Experts (MoE) с 106 миллиардами параметров и 12 миллиардами активированных параметров, она достигает передовых результатов в понимании видео, вопросах и ответах по изображениям, OCR и разборе документов, а также демонстрирует значительные улучшения в веб-кодировании интерфейсов, привязке и пространственном мышлении. Она предлагает гибридный режим вывода: “режим размышления” для глубокого анализа и “режим без размышлений” для быстрых ответов. Поведение в плане рассуждений можно переключать с помощью логического параметра reasoning enabled.

Входные данные:

57 ₽ / 1M

Текст

Изображения

Исходящие данные:

171 ₽ / 1M

Текст

Контекст:

66K

Входящие токены за 1M:

57 ₽

Исходящие токены за 1M:

171 ₽

Чат Детали

AI21 Jamba Large 1.7

AI21

256K

Jamba Large 1.7 — это последняя модель в семействе Jamba open, предлагающая улучшения в области обоснованности, следования инструкциям и общей эффективности. Построенная на гибридной архитектуре SSM-Transformer с контекстным окном 256K, она обеспечивает более точные, контекстуально обоснованные ответы и лучшую управляемость по сравнению с предыдущими версиями.

Входные данные:

191 ₽ / 1M

Текст

Исходящие данные:

764 ₽ / 1M

Текст

Контекст:

256K

Входящие токены за 1M:

191 ₽

Исходящие токены за 1M:

764 ₽

Чат Детали

OpenAI GPT-5 Chat

OpenAI

128K

GPT-5 Chat предназначен для ведения продвинутых, естественных, мультимодальных и учитывающих контекст бесед в корпоративных приложениях.

Входные данные:

119 ₽ / 1M

Файл

Изображения

Текст

Исходящие данные:

955 ₽ / 1M

Текст

Контекст:

128K

Входящие токены за 1M:

119 ₽

Исходящие токены за 1M:

955 ₽

Чат Детали

OpenAI GPT-5

OpenAI

400K

GPT-5 — это самая продвинутая модель OpenAI, предлагающая значительные улучшения в области рассуждений, качества кода и пользовательского опыта. Она оптимизирована для сложных задач, требующих пошагового рассуждения, следования инструкциям и точности в критически важных случаях использования. Модель поддерживает функции маршрутизации во время тестирования и продвинутое понимание подсказок, включая намерения, заданные пользователем, такие как “подумай об этом тщательно”. Улучшения включают снижение галлюцинаций, лести и лучшую производительность в задачах программирования, написания и связанных со здоровьем.

Входные данные:

119 ₽ / 1M

Текст

Изображения

Файл

Исходящие данные:

955 ₽ / 1M

Текст

Контекст:

400K

Входящие токены за 1M:

119 ₽

Исходящие токены за 1M:

955 ₽

Чат Детали

OpenAI GPT-5 Mini

OpenAI

400K

GPT-5 Mini — это компактная версия GPT-5, разработанная для выполнения менее сложных задач, связанных с рассуждениями. Она обеспечивает те же преимущества в следовании инструкциям и настройке безопасности, что и GPT-5, но с уменьшенной задержкой и стоимостью. GPT-5 Mini является преемником модели o4-mini от OpenAI.

Входные данные:

23 ₽ / 1M

Текст

Изображения

Файл

Исходящие данные:

191 ₽ / 1M

Текст

Контекст:

400K

Входящие токены за 1M:

23 ₽

Исходящие токены за 1M:

191 ₽

Чат Детали

OpenAI GPT-5 Nano

OpenAI

400K

GPT-5-Nano — это самая маленькая и быстрая версия в системе GPT-5, оптимизированная для инструментов разработчиков, быстрых взаимодействий и сред с ультранизкой задержкой. Хотя её глубина рассуждений ограничена по сравнению с более крупными аналогами, она сохраняет ключевые функции следования инструкциям и безопасности. Это преемник GPT-4.1-nano и предлагает облегчённый вариант для чувствительных к затратам или реального времени приложений.

Входные данные:

4,78 ₽ / 1M

Текст

Изображения

Файл

Исходящие данные:

38 ₽ / 1M

Текст

Контекст:

400K

Входящие токены за 1M:

4,78 ₽

Исходящие токены за 1M:

38 ₽

Чат Детали

OpenAI gpt-oss-120b (exacto)

OpenAI

131K

gpt-oss-120b — это языковая модель Mixture-of-Experts (MoE) с открытыми весами и 117 миллиардами параметров от OpenAI, предназначенная для использования в задачах, требующих высокого уровня рассуждений, агентности и общего назначения. Она активирует 5,1 миллиарда параметров за один прямой проход и оптимизирована для работы на одном графическом процессоре H100 с использованием нативной квантования MXFP4. Модель поддерживает настраиваемую глубину рассуждений, полный доступ к цепочке рассуждений и нативное использование инструментов, включая вызов функций, просмотр и генерацию структурированного вывода.

Входные данные:

3,72 ₽ / 1M

Текст

Исходящие данные:

17 ₽ / 1M

Текст

Контекст:

131K

Входящие токены за 1M:

3,72 ₽

Исходящие токены за 1M:

17 ₽

Чат Детали