Каталог AI моделей и нейросетей: сравнение и цены

Каталог нейросетей с описанием возможностей и ценами в рублях. Сравните стоимость токенов и выберите лучшее решение.

OpenAI

Для задач, требующих низкой задержки, GPT-4.1 nano является самой быстрой и дешевой моделью в серии GPT-4.1. Она обеспечивает исключительную производительность при небольшом размере с контекстным окном в 1 миллион токенов и набирает 80,1% на MMLU, 50,3% на GPQA и 9,8% на Aider polyglot coding – даже выше, чем GPT-4o mini. Это идеальный выбор для таких задач, как классификация или автозавершение.

Входные данные:

9 ₽ / 1M

Изображения

Текст

Файл

Исходящие данные:

38 ₽ / 1M

Текст

Контекст:

Входящие токены за 1M:

9 ₽

Исходящие токены за 1M:

38 ₽

Чат Детали

Meta Llama 4 Maverick

Meta Llama

Llama 4 Maverick 17B Instruct (128E) — это высокоемкая мультимодальная языковая модель от Meta, построенная на архитектуре mixture-of-experts (MoE) с 128 экспертами и 17 миллиардами активных параметров на один проход (всего 400 миллиардов). Она поддерживает многоязычный текстовый и визуальный ввод, а также выдает многоязычный текст и код на 12 поддерживаемых языках. Оптимизированная для задач, связанных с визуально-языковым взаимодействием, Maverick настроена для поведения, подобного ассистенту, рассуждений на основе изображений и общего мультимодального взаимодействия.

Maverick обладает ранним объединением для естественной мультимодальности и контекстным окном на 1 миллион токенов. Она была обучена на тщательно отобранной смеси публичных, лицензированных и данных платформы Meta, охватывающей около 22 триллионов токенов, с отсечкой знаний в августе 2024 года. Выпущенная 5 апреля 2025 года под лицензией Llama 4 Community License, Maverick подходит для исследований и коммерческих приложений, требующих продвинутого мультимодального понимания и высокой производительности модели.

Входные данные:

14 ₽ / 1M

Текст

Изображения

Исходящие данные:

57 ₽ / 1M

Текст

Контекст:

Входящие токены за 1M:

14 ₽

Исходящие токены за 1M:

57 ₽

Чат Детали

Meta Llama 4 Scout

Meta Llama

10M

Llama 4 Scout 17B Instruct (16E) — это языковая модель с архитектурой mixture-of-experts (MoE), разработанная Meta, которая активирует 17 миллиардов параметров из общего числа 109 миллиардов. Она поддерживает нативный мультимодальный ввод (текст и изображение) и мультиязычный вывод (текст и код) на 12 поддерживаемых языках. Разработанная для взаимодействия в стиле ассистента и визуального рассуждения, Scout использует 16 экспертов на каждый прямой проход и обладает длиной контекста в 10 миллионов токенов, с обучающим корпусом примерно в 40 триллионов токенов.

Созданная для высокой эффективности и локального или коммерческого развертывания, Llama 4 Scout включает раннее слияние для бесшовной интеграции модальностей. Она настроена для использования в многоязычных чатах, создании подписей и задачах понимания изображений. Выпущенная под лицензией Llama 4 Community License, она была обучена на данных до августа 2024 года и публично запущена 5 апреля 2025 года.

Входные данные:

7 ₽ / 1M

Текст

Изображения

Исходящие данные:

28 ₽ / 1M

Текст

Контекст:

10M

Входящие токены за 1M:

7 ₽

Исходящие токены за 1M:

28 ₽

Чат Детали

DeepSeek DeepSeek V3 0324

DeepSeek

164K

DeepSeek V3, модель с 685 миллиардами параметров и смесью экспертов, является последней итерацией флагманской семейства чат-моделей от команды DeepSeek.

Она является преемником модели DeepSeek V3 и демонстрирует отличные результаты в выполнении различных задач.

Входные данные:

19 ₽ / 1M

Текст

Исходящие данные:

73 ₽ / 1M

Текст

Контекст:

164K

Входящие токены за 1M:

19 ₽

Исходящие токены за 1M:

73 ₽

Чат Детали

OpenAI o1-pro

OpenAI

200K

Модели серии o1 обучены с использованием обучения с подкреплением, чтобы обдумывать свои ответы и выполнять сложные рассуждения. Модель o1-pro использует больше вычислительных ресурсов, чтобы думать интенсивнее и предоставлять стабильно лучшие ответы.

Входные данные:

14326 ₽ / 1M

Текст

Изображения

Файл

Исходящие данные:

57305 ₽ / 1M

Текст

Контекст:

200K

Входящие токены за 1M:

14326 ₽

Исходящие токены за 1M:

57305 ₽

Чат Детали

Mistral Mistral Small 3.1 24B

Mistral AI

128K

Mistral Small 3.1 24B Instruct — это обновленный вариант Mistral Small 3 (2501), содержащий 24 миллиарда параметров с продвинутыми мультимодальными возможностями. Он обеспечивает передовые результаты в задачах текстового рассуждения и анализа изображений, включая программирование, математическое рассуждение и поддержку множества языков. Оснащенный обширным контекстным окном на 128 тысяч токенов и оптимизированный для эффективного локального вывода, он поддерживает такие сценарии использования, как разговорные агенты, вызов функций, понимание длинных документов и развертывания с учетом конфиденциальности. Обновленная версия — Mistral Small 3.2.

Входные данные:

33 ₽ / 1M

Текст

Изображения

Исходящие данные:

53 ₽ / 1M

Текст

Контекст:

128K

Входящие токены за 1M:

33 ₽

Исходящие токены за 1M:

53 ₽

Чат Детали

Google Gemma 3 4B

Google

131K

Gemma 3 вводит мультимодальность, поддерживая ввод в формате “визуальный контент - текст” и текстовые выводы. Она обрабатывает контекстные окна до 128 тысяч токенов, понимает более 140 языков и предлагает улучшенные возможности в области математики, рассуждений и общения, включая структурированные выводы и вызов функций.

Входные данные:

3,82 ₽ / 1M

Текст

Изображения

Исходящие данные:

7 ₽ / 1M

Текст

Контекст:

131K

Входящие токены за 1M:

3,82 ₽

Исходящие токены за 1M:

7 ₽

Чат Детали

Google Gemma 3 12B

Google

131K

Gemma 3 вводит мультимодальность, поддерживая ввод в формате “зрение-язык” и текстовые выводы. Она обрабатывает контекстные окна до 128 тысяч токенов, понимает более 140 языков и предлагает улучшенные возможности в области математики, рассуждений и общения, включая структурированные выводы и вызов функций. Gemma 3 12B является второй по величине в семействе моделей Gemma 3 после Gemma 3 27B.

Входные данные:

3,82 ₽ / 1M

Текст

Изображения

Исходящие данные:

12 ₽ / 1M

Текст

Контекст:

131K

Входящие токены за 1M:

3,82 ₽

Исходящие токены за 1M:

12 ₽

Чат Детали

Cohere Command A

Cohere

256K

Command A — это модель с открытыми весами, имеющая 111 миллиардов параметров и контекстное окно размером 256 тысяч, ориентированная на обеспечение высокой производительности в агентских, многоязычных и кодировочных сценариях использования. По сравнению с другими ведущими проприетарными и моделями с открытыми весами, Command A обеспечивает максимальную производительность при минимальных затратах на оборудование, превосходя в бизнес-критических агентских и многоязычных задачах.

Входные данные:

238 ₽ / 1M

Текст

Исходящие данные:

955 ₽ / 1M

Текст

Контекст:

256K

Входящие токены за 1M:

238 ₽

Исходящие токены за 1M:

955 ₽

Чат Детали

OpenAI GPT-4o-mini Search Preview

OpenAI

128K

GPT-4o mini Search Preview — это специализированная модель для веб-поиска в Chat Completions. Она обучена понимать и выполнять запросы веб-поиска.

Входные данные:

14 ₽ / 1M

Текст

Исходящие данные:

57 ₽ / 1M

Текст

Контекст:

128K

Входящие токены за 1M:

14 ₽

Исходящие токены за 1M:

57 ₽

Чат Детали

OpenAI GPT-4o Search Preview

OpenAI

128K

GPT-4o Search Preview — это специализированная модель для веб-поиска в Chat Completions. Она обучена понимать и выполнять запросы веб-поиска.

Входные данные:

238 ₽ / 1M

Текст

Исходящие данные:

955 ₽ / 1M

Текст

Контекст:

128K

Входящие токены за 1M:

238 ₽

Исходящие токены за 1M:

955 ₽

Чат Детали

Reka Flash 3

Reka AI

66K

Reka Flash 3 — это универсальная языковая модель с 21 миллиардом параметров, разработанная Reka, настроенная на выполнение инструкций. Она отлично справляется с общими чатами, задачами программирования, следованием инструкциям и вызовом функций. Обладая длиной контекста в 32K и оптимизированная с помощью обучения с подкреплением (RLOO), она обеспечивает конкурентоспособную производительность, сопоставимую с проприетарными моделями, но с меньшим количеством параметров. Идеально подходит для развертывания с низкой задержкой, локально или на устройстве, Reka Flash 3 является компактной, поддерживает эффективную квантизацию (до 11 ГБ при точности 4 бита) и использует явные теги рассуждений (“") для обозначения своего внутреннего мыслительного процесса.

Reka Flash 3 в основном является английской моделью с ограниченными возможностями понимания нескольких языков. Веса модели выпущены под лицензией Apache 2.0.

Входные данные:

9 ₽ / 1M

Текст

Исходящие данные:

19 ₽ / 1M

Текст

Контекст:

66K

Входящие токены за 1M:

9 ₽

Исходящие токены за 1M:

19 ₽

Чат Детали

Google Gemma 3 27B

Google

131K

Gemma 3 вводит мультимодальность, поддерживая ввод в формате “зрение-язык” и текстовые выводы. Она обрабатывает контекстные окна до 128 тысяч токенов, понимает более 140 языков и предлагает улучшенные возможности в математике, рассуждениях и чатах, включая структурированные выводы и вызов функций. Gemma 3 27B — это последняя открытая модель от Google, преемник Gemma 2.

Входные данные:

7 ₽ / 1M

Текст

Изображения

Исходящие данные:

15 ₽ / 1M

Текст

Контекст:

131K

Входящие токены за 1M:

7 ₽

Исходящие токены за 1M:

15 ₽

Чат Детали

TheDrummer Skyfall 36B V2

The Drummer

33K

Skyfall 36B v2 — это усовершенствованная версия Mistral Small 2501, специально настроенная для повышения креативности, тонкого письма, ролевых игр и связного повествования.

Входные данные:

52 ₽ / 1M

Текст

Исходящие данные:

76 ₽ / 1M

Текст

Контекст:

33K

Входящие токены за 1M:

52 ₽

Исходящие токены за 1M:

76 ₽

Чат Детали

Perplexity Sonar Reasoning Pro

Perplexity

128K

Sonar Reasoning Pro — это передовая модель рассуждений, работающая на базе DeepSeek R1 с использованием Chain of Thought (CoT). Разработанная для сложных сценариев использования, она поддерживает углубленные, многошаговые запросы с увеличенным окном контекста и может предоставлять больше ссылок на один поиск, что позволяет получать более полные и расширяемые ответы.Примечание: Цены на Sonar Pro включают в себя цены на поиск Perplexity. См. подробности здесь.

Входные данные:

191 ₽ / 1M

Текст

Изображения

Исходящие данные:

764 ₽ / 1M

Текст

Контекст:

128K

Входящие токены за 1M:

191 ₽

Исходящие токены за 1M:

764 ₽

Чат Детали