Загрузка...

Каталог AI моделей и нейросетей: сравнение и цены

Каталог нейросетей с описанием возможностей и ценами в рублях. Сравните стоимость токенов и выберите лучшее решение.

Показать фильтр
Разработчики
Показать все (69)
Входные данные
Исходящие данные
Поддерживаемые параметры
Показать все (18)
Скопировано в буфер обмена!
OpenAI
1M

Для задач, требующих низкой задержки, GPT-4.1 nano является самой быстрой и дешевой моделью в серии GPT-4.1. Она обеспечивает исключительную производительность при небольшом размере с контекстным окном в 1 миллион токенов и набирает 80,1% на MMLU, 50,3% на GPQA и 9,8% на Aider polyglot coding – даже выше, чем GPT-4o mini. Это идеальный выбор для таких задач, как классификация или автозавершение.

Входные данные:
9 ₽ / 1M
Изображения
Текст
Файл
Исходящие данные:
38 ₽ / 1M
Текст
Контекст:
1M
Входящие токены за 1M:
9 ₽
Исходящие токены за 1M:
38 ₽
Скопировано в буфер обмена!
Meta Llama
1M

Llama 4 Maverick 17B Instruct (128E) — это высокоемкая мультимодальная языковая модель от Meta, построенная на архитектуре mixture-of-experts (MoE) с 128 экспертами и 17 миллиардами активных параметров на один проход (всего 400 миллиардов). Она поддерживает многоязычный текстовый и визуальный ввод, а также выдает многоязычный текст и код на 12 поддерживаемых языках. Оптимизированная для задач, связанных с визуально-языковым взаимодействием, Maverick настроена для поведения, подобного ассистенту, рассуждений на основе изображений и общего мультимодального взаимодействия.

Maverick обладает ранним объединением для естественной мультимодальности и контекстным окном на 1 миллион токенов. Она была обучена на тщательно отобранной смеси публичных, лицензированных и данных платформы Meta, охватывающей около 22 триллионов токенов, с отсечкой знаний в августе 2024 года. Выпущенная 5 апреля 2025 года под лицензией Llama 4 Community License, Maverick подходит для исследований и коммерческих приложений, требующих продвинутого мультимодального понимания и высокой производительности модели.

Входные данные:
14 ₽ / 1M
Текст
Изображения
Исходящие данные:
57 ₽ / 1M
Текст
Контекст:
1M
Входящие токены за 1M:
14 ₽
Исходящие токены за 1M:
57 ₽
Скопировано в буфер обмена!
Meta Llama
10M

Llama 4 Scout 17B Instruct (16E) — это языковая модель с архитектурой mixture-of-experts (MoE), разработанная Meta, которая активирует 17 миллиардов параметров из общего числа 109 миллиардов. Она поддерживает нативный мультимодальный ввод (текст и изображение) и мультиязычный вывод (текст и код) на 12 поддерживаемых языках. Разработанная для взаимодействия в стиле ассистента и визуального рассуждения, Scout использует 16 экспертов на каждый прямой проход и обладает длиной контекста в 10 миллионов токенов, с обучающим корпусом примерно в 40 триллионов токенов.

Созданная для высокой эффективности и локального или коммерческого развертывания, Llama 4 Scout включает раннее слияние для бесшовной интеграции модальностей. Она настроена для использования в многоязычных чатах, создании подписей и задачах понимания изображений. Выпущенная под лицензией Llama 4 Community License, она была обучена на данных до августа 2024 года и публично запущена 5 апреля 2025 года.

Входные данные:
7 ₽ / 1M
Текст
Изображения
Исходящие данные:
28 ₽ / 1M
Текст
Контекст:
10M
Входящие токены за 1M:
7 ₽
Исходящие токены за 1M:
28 ₽
Скопировано в буфер обмена!
DeepSeek
164K

DeepSeek V3, модель с 685 миллиардами параметров и смесью экспертов, является последней итерацией флагманской семейства чат-моделей от команды DeepSeek.

Она является преемником модели DeepSeek V3 и демонстрирует отличные результаты в выполнении различных задач.

Входные данные:
19 ₽ / 1M
Текст
Исходящие данные:
73 ₽ / 1M
Текст
Контекст:
164K
Входящие токены за 1M:
19 ₽
Исходящие токены за 1M:
73 ₽
Скопировано в буфер обмена!
OpenAI
200K

Модели серии o1 обучены с использованием обучения с подкреплением, чтобы обдумывать свои ответы и выполнять сложные рассуждения. Модель o1-pro использует больше вычислительных ресурсов, чтобы думать интенсивнее и предоставлять стабильно лучшие ответы.

Входные данные:
14326 ₽ / 1M
Текст
Изображения
Файл
Исходящие данные:
57305 ₽ / 1M
Текст
Контекст:
200K
Входящие токены за 1M:
14326 ₽
Исходящие токены за 1M:
57305 ₽
Скопировано в буфер обмена!
Mistral AI
128K

Mistral Small 3.1 24B Instruct — это обновленный вариант Mistral Small 3 (2501), содержащий 24 миллиарда параметров с продвинутыми мультимодальными возможностями. Он обеспечивает передовые результаты в задачах текстового рассуждения и анализа изображений, включая программирование, математическое рассуждение и поддержку множества языков. Оснащенный обширным контекстным окном на 128 тысяч токенов и оптимизированный для эффективного локального вывода, он поддерживает такие сценарии использования, как разговорные агенты, вызов функций, понимание длинных документов и развертывания с учетом конфиденциальности. Обновленная версия — Mistral Small 3.2.

Входные данные:
33 ₽ / 1M
Текст
Изображения
Исходящие данные:
53 ₽ / 1M
Текст
Контекст:
128K
Входящие токены за 1M:
33 ₽
Исходящие токены за 1M:
53 ₽
Скопировано в буфер обмена!
Google
131K

Gemma 3 вводит мультимодальность, поддерживая ввод в формате “визуальный контент - текст” и текстовые выводы. Она обрабатывает контекстные окна до 128 тысяч токенов, понимает более 140 языков и предлагает улучшенные возможности в области математики, рассуждений и общения, включая структурированные выводы и вызов функций.

Входные данные:
3,82 ₽ / 1M
Текст
Изображения
Исходящие данные:
7 ₽ / 1M
Текст
Контекст:
131K
Входящие токены за 1M:
3,82 ₽
Исходящие токены за 1M:
7 ₽
Скопировано в буфер обмена!
Google
131K

Gemma 3 вводит мультимодальность, поддерживая ввод в формате “зрение-язык” и текстовые выводы. Она обрабатывает контекстные окна до 128 тысяч токенов, понимает более 140 языков и предлагает улучшенные возможности в области математики, рассуждений и общения, включая структурированные выводы и вызов функций. Gemma 3 12B является второй по величине в семействе моделей Gemma 3 после Gemma 3 27B.

Входные данные:
3,82 ₽ / 1M
Текст
Изображения
Исходящие данные:
12 ₽ / 1M
Текст
Контекст:
131K
Входящие токены за 1M:
3,82 ₽
Исходящие токены за 1M:
12 ₽
Скопировано в буфер обмена!
Cohere
256K

Command A — это модель с открытыми весами, имеющая 111 миллиардов параметров и контекстное окно размером 256 тысяч, ориентированная на обеспечение высокой производительности в агентских, многоязычных и кодировочных сценариях использования. По сравнению с другими ведущими проприетарными и моделями с открытыми весами, Command A обеспечивает максимальную производительность при минимальных затратах на оборудование, превосходя в бизнес-критических агентских и многоязычных задачах.

Входные данные:
238 ₽ / 1M
Текст
Исходящие данные:
955 ₽ / 1M
Текст
Контекст:
256K
Входящие токены за 1M:
238 ₽
Исходящие токены за 1M:
955 ₽
Скопировано в буфер обмена!
OpenAI
128K

GPT-4o mini Search Preview — это специализированная модель для веб-поиска в Chat Completions. Она обучена понимать и выполнять запросы веб-поиска.

Входные данные:
14 ₽ / 1M
Текст
Исходящие данные:
57 ₽ / 1M
Текст
Контекст:
128K
Входящие токены за 1M:
14 ₽
Исходящие токены за 1M:
57 ₽
Скопировано в буфер обмена!
OpenAI
128K

GPT-4o Search Preview — это специализированная модель для веб-поиска в Chat Completions. Она обучена понимать и выполнять запросы веб-поиска.

Входные данные:
238 ₽ / 1M
Текст
Исходящие данные:
955 ₽ / 1M
Текст
Контекст:
128K
Входящие токены за 1M:
238 ₽
Исходящие токены за 1M:
955 ₽
Скопировано в буфер обмена!
Reka AI
66K

Reka Flash 3 — это универсальная языковая модель с 21 миллиардом параметров, разработанная Reka, настроенная на выполнение инструкций. Она отлично справляется с общими чатами, задачами программирования, следованием инструкциям и вызовом функций. Обладая длиной контекста в 32K и оптимизированная с помощью обучения с подкреплением (RLOO), она обеспечивает конкурентоспособную производительность, сопоставимую с проприетарными моделями, но с меньшим количеством параметров. Идеально подходит для развертывания с низкой задержкой, локально или на устройстве, Reka Flash 3 является компактной, поддерживает эффективную квантизацию (до 11 ГБ при точности 4 бита) и использует явные теги рассуждений (“") для обозначения своего внутреннего мыслительного процесса.

Reka Flash 3 в основном является английской моделью с ограниченными возможностями понимания нескольких языков. Веса модели выпущены под лицензией Apache 2.0.

Входные данные:
9 ₽ / 1M
Текст
Исходящие данные:
19 ₽ / 1M
Текст
Контекст:
66K
Входящие токены за 1M:
9 ₽
Исходящие токены за 1M:
19 ₽
Скопировано в буфер обмена!
Google
131K

Gemma 3 вводит мультимодальность, поддерживая ввод в формате “зрение-язык” и текстовые выводы. Она обрабатывает контекстные окна до 128 тысяч токенов, понимает более 140 языков и предлагает улучшенные возможности в математике, рассуждениях и чатах, включая структурированные выводы и вызов функций. Gemma 3 27B — это последняя открытая модель от Google, преемник Gemma 2.

Входные данные:
7 ₽ / 1M
Текст
Изображения
Исходящие данные:
15 ₽ / 1M
Текст
Контекст:
131K
Входящие токены за 1M:
7 ₽
Исходящие токены за 1M:
15 ₽
Скопировано в буфер обмена!
The Drummer
33K

Skyfall 36B v2 — это усовершенствованная версия Mistral Small 2501, специально настроенная для повышения креативности, тонкого письма, ролевых игр и связного повествования.

Входные данные:
52 ₽ / 1M
Текст
Исходящие данные:
76 ₽ / 1M
Текст
Контекст:
33K
Входящие токены за 1M:
52 ₽
Исходящие токены за 1M:
76 ₽
Скопировано в буфер обмена!
Perplexity
128K

Sonar Reasoning Pro — это передовая модель рассуждений, работающая на базе DeepSeek R1 с использованием Chain of Thought (CoT). Разработанная для сложных сценариев использования, она поддерживает углубленные, многошаговые запросы с увеличенным окном контекста и может предоставлять больше ссылок на один поиск, что позволяет получать более полные и расширяемые ответы.Примечание: Цены на Sonar Pro включают в себя цены на поиск Perplexity. См. подробности здесь.

Входные данные:
191 ₽ / 1M
Текст
Изображения
Исходящие данные:
764 ₽ / 1M
Текст
Контекст:
128K
Входящие токены за 1M:
191 ₽
Исходящие токены за 1M:
764 ₽