Каталог AI моделей и нейросетей: сравнение и цены

Каталог нейросетей с описанием возможностей и ценами в рублях. Сравните стоимость токенов и выберите лучшее решение.

Meta Llama

164K

Llama Guard 4 — это многомодальная предварительно обученная модель, основанная на Llama 4 Scout, доработанная для классификации безопасности контента. Подобно предыдущим версиям, она может использоваться для классификации контента как во входных данных LLM (классификация запросов), так и в ответах LLM (классификация ответов). Она функционирует как LLM, генерируя текст на выходе, который указывает, является ли данный запрос или ответ безопасным или небезопасным, и если небезопасным, то также перечисляет категории контента, которые были нарушены.

Llama Guard 4 была настроена для защиты от стандартизированной таксономии угроз MLCommons и разработана для поддержки многомодальных возможностей Llama 4. В частности, она объединяет функции предыдущих моделей Llama Guard, обеспечивая модерацию контента для английского и нескольких поддерживаемых языков, а также улучшенные возможности обработки смешанных текстово-изображенческих запросов, включая несколько изображений. Кроме того, Llama Guard 4 интегрирована в Llama Moderations API, расширяя надежную классификацию безопасности на текст и изображения.

Входные данные:

16 ₽ / 1M

Изображения

Текст

Исходящие данные:

16 ₽ / 1M

Текст

Контекст:

164K

Входящие токены за 1M:

16 ₽

Исходящие токены за 1M:

16 ₽

Чат Детали

Qwen Qwen3 30B A3B

Qwen

131K

Qwen3, последнее поколение в серии крупных языковых моделей Qwen, включает как плотные, так и архитектуры с набором экспертов (MoE), чтобы преуспевать в рассуждениях, многоязыковой поддержке и выполнении сложных задач агентами. Его уникальная способность беспрепятственно переключаться между режимом мышления для сложных рассуждений и режимом без мышления для эффективного диалога обеспечивает универсальную и высококачественную производительность.

Значительно превосходя предыдущие модели, такие как QwQ и Qwen2.5, Qwen3 демонстрирует превосходные способности в математике, программировании, здравом смысле, творческом письме и интерактивном диалоге. Вариант Qwen3-30B-A3B включает 30,5 миллиарда параметров (3,3 миллиарда активированных), 48 слоев, 128 экспертов (8 активируются на задачу) и поддерживает до 131 тысячи токенов в контексте с YaRN, устанавливая новый стандарт среди моделей с открытым исходным кодом.

Входные данные:

11 ₽ / 1M

Текст

Исходящие данные:

46 ₽ / 1M

Текст

Контекст:

131K

Входящие токены за 1M:

11 ₽

Исходящие токены за 1M:

46 ₽

Чат Детали

Qwen Qwen3 8B

Qwen

131K

Qwen3-8B — это плотная причинно-следственная языковая модель с 8,2 миллиардами параметров из серии Qwen3, разработанная как для задач, требующих интенсивного рассуждения, так и для эффективного диалога. Она поддерживает плавное переключение между режимом “мышления” для математики, программирования и логического вывода и режимом “немышления” для общего общения. Модель тонко настроена для следования инструкциям, интеграции агентов, творческого письма и многоязычного использования на более чем 100 языках и диалектах. Она изначально поддерживает контекстное окно в 32K токенов и может расширяться до 131K токенов с помощью масштабирования YaRN.

Входные данные:

4,67 ₽ / 1M

Текст

Исходящие данные:

37 ₽ / 1M

Текст

Контекст:

131K

Входящие токены за 1M:

4,67 ₽

Исходящие токены за 1M:

37 ₽

Чат Детали

Qwen Qwen3 14B

Qwen

132K

Qwen3-14B — это плотная причинно-следственная языковая модель с 14,8 миллиардами параметров из серии Qwen3, разработанная для сложных рассуждений и эффективного диалога. Она поддерживает бесшовное переключение между режимом “мышления” для задач, таких как математика, программирование и логический вывод, и режимом “немышления” для общих разговоров. Модель точно настроена для выполнения инструкций, использования инструментов агента, творческого письма и многоязычных задач на более чем 100 языках и диалектах. Она изначально обрабатывает контексты из 32 тысяч токенов и может расширяться до 131 тысячи токенов с использованием масштабирования на основе YaRN.

Входные данные:

9 ₽ / 1M

Текст

Исходящие данные:

22 ₽ / 1M

Текст

Контекст:

132K

Входящие токены за 1M:

9 ₽

Исходящие токены за 1M:

22 ₽

Чат Детали

Qwen Qwen3 32B

Qwen

131K

Qwen3-32B — это плотная причинно-следственная языковая модель с 32,8 миллиардами параметров из серии Qwen3, оптимизированная как для сложных рассуждений, так и для эффективного диалога. Она поддерживает бесшовное переключение между режимом “мышления” для задач, таких как математика, программирование и логическое умозаключение, и режимом “немышления” для более быстрого, универсального общения. Модель демонстрирует высокую производительность в следовании инструкциям, использовании инструментов агента, творческом письме и многоязычных задачах на более чем 100 языках и диалектах. Она изначально обрабатывает контексты с 32 тысячами токенов и может расширяться до 131 тысячи токенов с использованием масштабирования на основе YaRN.

Входные данные:

7 ₽ / 1M

Текст

Исходящие данные:

26 ₽ / 1M

Текст

Контекст:

131K

Входящие токены за 1M:

7 ₽

Исходящие токены за 1M:

26 ₽

Чат Детали

Qwen Qwen3 235B A22B

Qwen

131K

Qwen3-235B-A22B — это модель с 235 миллиардами параметров типа mixture-of-experts (MoE), разработанная Qwen, активирующая 22 миллиарда параметров за один проход. Она поддерживает плавное переключение между режимом “мышления” для сложных задач, связанных с рассуждениями, математикой и кодом, и режимом “немышления” для общей эффективности в разговоре. Модель демонстрирует сильные способности к рассуждению, поддержку более 100 языков и диалектов, продвинутое следование инструкциям и возможности вызова инструментов агента. Она изначально обрабатывает контекстное окно в 32 тысячи токенов и расширяется до 131 тысячи токенов с использованием масштабирования на основе YaRN.

Входные данные:

42 ₽ / 1M

Текст

Исходящие данные:

170 ₽ / 1M

Текст

Контекст:

131K

Входящие токены за 1M:

42 ₽

Исходящие токены за 1M:

170 ₽

Чат Детали

OpenAI o4 Mini High

OpenAI

200K

OpenAI o4-mini-high — это та же модель, что и o4-mini, но с параметром reasoning_effort, установленным на высокий уровень.

OpenAI o4-mini — это компактная модель рассуждений в серии o, оптимизированная для быстрой и экономичной работы, сохраняя при этом сильные мультимодальные и агентные возможности. Она поддерживает использование инструментов и демонстрирует конкурентоспособные результаты в рассуждениях и кодировании по таким тестам, как AIME (99,5% с использованием Python) и SWE-bench, превосходя своего предшественника o3-mini и даже приближаясь к o3 в некоторых областях.

Несмотря на меньший размер, o4-mini демонстрирует высокую точность в задачах STEM, визуальном решении проблем (например, MathVista, MMMU) и редактировании кода. Она особенно подходит для сценариев с высокой пропускной способностью, где критичны задержка или стоимость. Благодаря своей эффективной архитектуре и усовершенствованному обучению с подкреплением, o4-mini может связывать инструменты, генерировать структурированные выходные данные и решать многошаговые задачи с минимальной задержкой — часто менее чем за минуту.

Входные данные:

102 ₽ / 1M

Изображения

Текст

Файл

Исходящие данные:

411 ₽ / 1M

Текст

Контекст:

200K

Входящие токены за 1M:

102 ₽

Исходящие токены за 1M:

411 ₽

Чат Детали

OpenAI o3

OpenAI

200K

o3 — это всесторонняя и мощная модель в различных областях. Она устанавливает новый стандарт для задач по математике, науке, программированию и визуальному мышлению. Также она превосходно справляется с техническим письмом и следованием инструкциям. Используйте её для решения многоступенчатых задач, которые требуют анализа текста, кода и изображений.

Входные данные:

186 ₽ / 1M

Изображения

Текст

Файл

Исходящие данные:

747 ₽ / 1M

Текст

Контекст:

200K

Входящие токены за 1M:

186 ₽

Исходящие токены за 1M:

747 ₽

Чат Детали

OpenAI o4 Mini

OpenAI

200K

OpenAI o4-mini — это компактная модель рассуждений в серии o, оптимизированная для быстрого и экономичного выполнения задач, при этом обладающая сильными мультимодальными и агентными возможностями. Она поддерживает использование инструментов и демонстрирует конкурентоспособные результаты в рассуждениях и программировании по таким тестам, как AIME (99,5% с использованием Python) и SWE-bench, превосходя своего предшественника o3-mini и даже приближаясь к o3 в некоторых областях.

Несмотря на меньший размер, o4-mini демонстрирует высокую точность в задачах STEM, визуальном решении проблем (например, MathVista, MMMU) и редактировании кода. Она особенно хорошо подходит для сценариев с высокой пропускной способностью, где критичны задержка или стоимость. Благодаря своей эффективной архитектуре и усовершенствованному обучению с подкреплением, o4-mini может связывать инструменты, генерировать структурированные выходные данные и решать многошаговые задачи с минимальной задержкой — часто менее чем за минуту.

Входные данные:

102 ₽ / 1M

Изображения

Текст

Файл

Исходящие данные:

411 ₽ / 1M

Текст

Контекст:

200K

Входящие токены за 1M:

102 ₽

Исходящие токены за 1M:

411 ₽

Чат Детали

OpenAI GPT-4.1

OpenAI

GPT-4.1 — это флагманская большая языковая модель, оптимизированная для выполнения сложных инструкций, реальной разработки программного обеспечения и рассуждений в длинном контексте. Она поддерживает контекстное окно на 1 миллион токенов и превосходит GPT-4o и GPT-4.5 в кодировании (54,6% SWE-bench Verified), соблюдении инструкций (87,4% IFEval) и мультимодальных тестах на понимание. Модель настроена для точных различий в коде, надежности агентов и высокой полноты в контексте больших документов, что делает её идеальной для агентов, инструментов IDE и извлечения знаний в корпоративной среде.

Входные данные:

186 ₽ / 1M

Изображения

Текст

Файл

Исходящие данные:

747 ₽ / 1M

Текст

Контекст:

Входящие токены за 1M:

186 ₽

Исходящие токены за 1M:

747 ₽

Чат Детали

OpenAI GPT-4.1 Mini

OpenAI

GPT-4.1 Mini — это модель среднего размера, обеспечивающая производительность, сопоставимую с GPT-4o, при существенно меньшей задержке и стоимости. Она сохраняет контекстное окно в 1 миллион токенов и набирает 45,1% в сложных инструкционных оценках, 35,8% в MultiChallenge и 84,1% в IFEval. Mini также демонстрирует сильные способности в программировании (например, 31,6% в полиглотном дифференциальном тесте Aider) и понимании визуальной информации, что делает её подходящей для интерактивных приложений с жесткими ограничениями по производительности.

Входные данные:

37 ₽ / 1M

Изображения

Текст

Файл

Исходящие данные:

149 ₽ / 1M

Текст

Контекст:

Входящие токены за 1M:

37 ₽

Исходящие токены за 1M:

149 ₽

Чат Детали

OpenAI GPT-4.1 Nano

OpenAI

Для задач, требующих низкой задержки, GPT-4.1 nano является самой быстрой и дешевой моделью в серии GPT-4.1. Она обеспечивает исключительную производительность при небольшом размере с контекстным окном в 1 миллион токенов и набирает 80,1% на MMLU, 50,3% на GPQA и 9,8% на Aider polyglot coding – даже выше, чем GPT-4o mini. Это идеальный выбор для таких задач, как классификация или автозавершение.

Входные данные:

9 ₽ / 1M

Изображения

Текст

Файл

Исходящие данные:

37 ₽ / 1M

Текст

Контекст:

Входящие токены за 1M:

9 ₽

Исходящие токены за 1M:

37 ₽

Чат Детали

Meta Llama 4 Maverick

Meta Llama

Llama 4 Maverick 17B Instruct (128E) — это высокоемкая мультимодальная языковая модель от Meta, построенная на архитектуре mixture-of-experts (MoE) с 128 экспертами и 17 миллиардами активных параметров на один проход (всего 400 миллиардов). Она поддерживает многоязычный текстовый и визуальный ввод, а также выдает многоязычный текст и код на 12 поддерживаемых языках. Оптимизированная для задач, связанных с визуально-языковым взаимодействием, Maverick настроена для поведения, подобного ассистенту, рассуждений на основе изображений и общего мультимодального взаимодействия.

Maverick обладает ранним объединением для естественной мультимодальности и контекстным окном на 1 миллион токенов. Она была обучена на тщательно отобранной смеси публичных, лицензированных и данных платформы Meta, охватывающей около 22 триллионов токенов, с отсечкой знаний в августе 2024 года. Выпущенная 5 апреля 2025 года под лицензией Llama 4 Community License, Maverick подходит для исследований и коммерческих приложений, требующих продвинутого мультимодального понимания и высокой производительности модели.

Входные данные:

14 ₽ / 1M

Текст

Изображения

Исходящие данные:

56 ₽ / 1M

Текст

Контекст:

Входящие токены за 1M:

14 ₽

Исходящие токены за 1M:

56 ₽

Чат Детали

Meta Llama 4 Scout

Meta Llama

10M

Llama 4 Scout 17B Instruct (16E) — это языковая модель с архитектурой mixture-of-experts (MoE), разработанная Meta, которая активирует 17 миллиардов параметров из общего числа 109 миллиардов. Она поддерживает нативный мультимодальный ввод (текст и изображение) и мультиязычный вывод (текст и код) на 12 поддерживаемых языках. Разработанная для взаимодействия в стиле ассистента и визуального рассуждения, Scout использует 16 экспертов на каждый прямой проход и обладает длиной контекста в 10 миллионов токенов, с обучающим корпусом примерно в 40 триллионов токенов.

Созданная для высокой эффективности и локального или коммерческого развертывания, Llama 4 Scout включает раннее слияние для бесшовной интеграции модальностей. Она настроена для использования в многоязычных чатах, создании подписей и задачах понимания изображений. Выпущенная под лицензией Llama 4 Community License, она была обучена на данных до августа 2024 года и публично запущена 5 апреля 2025 года.

Входные данные:

9 ₽ / 1M

Текст

Изображения

Исходящие данные:

28 ₽ / 1M

Текст

Контекст:

10M

Входящие токены за 1M:

9 ₽

Исходящие токены за 1M:

28 ₽

Чат Детали

DeepSeek DeepSeek V3 0324

DeepSeek

164K

DeepSeek V3, модель с 685 миллиардами параметров и смесью экспертов, является последней итерацией флагманской семейства чат-моделей от команды DeepSeek.

Она является преемником модели DeepSeek V3 и демонстрирует отличные результаты в выполнении различных задач.

Входные данные:

18 ₽ / 1M

Текст

Исходящие данные:

71 ₽ / 1M

Текст

Контекст:

164K

Входящие токены за 1M:

18 ₽

Исходящие токены за 1M:

71 ₽

Чат Детали