Загрузка...

Каталог AI моделей и нейросетей: сравнение и цены

Каталог нейросетей с описанием возможностей и ценами в рублях. Сравните стоимость токенов и выберите лучшее решение.

Показать фильтр
Разработчики
Показать все (69)
Входные данные
Исходящие данные
Поддерживаемые параметры
Показать все (18)
Скопировано в буфер обмена!
Moonshot AI
131K

Kimi K2 Instruct — это крупномасштабная языковая модель с архитектурой Mixture-of-Experts (MoE), разработанная компанией Moonshot AI, с общим числом параметров в 1 триллион и 32 миллиарда активных параметров на каждый проход. Она оптимизирована для агентных возможностей, включая продвинутое использование инструментов, рассуждение и синтез кода. Kimi K2 превосходит по многим критериям, особенно в области кодирования (LiveCodeBench, SWE-bench), рассуждений (ZebraLogic, GPQA) и использования инструментов (Tau2, AceBench). Она поддерживает вывод в длинном контексте до 128 тысяч токенов и разработана с использованием новой обучающей архитектуры, включающей оптимизатор MuonClip для стабильного крупномасштабного обучения MoE.

Входные данные:
54 ₽ / 1M
Текст
Исходящие данные:
219 ₽ / 1M
Текст
Контекст:
131K
Входящие токены за 1M:
54 ₽
Исходящие токены за 1M:
219 ₽
Скопировано в буфер обмена!
Tencent
131K

Hunyuan-A13B — это языковая модель Mixture-of-Experts (MoE) с 13 миллиардами активных параметров, разработанная компанией Tencent, с общим количеством параметров 80 миллиардов и поддержкой рассуждений через Chain-of-Thought. Она демонстрирует конкурентоспособные результаты в тестах по математике, науке, программированию и задачам многократного рассуждения, сохраняя при этом высокую эффективность вывода благодаря Grouped Query Attention (GQA) и поддержке квантования (FP8, GPTQ и др.).

Входные данные:
13 ₽ / 1M
Текст
Исходящие данные:
54 ₽ / 1M
Текст
Контекст:
131K
Входящие токены за 1M:
13 ₽
Исходящие токены за 1M:
54 ₽
Скопировано в буфер обмена!
Morph
262K

Модель Morph с высокой точностью для сложных изменений кода. ~4,500 токенов/сек с точностью 98% для точных преобразований кода.

Модель требует, чтобы запрос был в следующем формате:

{инструкция}

{исходный_код}

{фрагмент_изменения}

Функция нулевого сохранения данных включена для Morph. Узнайте больше об этой модели в их документации

Входные данные:
85 ₽ / 1M
Текст
Исходящие данные:
181 ₽ / 1M
Текст
Контекст:
262K
Входящие токены за 1M:
85 ₽
Исходящие токены за 1M:
181 ₽
Скопировано в буфер обмена!
Morph
82K

Самая быстрая модель Morph для применения изменений в коде. ~10,500 токенов/сек с точностью 96% для быстрых преобразований кода.

Модель требует, чтобы запрос был в следующем формате:

{инструкция}

{исходный_код}

{фрагмент_изменений}

Функция нулевого сохранения данных включена для Morph. Узнайте больше об этой модели в их документации

Входные данные:
76 ₽ / 1M
Текст
Исходящие данные:
114 ₽ / 1M
Текст
Контекст:
82K
Входящие токены за 1M:
76 ₽
Исходящие токены за 1M:
114 ₽
Скопировано в буфер обмена!
Baidu
131K

ERNIE-4.5-VL-424B-A47B — это мультимодальная модель типа Mixture-of-Experts (MoE) из серии ERNIE 4.5 от Baidu, имеющая 424 миллиарда общих параметров с 47 миллиардами активных на каждый токен. Она обучена совместно на текстовых и изображенческих данных с использованием гетерогенной архитектуры MoE и маршрутизации, изолированной по модальностям, что позволяет осуществлять высокоточное кросс-модальное рассуждение, понимание изображений и генерацию длинных контекстов (до 131 тысячи токенов). Модель дообучена с использованием таких техник, как SFT, DPO, UPO и RLVR, и поддерживает как режимы вывода с “мышлением”, так и без него. Разработанная для задач, связанных с взаимодействием зрения и языка на английском и китайском языках, она оптимизирована для эффективного масштабирования и может работать при квантовании в 4 бита/8 бит.

Входные данные:
40 ₽ / 1M
Изображения
Текст
Исходящие данные:
119 ₽ / 1M
Текст
Контекст:
131K
Входящие токены за 1M:
40 ₽
Исходящие токены за 1M:
119 ₽
Скопировано в буфер обмена!
Mistral AI
128K

Mistral-Small-3.2-24B-Instruct-2506 — это обновленная модель с 24 миллиардами параметров от Mistral, оптимизированная для выполнения инструкций, уменьшения повторений и улучшенного вызова функций. По сравнению с версией 3.1, версия 3.2 значительно улучшает точность на WildBench и Arena Hard, сокращает бесконечные генерации и обеспечивает улучшения в использовании инструментов и задачах с структурированным выводом.

Она поддерживает ввод изображений и текста с структурированным выводом, вызов функций/инструментов и демонстрирует высокую производительность в кодировании (HumanEval+, MBPP), STEM (MMLU, MATH, GPQA) и визуальных тестах (ChartQA, DocVQA).

Входные данные:
7 ₽ / 1M
Изображения
Текст
Исходящие данные:
19 ₽ / 1M
Текст
Контекст:
128K
Входящие токены за 1M:
7 ₽
Исходящие токены за 1M:
19 ₽
Скопировано в буфер обмена!
Minimax
1M

MiniMax-M1 — это крупномасштабная модель рассуждений с открытым весом, разработанная для расширенного контекста и высокоэффективного вывода. Она использует гибридную архитектуру Mixture-of-Experts (MoE) в сочетании с пользовательским механизмом “молниеносного внимания”, что позволяет обрабатывать длинные последовательности — до 1 миллиона токенов — при сохранении конкурентоспособной эффективности FLOP. С общим количеством параметров 456 миллиардов и 45,9 миллиарда активных на токен, этот вариант оптимизирован для сложных, многошаговых задач рассуждения.

Обученная с помощью пользовательского конвейера обучения с подкреплением (CISPO), M1 превосходит в понимании длинного контекста, программной инженерии, использовании агентных инструментов и математическом рассуждении. Тесты показывают высокие результаты на FullStackBench, SWE-bench, MATH, GPQA и TAU-Bench, часто превосходя другие открытые модели, такие как DeepSeek R1 и Qwen3-235B.

Входные данные:
38 ₽ / 1M
Текст
Исходящие данные:
210 ₽ / 1M
Текст
Контекст:
1M
Входящие токены за 1M:
38 ₽
Исходящие токены за 1M:
210 ₽
Скопировано в буфер обмена!
Google
1M

Gemini 2.5 Flash — это передовая рабочая модель от Google, специально разработанная для выполнения сложных задач в области рассуждений, программирования, математики и науки. Она включает встроенные возможности “мышления”, что позволяет ей давать ответы с большей точностью и учитывать нюансы контекста.

Входные данные:
28 ₽ / 1M
Файл
Изображения
Текст
Аудио
Видео
Исходящие данные:
238 ₽ / 1M
Текст
Контекст:
1M
Входящие токены за 1M:
28 ₽
Исходящие токены за 1M:
238 ₽
Скопировано в буфер обмена!
Google
1M

Gemini 2.5 Pro — это передовая модель ИИ от Google, разработанная для выполнения сложных задач в области рассуждений, программирования, математики и науки. Она использует возможности «мышления», что позволяет ей рассуждать при формировании ответов с повышенной точностью и тонким учетом контекста. Gemini 2.5 Pro демонстрирует высочайшую производительность по нескольким критериям, включая первое место в рейтинге LMArena, что отражает превосходное соответствие предпочтениям человека и способности решать сложные задачи.

Входные данные:
119 ₽ / 1M
Текст
Изображения
Файл
Аудио
Видео
Исходящие данные:
955 ₽ / 1M
Текст
Контекст:
1M
Входящие токены за 1M:
119 ₽
Исходящие токены за 1M:
955 ₽
Скопировано в буфер обмена!
Google
1M

Gemini 2.5 Pro — это передовая модель искусственного интеллекта от Google, разработанная для выполнения сложных задач в области рассуждений, программирования, математики и науки. Она использует возможности «мышления», что позволяет ей рассуждать над ответами с повышенной точностью и учитывать нюансы контекста. Gemini 2.5 Pro демонстрирует высочайшую производительность на различных тестах, включая первое место в рейтинге LMArena, что отражает превосходное соответствие предпочтениям человека и способности решать сложные проблемы.

Входные данные:
119 ₽ / 1M
Файл
Изображения
Текст
Аудио
Исходящие данные:
955 ₽ / 1M
Текст
Контекст:
1M
Входящие токены за 1M:
119 ₽
Исходящие токены за 1M:
955 ₽
Скопировано в буфер обмена!
DeepSeek
164K

Обновление от 28 мая для оригинального DeepSeek R1 Производительность на уровне OpenAI o1, но с открытым исходным кодом и полностью открытыми токенами рассуждений. Размер модели составляет 671 миллиард параметров, из которых 37 миллиардов активны в процессе вывода.

Полностью открытая модель с открытым исходным кодом.

Входные данные:
47 ₽ / 1M
Текст
Исходящие данные:
205 ₽ / 1M
Текст
Контекст:
164K
Входящие токены за 1M:
47 ₽
Исходящие токены за 1M:
205 ₽
Скопировано в буфер обмена!
Anthropic
200K

Claude Opus 4 оценивается как лучшая в мире модель для кодирования на момент выпуска, обеспечивая стабильную производительность на сложных, длительных задачах и рабочих процессах агентов. Она устанавливает новые стандарты в области программной инженерии, достигая ведущих результатов на SWE-bench (72.5%) и Terminal-bench (43.2%). Opus 4 поддерживает расширенные агентные рабочие процессы, обрабатывая тысячи шагов задач непрерывно в течение нескольких часов без ухудшения производительности.

Входные данные:
1432 ₽ / 1M
Изображения
Текст
Файл
Исходящие данные:
7163 ₽ / 1M
Текст
Контекст:
200K
Входящие токены за 1M:
1432 ₽
Исходящие токены за 1M:
7163 ₽
Скопировано в буфер обмена!
Anthropic
1M

Claude Sonnet 4 значительно улучшает возможности своего предшественника, Sonnet 3.7, превосходя его как в задачах кодирования, так и в задачах рассуждения с улучшенной точностью и управляемостью. Достигнув передовых результатов на SWE-bench (72,7%), Sonnet 4 сочетает в себе возможности и вычислительную эффективность, что делает его подходящим для широкого спектра приложений — от рутинных задач кодирования до сложных проектов разработки программного обеспечения. Ключевые улучшения включают улучшенную автономную навигацию по кодовой базе, снижение уровня ошибок в агентно-управляемых рабочих процессах и повышенную надежность в следовании сложным инструкциям. Sonnet 4 оптимизирован для практического повседневного использования, предоставляя расширенные возможности рассуждения при сохранении эффективности и отзывчивости в различных внутренних и внешних сценариях.

Входные данные:
286 ₽ / 1M
Изображения
Текст
Файл
Исходящие данные:
1432 ₽ / 1M
Текст
Контекст:
1M
Входящие токены за 1M:
286 ₽
Исходящие токены за 1M:
1432 ₽
Скопировано в буфер обмена!
Google
33K

Gemma 3n E4B-it оптимизирован для эффективного выполнения на мобильных и малоресурсных устройствах, таких как телефоны, ноутбуки и планшеты. Он поддерживает мультимодальные вводы — включая текст, визуальные данные и аудио — что позволяет выполнять разнообразные задачи, такие как генерация текста, распознавание речи, перевод и анализ изображений. Используя инновации, такие как кэширование Per-Layer Embedding (PLE) и архитектура MatFormer, Gemma 3n динамически управляет использованием памяти и вычислительной нагрузкой, выборочно активируя параметры модели, что значительно снижает требования к ресурсам во время выполнения.

Эта модель поддерживает широкий языковой диапазон (обучена на более чем 140 языках) и имеет гибкое контекстное окно на 32K токенов. Gemma 3n может выборочно загружать параметры, оптимизируя память и вычислительную эффективность в зависимости от задачи или возможностей устройства, что делает её подходящей для приложений, ориентированных на конфиденциальность, с возможностью работы в оффлайн-режиме и решений AI на устройстве. Подробнее в блоге

Входные данные:
5,73 ₽ / 1M
Текст
Исходящие данные:
11 ₽ / 1M
Текст
Контекст:
33K
Входящие токены за 1M:
5,73 ₽
Исходящие токены за 1M:
11 ₽
Скопировано в буфер обмена!
Mistral AI
131K

Mistral Medium 3 — это высокопроизводительная языковая модель корпоративного уровня, разработанная для предоставления передовых возможностей при значительно сниженной операционной стоимости. Она сочетает передовые возможности в области рассуждений и мультимодальной производительности с 8-кратным снижением затрат по сравнению с традиционными крупными моделями, что делает её подходящей для масштабируемого развертывания в профессиональных и промышленных сценариях использования.

Модель превосходно работает в таких областях, как программирование, STEM-рассуждения и адаптация для предприятий. Она поддерживает гибридные, локальные и в-VPC развертывания и оптимизирована для интеграции в пользовательские рабочие процессы. Mistral Medium 3 предлагает конкурентоспособную точность по сравнению с более крупными моделями, такими как Claude Sonnet 3.5/3.7, Llama 4 Maverick и Command R+, при этом сохраняя широкую совместимость с облачными средами.

Входные данные:
38 ₽ / 1M
Текст
Изображения
Файл
Исходящие данные:
191 ₽ / 1M
Текст
Контекст:
131K
Входящие токены за 1M:
38 ₽
Исходящие токены за 1M:
191 ₽