Каталог AI моделей и нейросетей: сравнение и цены

Каталог нейросетей с описанием возможностей и ценами в рублях. Сравните стоимость токенов и выберите лучшее решение.

Perplexity

200K

Для предприятий, ищущих более продвинутые возможности, API Sonar Pro может обрабатывать углубленные, многошаговые запросы с дополнительной расширяемостью, например, вдвое большее количество ссылок на один поиск по сравнению с Sonar в среднем. Кроме того, благодаря большему контекстному окну, он может обрабатывать более длинные и сложные поисковые запросы и последующие вопросы. Примечание: Цены на Sonar Pro включают цены на поиск Perplexity. См. подробности здесь.

Входные данные:

286 ₽ / 1M

Текст

Изображения

Исходящие данные:

1432 ₽ / 1M

Текст

Контекст:

200K

Входящие токены за 1M:

286 ₽

Исходящие токены за 1M:

1432 ₽

Чат Детали

Perplexity Sonar Deep Research

Perplexity

128K

Sonar Deep Research — это модель, ориентированная на исследования, разработанная для многоэтапного поиска, синтеза и рассуждений по сложным темам. Она автономно ищет, читает и оценивает источники, совершенствуя свой подход по мере сбора информации. Это позволяет создавать всесторонние отчеты в таких областях, как финансы, технологии, здравоохранение и текущие события.

Примечания по ценообразованию - Входные токены состоят из токенов запроса (запрос пользователя) + токенов цитирования (это обработанные токены из выполняемых поисков) - Deep Research выполняет множество поисков для проведения исчерпывающих исследований. Поиски оцениваются в $5 за 1000 поисков. - Рассуждение — это отдельный этап в Deep Research, так как оно проводит обширные автоматизированные рассуждения по всему материалу, собранному в ходе исследовательской фазы. Токены рассуждений здесь немного отличаются от CoTs в ответе — это токены, которые мы используем для рассуждений по исследовательскому материалу перед генерацией результатов через CoTs. Токены рассуждений оцениваются в $3 за 1 миллион токенов.

Входные данные:

191 ₽ / 1M

Текст

Исходящие данные:

764 ₽ / 1M

Текст

Контекст:

128K

Входящие токены за 1M:

191 ₽

Исходящие токены за 1M:

764 ₽

Чат Детали

YandexGPT Pro 5

Yandex

33K

Флагманская генеративная нейросеть нового поколения от Яндекса, представленная в феврале 2025 года. Компания позиционирует её как модель мирового уровня

Входные данные:

1528 ₽ / 1M

Текст

Исходящие данные:

1528 ₽ / 1M

Текст

Контекст:

33K

Входящие токены за 1M:

1528 ₽

Исходящие токены за 1M:

1528 ₽

Чат Детали

YandexGPT Lite 5

Yandex

33K

Это облегчённая версия языковой модели пятого поколения, ориентированная на быстрый отклик и массовые сценарии использования.

Входные данные:

255 ₽ / 1M

Текст

Исходящие данные:

255 ₽ / 1M

Текст

Контекст:

33K

Входящие токены за 1M:

255 ₽

Исходящие токены за 1M:

255 ₽

Чат Детали

Mistral Saba

Mistral AI

33K

Mistral Saba — это языковая модель с 24 миллиардами параметров, специально разработанная для Ближнего Востока и Южной Азии, обеспечивающая точные и контекстуально релевантные ответы при сохранении эффективной производительности. Обученная на тщательно отобранных региональных наборах данных, она поддерживает несколько языков индийского происхождения, включая тамильский и малаялам, а также арабский. Это делает её универсальным вариантом для различных региональных и многоязычных приложений. Подробнее читайте в блоге здесь

Входные данные:

19 ₽ / 1M

Текст

Файл

Исходящие данные:

57 ₽ / 1M

Текст

Контекст:

33K

Входящие токены за 1M:

19 ₽

Исходящие токены за 1M:

57 ₽

Чат Детали

Llama Guard 3 8B

Meta Llama

131K

Llama Guard 3 — это предварительно обученная модель Llama-3.1-8B, доработанная для классификации безопасности контента. Подобно предыдущим версиям, она может использоваться для классификации контента как во входных данных LLM (классификация запросов), так и в ответах LLM (классификация ответов). Она функционирует как LLM — генерирует текст на выходе, указывающий, безопасен ли данный запрос или ответ, и если небезопасен, также перечисляет нарушенные категории контента.

Llama Guard 3 была настроена для защиты от стандартизированной таксономии опасностей MLCommons и разработана для поддержки возможностей Llama 3.1. В частности, она обеспечивает модерацию контента на 8 языках и была оптимизирована для обеспечения безопасности и защиты при вызовах инструментов поиска и интерпретатора кода.

Входные данные:

46 ₽ / 1M

Текст

Исходящие данные:

2,87 ₽ / 1M

Текст

Контекст:

131K

Входящие токены за 1M:

46 ₽

Исходящие токены за 1M:

2,87 ₽

Чат Детали

OpenAI o3 Mini High

OpenAI

200K

OpenAI o3-mini-high — это та же модель, что и o3-mini, но с установленным высоким уровнем усилий на рассуждение.

o3-mini — это экономичная языковая модель, оптимизированная для задач рассуждения в области STEM, особенно преуспевающая в науке, математике и программировании. Модель имеет три уровня регулируемых усилий на рассуждение и поддерживает ключевые возможности для разработчиков, включая вызов функций, структурированные выходные данные и потоковую передачу, хотя она не включает возможности обработки изображений.

Модель демонстрирует значительные улучшения по сравнению с предшественником: эксперты-тестировщики предпочитают её ответы в 56% случаев и отмечают снижение крупных ошибок на сложных вопросах на 39%. При средних настройках усилий на рассуждение o3-mini соответствует производительности более крупной модели o1 на сложных оценках рассуждений, таких как AIME и GPQA, при этом сохраняя более низкую задержку и стоимость.

Входные данные:

105 ₽ / 1M

Текст

Файл

Исходящие данные:

420 ₽ / 1M

Текст

Контекст:

200K

Входящие токены за 1M:

105 ₽

Исходящие токены за 1M:

420 ₽

Чат Детали

AionLabs Aion-1.0

Aion Labs

131K

Aion-1.0 — это мультимодельная система, разработанная для высокой производительности в различных задачах, включая рассуждение и кодирование. Она построена на базе DeepSeek-R1, дополненной дополнительными моделями и техниками, такими как Tree of Thoughts (ToT) и Mixture of Experts (MoE). Это самая мощная модель для рассуждений от Aion Lab.

Входные данные:

382 ₽ / 1M

Текст

Исходящие данные:

764 ₽ / 1M

Текст

Контекст:

131K

Входящие токены за 1M:

382 ₽

Исходящие токены за 1M:

764 ₽

Чат Детали

AionLabs Aion-1.0-Mini

Aion Labs

131K

Модель Aion-1.0-Mini с 32 миллиардами параметров является упрощенной версией модели DeepSeek-R1, разработанной для высокой производительности в областях, требующих логического мышления, таких как математика, программирование и логика. Это модифицированный вариант модели FuseAI, который превосходит R1-Distill-Qwen-32B и R1-Distill-Llama-70B, с результатами тестов, доступными на странице Hugging Face, которые были независимо воспроизведены для проверки.

Входные данные:

66 ₽ / 1M

Текст

Исходящие данные:

133 ₽ / 1M

Текст

Контекст:

131K

Входящие токены за 1M:

66 ₽

Исходящие токены за 1M:

133 ₽

Чат Детали

AionLabs Aion-RP 1.0 (8B)

Aion Labs

33K

Aion-RP-Llama-3.1-8B занимает первое место в части оценки персонажей в бенчмарке RPBench-Auto, который является специфическим для ролевых игр вариантом Arena-Hard-Auto, где LLM оценивают ответы друг друга. Это базовая модель с тонкой настройкой, а не модель с инструкциями, разработанная для создания более естественного и разнообразного письма.

Входные данные:

76 ₽ / 1M

Текст

Исходящие данные:

152 ₽ / 1M

Текст

Контекст:

33K

Входящие токены за 1M:

76 ₽

Исходящие токены за 1M:

152 ₽

Чат Детали

Qwen Qwen2.5 VL 72B Instruct

Qwen

131K

Qwen2.5-VL хорошо распознает распространенные объекты, такие как цветы, птицы, рыбы и насекомые. Он также обладает высокой способностью к анализу текстов, диаграмм, иконок, графики и макетов в изображениях.

Входные данные:

23 ₽ / 1M

Текст

Изображения

Исходящие данные:

71 ₽ / 1M

Текст

Контекст:

131K

Входящие токены за 1M:

23 ₽

Исходящие токены за 1M:

71 ₽

Чат Детали

Qwen Qwen-Plus

Qwen

Qwen-Plus, основанная на базовой модели Qwen2.5, представляет собой модель с контекстом 131K, которая сочетает в себе сбалансированную производительность, скорость и стоимость.

Входные данные:

24 ₽ / 1M

Текст

Исходящие данные:

74 ₽ / 1M

Текст

Контекст:

Входящие токены за 1M:

24 ₽

Исходящие токены за 1M:

74 ₽

Чат Детали

OpenAI o3 Mini

OpenAI

200K

OpenAI o3-mini — это экономичная языковая модель, оптимизированная для задач рассуждения в области STEM, особенно преуспевающая в науке, математике и программировании.

Эта модель поддерживает параметр reasoning_effort, который можно установить на “high”, “medium” или “low” для управления временем размышления модели. По умолчанию установлено значение “medium”.

Модель имеет три уровня усилий для рассуждений и поддерживает ключевые возможности для разработчиков, включая вызов функций, структурированные выводы и потоковую передачу, хотя не включает возможности обработки изображений.

Модель демонстрирует значительные улучшения по сравнению с предшественником: эксперты-тестировщики предпочитают её ответы в 56% случаев и отмечают снижение крупных ошибок на 39% при сложных вопросах. При средних настройках усилий для рассуждений o3-mini соответствует производительности более крупной модели o1 на сложных оценках рассуждений, таких как AIME и GPQA, при этом сохраняя более низкую задержку и стоимость.

Входные данные:

105 ₽ / 1M

Текст

Файл

Исходящие данные:

420 ₽ / 1M

Текст

Контекст:

200K

Входящие токены за 1M:

105 ₽

Исходящие токены за 1M:

420 ₽

Чат Детали

Mistral Mistral Small 3

Mistral AI

33K

Mistral Small 3 — это языковая модель с 24 миллиардами параметров, оптимизированная для работы с низкой задержкой в рамках общих задач ИИ. Выпущенная под лицензией Apache 2.0, она включает как предварительно обученные, так и настроенные на выполнение инструкций версии, предназначенные для эффективного локального развертывания.

Модель достигает 81% точности на бенчмарке MMLU и показывает конкурентоспособные результаты с более крупными моделями, такими как Llama 3.3 70B и Qwen 32B, при этом работая в три раза быстрее на эквивалентном оборудовании.

Входные данные:

4,78 ₽ / 1M

Текст

Исходящие данные:

7 ₽ / 1M

Текст

Контекст:

33K

Входящие токены за 1M:

4,78 ₽

Исходящие токены за 1M:

7 ₽

Чат Детали

DeepSeek R1 Distill Qwen 32B

DeepSeek

128K

DeepSeek R1 Distill Qwen 32B — это дистиллированная крупная языковая модель, основанная на Qwen 2.5 32B, использующая выходные данные от DeepSeek R1. Она превосходит o1-mini от OpenAI по различным критериям, достигая новых передовых результатов для плотных моделей.

Другие результаты тестов включают:

AIME 2024 pass@1: 72.6
MATH-500 pass@1: 94.3
Рейтинг CodeForces: 1691

Модель использует тонкую настройку на основе выходных данных DeepSeek R1, что позволяет ей демонстрировать конкурентоспособную производительность, сопоставимую с более крупными передовыми моделями.

Входные данные:

27 ₽ / 1M

Текст

Исходящие данные:

27 ₽ / 1M

Текст

Контекст:

128K

Входящие токены за 1M:

27 ₽

Исходящие токены за 1M:

27 ₽

Чат Детали