Загрузка...

Каталог AI моделей и нейросетей: сравнение и цены

Каталог нейросетей с описанием возможностей и ценами в рублях. Сравните стоимость токенов и выберите лучшее решение.

Показать фильтр
Разработчики
Показать все (69)
Входные данные
Исходящие данные
Поддерживаемые параметры
Показать все (18)
Скопировано в буфер обмена!
Perplexity
200K

Для предприятий, ищущих более продвинутые возможности, API Sonar Pro может обрабатывать углубленные, многошаговые запросы с дополнительной расширяемостью, например, вдвое большее количество ссылок на один поиск по сравнению с Sonar в среднем. Кроме того, благодаря большему контекстному окну, он может обрабатывать более длинные и сложные поисковые запросы и последующие вопросы. Примечание: Цены на Sonar Pro включают цены на поиск Perplexity. См. подробности здесь.

Входные данные:
286 ₽ / 1M
Текст
Изображения
Исходящие данные:
1432 ₽ / 1M
Текст
Контекст:
200K
Входящие токены за 1M:
286 ₽
Исходящие токены за 1M:
1432 ₽
Скопировано в буфер обмена!
Perplexity
128K

Sonar Deep Research — это модель, ориентированная на исследования, разработанная для многоэтапного поиска, синтеза и рассуждений по сложным темам. Она автономно ищет, читает и оценивает источники, совершенствуя свой подход по мере сбора информации. Это позволяет создавать всесторонние отчеты в таких областях, как финансы, технологии, здравоохранение и текущие события.

Примечания по ценообразованию - Входные токены состоят из токенов запроса (запрос пользователя) + токенов цитирования (это обработанные токены из выполняемых поисков) - Deep Research выполняет множество поисков для проведения исчерпывающих исследований. Поиски оцениваются в $5 за 1000 поисков. - Рассуждение — это отдельный этап в Deep Research, так как оно проводит обширные автоматизированные рассуждения по всему материалу, собранному в ходе исследовательской фазы. Токены рассуждений здесь немного отличаются от CoTs в ответе — это токены, которые мы используем для рассуждений по исследовательскому материалу перед генерацией результатов через CoTs. Токены рассуждений оцениваются в $3 за 1 миллион токенов.

Входные данные:
191 ₽ / 1M
Текст
Исходящие данные:
764 ₽ / 1M
Текст
Контекст:
128K
Входящие токены за 1M:
191 ₽
Исходящие токены за 1M:
764 ₽
Скопировано в буфер обмена!
Yandex
33K

Флагманская генеративная нейросеть нового поколения от Яндекса, представленная в феврале 2025 года. Компания позиционирует её как модель мирового уровня

Входные данные:
1528 ₽ / 1M
Текст
Исходящие данные:
1528 ₽ / 1M
Текст
Контекст:
33K
Входящие токены за 1M:
1528 ₽
Исходящие токены за 1M:
1528 ₽
Скопировано в буфер обмена!
Yandex
33K

Это облегчённая версия языковой модели пятого поколения, ориентированная на быстрый отклик и массовые сценарии использования.

Входные данные:
255 ₽ / 1M
Текст
Исходящие данные:
255 ₽ / 1M
Текст
Контекст:
33K
Входящие токены за 1M:
255 ₽
Исходящие токены за 1M:
255 ₽
Скопировано в буфер обмена!
Mistral AI
33K

Mistral Saba — это языковая модель с 24 миллиардами параметров, специально разработанная для Ближнего Востока и Южной Азии, обеспечивающая точные и контекстуально релевантные ответы при сохранении эффективной производительности. Обученная на тщательно отобранных региональных наборах данных, она поддерживает несколько языков индийского происхождения, включая тамильский и малаялам, а также арабский. Это делает её универсальным вариантом для различных региональных и многоязычных приложений. Подробнее читайте в блоге здесь

Входные данные:
19 ₽ / 1M
Текст
Файл
Исходящие данные:
57 ₽ / 1M
Текст
Контекст:
33K
Входящие токены за 1M:
19 ₽
Исходящие токены за 1M:
57 ₽
Скопировано в буфер обмена!
Meta Llama
131K

Llama Guard 3 — это предварительно обученная модель Llama-3.1-8B, доработанная для классификации безопасности контента. Подобно предыдущим версиям, она может использоваться для классификации контента как во входных данных LLM (классификация запросов), так и в ответах LLM (классификация ответов). Она функционирует как LLM — генерирует текст на выходе, указывающий, безопасен ли данный запрос или ответ, и если небезопасен, также перечисляет нарушенные категории контента.

Llama Guard 3 была настроена для защиты от стандартизированной таксономии опасностей MLCommons и разработана для поддержки возможностей Llama 3.1. В частности, она обеспечивает модерацию контента на 8 языках и была оптимизирована для обеспечения безопасности и защиты при вызовах инструментов поиска и интерпретатора кода.

Входные данные:
46 ₽ / 1M
Текст
Исходящие данные:
2,87 ₽ / 1M
Текст
Контекст:
131K
Входящие токены за 1M:
46 ₽
Исходящие токены за 1M:
2,87 ₽
Скопировано в буфер обмена!
OpenAI
200K

OpenAI o3-mini-high — это та же модель, что и o3-mini, но с установленным высоким уровнем усилий на рассуждение.

o3-mini — это экономичная языковая модель, оптимизированная для задач рассуждения в области STEM, особенно преуспевающая в науке, математике и программировании. Модель имеет три уровня регулируемых усилий на рассуждение и поддерживает ключевые возможности для разработчиков, включая вызов функций, структурированные выходные данные и потоковую передачу, хотя она не включает возможности обработки изображений.

Модель демонстрирует значительные улучшения по сравнению с предшественником: эксперты-тестировщики предпочитают её ответы в 56% случаев и отмечают снижение крупных ошибок на сложных вопросах на 39%. При средних настройках усилий на рассуждение o3-mini соответствует производительности более крупной модели o1 на сложных оценках рассуждений, таких как AIME и GPQA, при этом сохраняя более низкую задержку и стоимость.

Входные данные:
105 ₽ / 1M
Текст
Файл
Исходящие данные:
420 ₽ / 1M
Текст
Контекст:
200K
Входящие токены за 1M:
105 ₽
Исходящие токены за 1M:
420 ₽
Скопировано в буфер обмена!
Aion Labs
131K

Aion-1.0 — это мультимодельная система, разработанная для высокой производительности в различных задачах, включая рассуждение и кодирование. Она построена на базе DeepSeek-R1, дополненной дополнительными моделями и техниками, такими как Tree of Thoughts (ToT) и Mixture of Experts (MoE). Это самая мощная модель для рассуждений от Aion Lab.

Входные данные:
382 ₽ / 1M
Текст
Исходящие данные:
764 ₽ / 1M
Текст
Контекст:
131K
Входящие токены за 1M:
382 ₽
Исходящие токены за 1M:
764 ₽
Скопировано в буфер обмена!
Aion Labs
131K

Модель Aion-1.0-Mini с 32 миллиардами параметров является упрощенной версией модели DeepSeek-R1, разработанной для высокой производительности в областях, требующих логического мышления, таких как математика, программирование и логика. Это модифицированный вариант модели FuseAI, который превосходит R1-Distill-Qwen-32B и R1-Distill-Llama-70B, с результатами тестов, доступными на странице Hugging Face, которые были независимо воспроизведены для проверки.

Входные данные:
66 ₽ / 1M
Текст
Исходящие данные:
133 ₽ / 1M
Текст
Контекст:
131K
Входящие токены за 1M:
66 ₽
Исходящие токены за 1M:
133 ₽
Скопировано в буфер обмена!
Aion Labs
33K

Aion-RP-Llama-3.1-8B занимает первое место в части оценки персонажей в бенчмарке RPBench-Auto, который является специфическим для ролевых игр вариантом Arena-Hard-Auto, где LLM оценивают ответы друг друга. Это базовая модель с тонкой настройкой, а не модель с инструкциями, разработанная для создания более естественного и разнообразного письма.

Входные данные:
76 ₽ / 1M
Текст
Исходящие данные:
152 ₽ / 1M
Текст
Контекст:
33K
Входящие токены за 1M:
76 ₽
Исходящие токены за 1M:
152 ₽
Скопировано в буфер обмена!
Qwen
131K

Qwen2.5-VL хорошо распознает распространенные объекты, такие как цветы, птицы, рыбы и насекомые. Он также обладает высокой способностью к анализу текстов, диаграмм, иконок, графики и макетов в изображениях.

Входные данные:
23 ₽ / 1M
Текст
Изображения
Исходящие данные:
71 ₽ / 1M
Текст
Контекст:
131K
Входящие токены за 1M:
23 ₽
Исходящие токены за 1M:
71 ₽
Скопировано в буфер обмена!
Qwen
1M

Qwen-Plus, основанная на базовой модели Qwen2.5, представляет собой модель с контекстом 131K, которая сочетает в себе сбалансированную производительность, скорость и стоимость.

Входные данные:
24 ₽ / 1M
Текст
Исходящие данные:
74 ₽ / 1M
Текст
Контекст:
1M
Входящие токены за 1M:
24 ₽
Исходящие токены за 1M:
74 ₽
Скопировано в буфер обмена!
OpenAI
200K

OpenAI o3-mini — это экономичная языковая модель, оптимизированная для задач рассуждения в области STEM, особенно преуспевающая в науке, математике и программировании.

Эта модель поддерживает параметр reasoning_effort, который можно установить на “high”, “medium” или “low” для управления временем размышления модели. По умолчанию установлено значение “medium”.

Модель имеет три уровня усилий для рассуждений и поддерживает ключевые возможности для разработчиков, включая вызов функций, структурированные выводы и потоковую передачу, хотя не включает возможности обработки изображений.

Модель демонстрирует значительные улучшения по сравнению с предшественником: эксперты-тестировщики предпочитают её ответы в 56% случаев и отмечают снижение крупных ошибок на 39% при сложных вопросах. При средних настройках усилий для рассуждений o3-mini соответствует производительности более крупной модели o1 на сложных оценках рассуждений, таких как AIME и GPQA, при этом сохраняя более низкую задержку и стоимость.

Входные данные:
105 ₽ / 1M
Текст
Файл
Исходящие данные:
420 ₽ / 1M
Текст
Контекст:
200K
Входящие токены за 1M:
105 ₽
Исходящие токены за 1M:
420 ₽
Скопировано в буфер обмена!
Mistral AI
33K

Mistral Small 3 — это языковая модель с 24 миллиардами параметров, оптимизированная для работы с низкой задержкой в рамках общих задач ИИ. Выпущенная под лицензией Apache 2.0, она включает как предварительно обученные, так и настроенные на выполнение инструкций версии, предназначенные для эффективного локального развертывания.

Модель достигает 81% точности на бенчмарке MMLU и показывает конкурентоспособные результаты с более крупными моделями, такими как Llama 3.3 70B и Qwen 32B, при этом работая в три раза быстрее на эквивалентном оборудовании.

Входные данные:
4,78 ₽ / 1M
Текст
Исходящие данные:
7 ₽ / 1M
Текст
Контекст:
33K
Входящие токены за 1M:
4,78 ₽
Исходящие токены за 1M:
7 ₽
Скопировано в буфер обмена!
DeepSeek
128K

DeepSeek R1 Distill Qwen 32B — это дистиллированная крупная языковая модель, основанная на Qwen 2.5 32B, использующая выходные данные от DeepSeek R1. Она превосходит o1-mini от OpenAI по различным критериям, достигая новых передовых результатов для плотных моделей.

Другие результаты тестов включают:

  • AIME 2024 pass@1: 72.6
  • MATH-500 pass@1: 94.3
  • Рейтинг CodeForces: 1691

Модель использует тонкую настройку на основе выходных данных DeepSeek R1, что позволяет ей демонстрировать конкурентоспособную производительность, сопоставимую с более крупными передовыми моделями.

Входные данные:
27 ₽ / 1M
Текст
Исходящие данные:
27 ₽ / 1M
Текст
Контекст:
128K
Входящие токены за 1M:
27 ₽
Исходящие токены за 1M:
27 ₽