Скопировано в буфер обмена!
Qwen3-235B-A22B-Thinking-2507 — это высокопроизводительная языковая модель типа Mixture-of-Experts (MoE) с открытым весом, оптимизированная для сложных задач рассуждения. Она активирует 22 миллиарда из своих 235 миллиардов параметров за один проход и изначально поддерживает до 262 144 токенов контекста. Этот вариант, предназначенный исключительно для «мышления», улучшает структурированное логическое рассуждение, математику, науку и генерацию длинных текстов, демонстрируя высокие результаты в тестах AIME, SuperGPQA, LiveCodeBench и MMLU-Redux. Он включает специальный режим рассуждения (</think>) и разработан для вывода с высоким количеством токенов (до 81 920 токенов) в сложных областях.
Модель настроена на выполнение инструкций и превосходно справляется с пошаговым рассуждением, использованием инструментов, агентными рабочими процессами и многоязычными задачами. Этот выпуск представляет собой самую мощную открытую версию в серии Qwen3-235B, превосходя многие закрытые модели в случаях использования структурированного рассуждения.