Скопировано в буфер обмена!
DeepSeek-V3.1 Terminus — это обновление для DeepSeek V3.1, которое сохраняет изначальные возможности модели, устраняя при этом проблемы, о которых сообщали пользователи, включая языковую согласованность и возможности агентов, и дополнительно оптимизирует производительность модели в кодировании и поисковых агентах. Это крупная гибридная модель рассуждений (671 миллиард параметров, 37 миллиардов активных), поддерживающая как режимы мышления, так и немышления. Она расширяет базу DeepSeek-V3 с помощью двухфазного процесса обучения с длинным контекстом, достигая до 128 тысяч токенов, и использует FP8 микромасштабирование для эффективного вывода. Пользователи могут управлять поведением рассуждений с помощью булевой переменной reasoning enabled.
Модель улучшает использование инструментов, генерацию кода и эффективность рассуждений, достигая производительности, сопоставимой с DeepSeek-R1 на сложных тестах, при этом отвечая быстрее. Она поддерживает структурированные вызовы инструментов, кодовые агенты и поисковые агенты, что делает её подходящей для исследований, кодирования и агентных рабочих процессов.