DeepSeek V3.1 - это последняя модель большого языка с открытым исходным кодом, выпущенная китайской компанией ИИ DeepSeek (DeepSeek) 19 августа 2025 года. Это инкрементная версия обновления на основе оригинального DeepSeek V3, с основными улучшениями, включающими расширенное окно контекста и улучшенные возможности рассуждения.
Получите доступ к DeepSeek V3.1 через несколько платформ и сервисов
Официальная платформа
Официальный канал, регистрация требует только китайский номер телефона, высокий объем использования, могут быть случаи нестабильности сервиса
HuggingFace Space
Используйте DeepSeek V3.1 онлайн бесплатно через HuggingFace Space, поддерживая использование вашего собственного API-ключа
Наша платформа
На нашей платформе используйте DeepSeek V3.1 & DeepSeek-V3 671B полную версию онлайн бесплатно.
Интеграция API
Интегрируйте API DeepSeek V3.1 в ваши приложения. Регистрация с номером телефона дает 14 юаней бесплатного кредита
Локальное развертывание
Получите доступ к весам модели и исходному коду на GitHub для самостоятельного развертывания
Документация API
Просмотр полной документации API, руководств по интеграции и примеров кода
DeepSeek V3.1 - это революционная модель ИИ с важными обновлениями на основе оригинального V3. Она имеет 671B общих параметров, 37B активированных параметров на токен, поддерживает длину контекста 128K и интегрирует глубокие возможности рассуждения непосредственно в основную модель.
V3.1 показывает значительные улучшения в математическом рассуждении, фронтенд-программировании, китайской письменности и т.д., не требуя ручного переключения режимов рассуждения, обеспечивая более унифицированный и плавный пользовательский опыт. Модель особенно подходит для анализа длинных документов, разработки кода, образовательного репетиторства и других сценариев применения.
Исследуйте инновационные возможности, которые делают DeepSeek V3.1 лидером последних моделей ИИ с открытым исходным кодом
Поддерживает ввод контекста до 128K токенов, эффективно обрабатывая длинные документы, многоходовые разговоры и большие кодовые базы.
Интегрирует глубокие возможности рассуждения непосредственно в основную модель без ручного переключения, автоматически определяя, следует ли запускать процесс мышления.
Значительные улучшения в математическом рассуждении, фронтенд-программировании, китайской письменности и т.д., генерируя более красивый и исполняемый код.
Характеризуется 671B общими параметрами с 37B активированными параметрами на токен, основанными на инновационной архитектуре Mixture-of-Experts.
Поддерживает 100+ языков, особенно преуспевая в азиатских и языках меньшинств, подходит для глобального использования.
Принимает лицензию MIT, полностью открывая веса модели и технические отчеты, поддерживая коммерческое использование и модификацию.
Узнайте, как исследователи и разработчики используют возможности DeepSeek V3.1
Превосходит в сложном рассуждении и генерации кода
Обеспечивает оптимальный баланс между стоимостью и производительностью
Важный вклад в экосистему с открытым исходным кодом и академические исследования
Новая версия поддерживает ввод контекста до 128K токенов, эффективно обрабатывая длинные документы, многоходовые разговоры и большие кодовые базы.
V3.1 имеет более длинный контекст, и возможности рассуждения также интегрированы в основную модель. По сравнению с V3, структурированный вывод лучше, возможности генерации таблиц/списков сильнее; по сравнению с R1, он более универсален и отвечает быстрее, подходит для обычных сценариев.
V3.1 оптимизировал точность генерируемого контента, показывая значительное улучшение по сравнению с предыдущими версиями, но все еще требует ручной проверки для важных выводов.
Поддерживает 100+ языков, особенно преуспевая в азиатских и языках меньшинств, подходит для глобального использования.
Подходит для фронтенд-разработки, научного рассуждения, написания документов, образовательного репетиторства и других сложных сценариев.
Поддерживает онлайн-пополнения через Alipay и WeChat (предприятия могут делать корпоративные переводы), баланс счета не истекает, цикл выдачи счетов составляет примерно 7 рабочих дней.
Нет жестких ограничений одновременности на уровне пользователя, система будет динамически ограничивать скорость на основе текущей нагрузки. Если вы столкнетесь с ошибками 503 или 429, это может быть автоматическое ограничение во время пиковых периодов.
Веб-версия использует стандартный потоковый вывод (показ во время генерации), API по умолчанию не-потоковый (возврат содержимого после завершения генерации), пользователи могут вручную настроить API для поддержки потоковой передачи для оптимизированного опыта.
Официальная рекомендация - использовать соответствующие инструменты/скрипты для автономной статистики, удобно для расчета и управления затратами.
Большинство пользователей считают, что возможности кодирования и рассуждения значительно улучшились, сгенерированные результаты более структурированы; некоторые пользователи предоставляют отзывы, что стиль модели более 'академический' и менее 'естественный', чем предыдущие версии. Иногда возникают проблемы с нагрузкой сервера, вызывающие задержки ответа, и случайные явления галлюцинации вывода.