DeepSeek V3.1 是中國 AI 公司 DeepSeek(深度求索)於 2025 年 8 月 19 日發布的最新開源大語言模型。這是基於原始 DeepSeek V3 的增量升級版本,主要改進包括擴展的上下文視窗和增強的推理能力。
透過多個平台和服務訪問 DeepSeek V3.1
官方平台
官方渠道,註冊僅需中國手機號碼,使用量大,可能會有服務不穩定的情況
HuggingFace Space
透過 HuggingFace Space 在線免費使用 DeepSeek V3.1,同時支援使用您自己的 API 金鑰
我們的平台
在我們的平台上,免費在線使用 DeepSeek V3.1 & DeepSeek-V3 671B 完整版本。
DeepSeek V3.1 是一個革命性的 AI 模型,基於原始 V3 進行了重要升級。它擁有 671B 總參數,每個 token 37B 激活參數,支援 128K 上下文長度,並將深度推理能力直接整合到主模型中。
V3.1 在數學推理、前端編程、中文寫作等方面顯示出顯著改進,無需手動切換推理模式,提供更統一和流暢的用戶體驗。該模型特別適合長文檔分析、代碼開發、教育輔導和其他應用場景。
探索讓 DeepSeek V3.1 成為最新開源 AI 模型領導者的創新功能
支援高達 128K 令牌的上下文輸入,高效處理長文檔、多輪對話和大型代碼庫。
將深度推理能力直接整合到主模型中,無需手動切換,自動決定是否啟動思考過程。
在數學推理、前端編程、中文寫作等方面顯示顯著改進,生成更美觀和可執行的代碼。
具有 671B 總參數,每個令牌 37B 激活參數,基於創新的 Mixture-of-Experts 架構。
支援 100+ 語言,特別在亞洲語言和少數民族語言方面表現出色,適合全球使用。
採用 MIT 許可證,完全開放模型權重和技術報告,支援商業使用和修改。
了解研究人員和開發者如何利用 DeepSeek V3.1 的能力
在複雜推理和代碼生成方面表現出色
在成本和性能之間提供最佳平衡
開源生態和學術研究的重要貢獻
新版本支援高達 128K 令牌的上下文輸入,高效處理長文檔、多輪對話和大型代碼庫。
V3.1 具有更長的上下文,推理能力也整合在主模型中。與 V3 相比,結構化輸出更好,表格/列表生成能力更強;與 R1 相比,更通用且回應更快,適合常規場景。
V3.1 已優化生成內容的準確性,與之前版本相比顯示顯著改進,但重要結論仍需要手動審查。
支援 100+ 語言,特別在亞洲語言和少數民族語言方面表現出色,適合全球使用。
適合前端開發、科學推理、文檔撰寫、教育輔導和其他複雜場景。
支援通過支付寶和微信在線充值(企業可進行企業轉賬),賬戶餘額不會過期,發票開具週期約 7 個工作日。
用戶級別沒有嚴格的並發限制,系統會根據當前負載動態限制速度。如果遇到 503 或 429 錯誤,可能是高峰時期的自動限制。
網頁版本使用默認流式輸出(生成時顯示),API 默認非流式(生成完成後返回內容),用戶可以手動設置 API 支援流式以獲得優化體驗。
官方建議使用適當的工具/腳本進行離線統計,便於計算和成本管理。
大多數用戶認為編程和推理能力顯著提升,生成的結果更結構化;一些用戶反饋模型風格比之前版本更「學術化」且不那麼「自然」。偶爾有服務器負載問題導致回應延遲,以及偶爾的輸出幻覺現象。