March 25, 2025
DeepSeek V3 完成一次小版本升級,現以 DeepSeek‑V3‑0324 命名。使用者可登入官網、App 或小程式,在對話介面關閉深度思考模式體驗新版。API 介面與使用方式維持不變。
對於不需要複雜推理的任務,DeepSeek 團隊建議使用全新 V3 模型,以獲得更流暢的互動體驗與更高的對話品質。
新版 V3 融合 DeepSeek‑R1 訓練中的強化學習技術,在推理類任務上有顯著提升;其在數學與程式設計相關評測中超越 GPT‑4.5。
在 HTML 與前端開發任務中,新版 V3 產生的程式碼更易用、視覺效果更佳且更具設計感。
在中文寫作任務上,新版 V3 基於 R1 進一步優化,特別著重於中長文內容品質的提升。
在聯網搜尋場景中,新版 V3 輸出更詳盡、準確,格式更清晰與美觀,特別適合報告生成類指令。
此外,新版 V3 在工具調用、角色扮演與一般問答對話方面也有明顯提升。
DeepSeek‑V3‑0324 與先前的 DeepSeek‑V3 使用相同底座,僅改進後訓練方式。私有化部署僅需更新 checkpoint 與 tokenizer_config.json(與工具調用相關的變更)。模型約 660B 參數;開源版提供 128K 脈絡長度(網頁版、App 與 API 為 64K)。
下載 V3‑0324 權重:
與 DeepSeek‑R1 一致,團隊之開源倉庫(含模型權重)皆採 MIT 授權,允許使用模型輸出並以蒸餾等方式訓練其他模型。
DeepSeek‑V3‑0324 代表 DeepSeek 旗艦模型的重要演進。結合 R1 的研發經驗並聚焦關鍵表現領域,團隊交付了更通用、強大且高效的 AI 系統,能在多樣任務中出色發揮。
無論是應用開發、內容創作,或使用 API 打造客製化解決方案,DeepSeek‑V3‑0324 在維持開源承諾的同時,實現效能與可用性的理想平衡。
「DeepSeek‑V3‑0324 的問世,展現團隊對開源 AI 邊界的持續探索;其效能足以與商業閉源方案抗衡,並在多項任務上實現超越。」
準備好體驗 DeepSeek‑V3‑0324 的最新升級了嗎?
立即使用 DeepSeek 線上聊天 →