4月24日,DeepSeek发布了全新一代模型DeepSeek-V4预览版,并同步开源。该模型具备百万字超长上下文,在Agent能力、世界知识和推理性能方面均达到国内与开源领域的领先水平。昇腾超节点全系列产品支持DeepSeek V4系列模型。

此次发布的DeepSeek-V4预览版包括Pro与Flash两大版本,均具备百万字上下文处理能力,打破了长文本处理的场景限制。新版本支持思考模式切换、Json输出、工具调用、对话前缀续写等企业级功能,FIM补全功能在非思考模式下也可正常使用,适用于开发、办公、法律、金融等复杂场景需求。

DeepSeek-V4按大小分为两个版本:DeepSeek-V4-Pro激活参数为49B,预训练数据33T,定位高性能旗舰;DeepSeek-V4-Flash激活参数13B,预训练数据32T,主打高速与低成本。

API服务信息也进行了更新,兼容OpenAI与Anthropic两大标准接口,开发者只需修改model_name即可快速调用。原有接口将在三个月后停用,现阶段自动映射至Flash版本以降低迁移成本。
定价体系上,DeepSeek-V4延续普惠路线。Flash版缓存命中输入每百万Token仅0.2元、未命中1元、输出2元;Pro版缓存命中1元、未命中12元、输出24元。受限于当前高端算力,Pro版服务吞吐有限,但随着下半年昇腾超节点全系列产品批量上市,价格有望大幅下调,进一步释放高性能AI的普惠空间。




