4 月 24 日消息:就在刚刚,官方终于宣布了「DeepSeek-V4」。
据DeepSeek微信公众号公布消息,DeepSeek-V4拥有百万字超长上下文,在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。
API服务已同步更新,通过修改model_name为deepseek-v4-pro或deepseek-v4-flash即可调用。
V4版本延续了DeepSeek效率优先的哲学,虽然总参数量高达1万亿,但每个token仅激活约370亿参数。这意味着其推理成本能与前代V3保持持平,这种极致的性价比设计一直是DeepSeek的核心竞争力。

据悉,DeepSeek V4将运行在华为最新的昇腾芯片上。
为了实现这一跨越,工程师们投入了大量精力解决芯片适配问题。他们不仅重写了核心代码,还完成了从英伟达CUDA生态向华为CANN架构的底层迁移。
这是一个重大的技术决策,更是一个极具冲击力的战略信号。DeepSeek此次并未给英伟达或AMD提供提前优化适配的机会,而是将早期访问权限独家开放给了国产芯片厂商。
