DeepSeek V4 今天正式发布：一个创业者视角的冷思考

2026年4月24日，DeepSeek V4 预览版上线并同步开源。全网沸腾，股市震荡，我坐在电脑前刷了两个小时的消息，突然想跟你聊几句真心话。

引言

今天上午，DeepSeek V4 正式上线。

这件事我等了很久。不是因为我特别在意某一个模型版本，而是因为这件事本身，代表着一种趋势的临界点——它到来的那一刻，很多东西会加速变化。

本文分三部分：

V4 到底更新了什么，搞清楚事实
这次发布背后，藏着哪些被低估的信号
作为一个在做内容和创业社区的普通人，我怎么看这件事

一、V4 到底更新了什么？

先说干货，把事实说清楚。

两个版本同步发布：

DeepSeek-V4-Pro：旗舰版，总参数量达 1.6 万亿，采用混合专家架构（MoE），每次推理激活约 370 亿参数，推理成本与 V3 持平
DeepSeek-V4-Flash：轻量版，2840 亿参数，更快、更便宜，适合高频 API 调用场景

两个版本共同特点：

上下文窗口达到 100 万 tokens——是上一代 128K 的近 8 倍
同步开源，可在 HuggingFace 和 ModelScope 下载
API 接口已同步上线，改个 model_name 即可调用

性能方面的核心突破有三点：

第一，Agent 能力大幅跃升。 V4-Pro 在 Agentic Coding 评测中已达开源最佳，据 DeepSeek 内部反馈，使用体验优于 Sonnet 4.5，交付质量接近 Opus 4.6 非思考模式。换句话说：它已经可以做真正意义上的自主编程了。

第二，世界知识储量大幅扩展。 V4-Pro 在世界知识评测中大幅领先其他开源模型，仅稍逊于 Gemini-Pro-3.1。这意味着它作为"知识底座"的价值在大幅提升。

第三，推理性能比肩顶级闭源模型。 在数学、STEM、竞赛级代码评测中，V4-Pro 超越目前所有已公开评测的开源模型。在 MMLU-Pro 上，与 OpenAI GPT-5.4 相当。

现在你可以去 chat.deepseek.com 直接用上这个版本了。

二、三个被低估的信号

发布本身是新闻，但新闻背后的信号才是值得认真思考的东西。

信号一：DeepSeek 跳过了英伟达

这是这次发布里最值得单独拿出来说的一件事。

过去，AI 公司在发布新模型前，通常会把预发布版本交给英伟达和 AMD 进行测试和适配。但这一次，DeepSeek 没有给英伟达访问权限，而是优先将 V4 交给华为、寒武纪等国内芯片厂商进行早期测试和深度优化。

华为当天也公开确认：搭载昇腾 950 芯片的算力集群可以完整支持 V4 模型。

这不只是一个技术决定，这是一个态度宣言。

它告诉全球 AI 圈：国产大模型与国产算力的深度融合，已经不是"未来目标"，而是正在发生的现实。V4 在国产硬件上的优化程度，可能已经达到了前所未有的高度。

当天 A 股市场的反应印证了这个判断——中芯国际涨超 8%，华虹半导体涨超 15%。

市场用真金白银，给出了它的判断。

信号二：DeepSeek 的第一次外部融资，正在发生

这件事的时机耐人寻味。

就在 V4 发布的前几天，据《The Information》报道，腾讯和阿里巴巴正在洽谈入股 DeepSeek，估值已从最初的百亿美元上调至逾 200 亿美元。

这对 DeepSeek 来说是一个巨大的转变。此前，创始人梁文锋一直对外部融资保持距离，担心资本介入会影响团队的技术独立性。

但现在，时代不一样了。

全球 AI 模型迭代速度在加快，算力成本在上升，核心人才的流动也在加剧（V4 的推迟，部分原因就是核心研究人员的离职）。DeepSeek 需要更稳固的资源支撑，来维系这台"技术机器"的运转。

更大的资本，意味着更大的野心——也意味着更大的压力。

这家公司，正在从一个"纯粹的开源 AI 实验室"，向一个更复杂的商业实体演进。它的下一步怎么走，值得持续关注。

信号三：这次发布的时间节点，本身就是一条信息

V4 其实已经跳票了很长时间。原本计划今年春节期间发布，结果一拖再拖，直到今天才以"预览版"的形式上线。

推迟的原因有两个：一是与华为昇腾芯片的深度适配需要大量工程工作；二是部分核心研发人员的流动带来了人员断层。

但它还是来了。

而且是在今天——正好是全球 AI 竞争最激烈、市场期待最高的节点上。

V4 的发布，距离 R1 震惊世界已经过去了将近一年半。这一年半里，Alibaba、ByteDance、百度、OpenAI、Google……每一家都没有停下脚步。DeepSeek 面对的外部压力，比当初 R1 发布时要大得多。

在这种情况下，还能做出一个"预览版"都已经让同行们感受到压力的模型，说明这支团队的底层研发能力，依然是真实的。

三、一个做内容和创业社区的人，怎么看这件事？

说完事实和信号，来说说我自己的感受。

我做推敲星球已经一段时间了，每天打交道的是创业者、做内容的朋友、广告行业的人。最近两年，我们所处的这个行业，每隔几个月就会被一次 AI 发布给重新洗一遍牌桌。

DeepSeek V4 的发布，对我们这个群体意味着什么？

第一，AI 工具的能力上限，已经不是我们用不着担心的问题了。

V4-Pro 可以处理 100 万 token 的超长上下文。这意味着一整个项目的代码库、一整本书、一整套运营方案，可以被一个模型一次性"读完"并给出反馈。这种能力，不是锦上添花，而是会改变工作流的。

第二，开源这件事，正在重塑竞争格局。

DeepSeek 的开源策略，不是慈善，是战略。它把技术能力开放给全世界的开发者，让所有人都能基于它构建产品，反过来形成一个庞大的生态网络。这种策略的长期效果，我认为比很多闭源公司的商业化路径更扎实。

对我们做内容的人来说，这意味着——那些原来需要高昂 API 成本才能实现的 AI 辅助内容生产功能，会越来越便宜，越来越唾手可得。

第三，这条赛道的残酷性，不会因为工具变强而消失。

我经常对推敲星球的朋友们说一句话：AI 变强了，不代表用 AI 的人自动变强了。工具只是工具，决定输出质量的，始终是使用工具的人的判断力、审美和对用户的理解。

DeepSeek V4 可以写代码、可以做 Agent、可以处理超长文档——但它无法替你弄清楚你的用户到底需要什么，无法替你建立真实的信任关系，无法替你做出那些需要情感和价值观参与的决策。

这些，才是我们真正需要修炼的东西。

总结：三条带走的判断

DeepSeek V4 是一次真实的技术跃升，开源+百万上下文+Agent 增强，三个维度同时推进，值得认真关注和使用
国产算力+国产大模型的绑定，正在加速，这是比技术参数更值得关注的战略信号
AI 越强，"人的判断力"越值钱——这是我的核心判断，也是我做推敲星球的基本逻辑

V4 已经上线了，你打算第一个用它来做什么？

欢迎来评论区聊聊。

{{userData.name}}已认证