2026年4月24日,DeepSeek V4 预览版上线并同步开源。全网沸腾,股市震荡,我坐在电脑前刷了两个小时的消息,突然想跟你聊几句真心话。
引言
今天上午,DeepSeek V4 正式上线。
这件事我等了很久。不是因为我特别在意某一个模型版本,而是因为这件事本身,代表着一种趋势的临界点——它到来的那一刻,很多东西会加速变化。
本文分三部分:
- V4 到底更新了什么,搞清楚事实
- 这次发布背后,藏着哪些被低估的信号
- 作为一个在做内容和创业社区的普通人,我怎么看这件事
一、V4 到底更新了什么?
先说干货,把事实说清楚。
两个版本同步发布:
- DeepSeek-V4-Pro:旗舰版,总参数量达 1.6 万亿,采用混合专家架构(MoE),每次推理激活约 370 亿参数,推理成本与 V3 持平
- DeepSeek-V4-Flash:轻量版,2840 亿参数,更快、更便宜,适合高频 API 调用场景
两个版本共同特点:
- 上下文窗口达到 100 万 tokens——是上一代 128K 的近 8 倍
- 同步开源,可在 HuggingFace 和 ModelScope 下载
- API 接口已同步上线,改个 model_name 即可调用
性能方面的核心突破有三点:
第一,Agent 能力大幅跃升。 V4-Pro 在 Agentic Coding 评测中已达开源最佳,据 DeepSeek 内部反馈,使用体验优于 Sonnet 4.5,交付质量接近 Opus 4.6 非思考模式。换句话说:它已经可以做真正意义上的自主编程了。
第二,世界知识储量大幅扩展。 V4-Pro 在世界知识评测中大幅领先其他开源模型,仅稍逊于 Gemini-Pro-3.1。这意味着它作为"知识底座"的价值在大幅提升。
第三,推理性能比肩顶级闭源模型。 在数学、STEM、竞赛级代码评测中,V4-Pro 超越目前所有已公开评测的开源模型。在 MMLU-Pro 上,与 OpenAI GPT-5.4 相当。
现在你可以去 chat.deepseek.com 直接用上这个版本了。
二、三个被低估的信号
发布本身是新闻,但新闻背后的信号才是值得认真思考的东西。
信号一:DeepSeek 跳过了英伟达
这是这次发布里最值得单独拿出来说的一件事。
过去,AI 公司在发布新模型前,通常会把预发布版本交给英伟达和 AMD 进行测试和适配。但这一次,DeepSeek 没有给英伟达访问权限,而是优先将 V4 交给华为、寒武纪等国内芯片厂商进行早期测试和深度优化。
华为当天也公开确认:搭载昇腾 950 芯片的算力集群可以完整支持 V4 模型。
这不只是一个技术决定,这是一个态度宣言。
它告诉全球 AI 圈:国产大模型与国产算力的深度融合,已经不是"未来目标",而是正在发生的现实。V4 在国产硬件上的优化程度,可能已经达到了前所未有的高度。
当天 A 股市场的反应印证了这个判断——中芯国际涨超 8%,华虹半导体涨超 15%。
市场用真金白银,给出了它的判断。
信号二:DeepSeek 的第一次外部融资,正在发生
这件事的时机耐人寻味。
就在 V4 发布的前几天,据《The Information》报道,腾讯和阿里巴巴正在洽谈入股 DeepSeek,估值已从最初的百亿美元上调至逾 200 亿美元。
这对 DeepSeek 来说是一个巨大的转变。此前,创始人梁文锋一直对外部融资保持距离,担心资本介入会影响团队的技术独立性。
但现在,时代不一样了。
全球 AI 模型迭代速度在加快,算力成本在上升,核心人才的流动也在加剧(V4 的推迟,部分原因就是核心研究人员的离职)。DeepSeek 需要更稳固的资源支撑,来维系这台"技术机器"的运转。
更大的资本,意味着更大的野心——也意味着更大的压力。
这家公司,正在从一个"纯粹的开源 AI 实验室",向一个更复杂的商业实体演进。它的下一步怎么走,值得持续关注。
信号三:这次发布的时间节点,本身就是一条信息
V4 其实已经跳票了很长时间。原本计划今年春节期间发布,结果一拖再拖,直到今天才以"预览版"的形式上线。
推迟的原因有两个:一是与华为昇腾芯片的深度适配需要大量工程工作;二是部分核心研发人员的流动带来了人员断层。
但它还是来了。
而且是在今天——正好是全球 AI 竞争最激烈、市场期待最高的节点上。
V4 的发布,距离 R1 震惊世界已经过去了将近一年半。这一年半里,Alibaba、ByteDance、百度、OpenAI、Google……每一家都没有停下脚步。DeepSeek 面对的外部压力,比当初 R1 发布时要大得多。
在这种情况下,还能做出一个"预览版"都已经让同行们感受到压力的模型,说明这支团队的底层研发能力,依然是真实的。
三、一个做内容和创业社区的人,怎么看这件事?
说完事实和信号,来说说我自己的感受。
我做推敲星球已经一段时间了,每天打交道的是创业者、做内容的朋友、广告行业的人。最近两年,我们所处的这个行业,每隔几个月就会被一次 AI 发布给重新洗一遍牌桌。
DeepSeek V4 的发布,对我们这个群体意味着什么?
第一,AI 工具的能力上限,已经不是我们用不着担心的问题了。
V4-Pro 可以处理 100 万 token 的超长上下文。这意味着一整个项目的代码库、一整本书、一整套运营方案,可以被一个模型一次性"读完"并给出反馈。这种能力,不是锦上添花,而是会改变工作流的。
第二,开源这件事,正在重塑竞争格局。
DeepSeek 的开源策略,不是慈善,是战略。它把技术能力开放给全世界的开发者,让所有人都能基于它构建产品,反过来形成一个庞大的生态网络。这种策略的长期效果,我认为比很多闭源公司的商业化路径更扎实。
对我们做内容的人来说,这意味着——那些原来需要高昂 API 成本才能实现的 AI 辅助内容生产功能,会越来越便宜,越来越唾手可得。
第三,这条赛道的残酷性,不会因为工具变强而消失。
我经常对推敲星球的朋友们说一句话:AI 变强了,不代表用 AI 的人自动变强了。工具只是工具,决定输出质量的,始终是使用工具的人的判断力、审美和对用户的理解。
DeepSeek V4 可以写代码、可以做 Agent、可以处理超长文档——但它无法替你弄清楚你的用户到底需要什么,无法替你建立真实的信任关系,无法替你做出那些需要情感和价值观参与的决策。
这些,才是我们真正需要修炼的东西。
总结:三条带走的判断
- DeepSeek V4 是一次真实的技术跃升,开源+百万上下文+Agent 增强,三个维度同时推进,值得认真关注和使用
- 国产算力+国产大模型的绑定,正在加速,这是比技术参数更值得关注的战略信号
- AI 越强,"人的判断力"越值钱——这是我的核心判断,也是我做推敲星球的基本逻辑
V4 已经上线了,你打算第一个用它来做什么?
欢迎来评论区聊聊。