DeepSeek V4 今天正式发布:一个创业者视角的冷思考

2026年4月24日,DeepSeek V4 预览版上线并同步开源。全网沸腾,股市震荡,我坐在电脑前刷了两个小时的消息,突然想跟你聊几句真心话。


引言

今天上午,DeepSeek V4 正式上线。

这件事我等了很久。不是因为我特别在意某一个模型版本,而是因为这件事本身,代表着一种趋势的临界点——它到来的那一刻,很多东西会加速变化。

本文分三部分:

  1. V4 到底更新了什么,搞清楚事实
  2. 这次发布背后,藏着哪些被低估的信号
  3. 作为一个在做内容和创业社区的普通人,我怎么看这件事

一、V4 到底更新了什么?

先说干货,把事实说清楚。

两个版本同步发布:

  • DeepSeek-V4-Pro:旗舰版,总参数量达 1.6 万亿,采用混合专家架构(MoE),每次推理激活约 370 亿参数,推理成本与 V3 持平
  • DeepSeek-V4-Flash:轻量版,2840 亿参数,更快、更便宜,适合高频 API 调用场景

两个版本共同特点:

  • 上下文窗口达到 100 万 tokens——是上一代 128K 的近 8 倍
  • 同步开源,可在 HuggingFace 和 ModelScope 下载
  • API 接口已同步上线,改个 model_name 即可调用

性能方面的核心突破有三点:

第一,Agent 能力大幅跃升。 V4-Pro 在 Agentic Coding 评测中已达开源最佳,据 DeepSeek 内部反馈,使用体验优于 Sonnet 4.5,交付质量接近 Opus 4.6 非思考模式。换句话说:它已经可以做真正意义上的自主编程了。

第二,世界知识储量大幅扩展。 V4-Pro 在世界知识评测中大幅领先其他开源模型,仅稍逊于 Gemini-Pro-3.1。这意味着它作为"知识底座"的价值在大幅提升。

第三,推理性能比肩顶级闭源模型。 在数学、STEM、竞赛级代码评测中,V4-Pro 超越目前所有已公开评测的开源模型。在 MMLU-Pro 上,与 OpenAI GPT-5.4 相当。

现在你可以去 chat.deepseek.com 直接用上这个版本了。


二、三个被低估的信号

发布本身是新闻,但新闻背后的信号才是值得认真思考的东西。

信号一:DeepSeek 跳过了英伟达

这是这次发布里最值得单独拿出来说的一件事。

过去,AI 公司在发布新模型前,通常会把预发布版本交给英伟达和 AMD 进行测试和适配。但这一次,DeepSeek 没有给英伟达访问权限,而是优先将 V4 交给华为、寒武纪等国内芯片厂商进行早期测试和深度优化。

华为当天也公开确认:搭载昇腾 950 芯片的算力集群可以完整支持 V4 模型。

这不只是一个技术决定,这是一个态度宣言。

它告诉全球 AI 圈:国产大模型与国产算力的深度融合,已经不是"未来目标",而是正在发生的现实。V4 在国产硬件上的优化程度,可能已经达到了前所未有的高度。

当天 A 股市场的反应印证了这个判断——中芯国际涨超 8%,华虹半导体涨超 15%。

市场用真金白银,给出了它的判断。

信号二:DeepSeek 的第一次外部融资,正在发生

这件事的时机耐人寻味。

就在 V4 发布的前几天,据《The Information》报道,腾讯和阿里巴巴正在洽谈入股 DeepSeek,估值已从最初的百亿美元上调至逾 200 亿美元。

这对 DeepSeek 来说是一个巨大的转变。此前,创始人梁文锋一直对外部融资保持距离,担心资本介入会影响团队的技术独立性。

但现在,时代不一样了。

全球 AI 模型迭代速度在加快,算力成本在上升,核心人才的流动也在加剧(V4 的推迟,部分原因就是核心研究人员的离职)。DeepSeek 需要更稳固的资源支撑,来维系这台"技术机器"的运转。

更大的资本,意味着更大的野心——也意味着更大的压力。

这家公司,正在从一个"纯粹的开源 AI 实验室",向一个更复杂的商业实体演进。它的下一步怎么走,值得持续关注。

信号三:这次发布的时间节点,本身就是一条信息

V4 其实已经跳票了很长时间。原本计划今年春节期间发布,结果一拖再拖,直到今天才以"预览版"的形式上线。

推迟的原因有两个:一是与华为昇腾芯片的深度适配需要大量工程工作;二是部分核心研发人员的流动带来了人员断层。

但它还是来了。

而且是在今天——正好是全球 AI 竞争最激烈、市场期待最高的节点上。

V4 的发布,距离 R1 震惊世界已经过去了将近一年半。这一年半里,Alibaba、ByteDance、百度、OpenAI、Google……每一家都没有停下脚步。DeepSeek 面对的外部压力,比当初 R1 发布时要大得多。

在这种情况下,还能做出一个"预览版"都已经让同行们感受到压力的模型,说明这支团队的底层研发能力,依然是真实的。


三、一个做内容和创业社区的人,怎么看这件事?

说完事实和信号,来说说我自己的感受。

我做推敲星球已经一段时间了,每天打交道的是创业者、做内容的朋友、广告行业的人。最近两年,我们所处的这个行业,每隔几个月就会被一次 AI 发布给重新洗一遍牌桌。

DeepSeek V4 的发布,对我们这个群体意味着什么?

第一,AI 工具的能力上限,已经不是我们用不着担心的问题了。

V4-Pro 可以处理 100 万 token 的超长上下文。这意味着一整个项目的代码库、一整本书、一整套运营方案,可以被一个模型一次性"读完"并给出反馈。这种能力,不是锦上添花,而是会改变工作流的。

第二,开源这件事,正在重塑竞争格局。

DeepSeek 的开源策略,不是慈善,是战略。它把技术能力开放给全世界的开发者,让所有人都能基于它构建产品,反过来形成一个庞大的生态网络。这种策略的长期效果,我认为比很多闭源公司的商业化路径更扎实。

对我们做内容的人来说,这意味着——那些原来需要高昂 API 成本才能实现的 AI 辅助内容生产功能,会越来越便宜,越来越唾手可得。

第三,这条赛道的残酷性,不会因为工具变强而消失。

我经常对推敲星球的朋友们说一句话:AI 变强了,不代表用 AI 的人自动变强了。工具只是工具,决定输出质量的,始终是使用工具的人的判断力、审美和对用户的理解。

DeepSeek V4 可以写代码、可以做 Agent、可以处理超长文档——但它无法替你弄清楚你的用户到底需要什么,无法替你建立真实的信任关系,无法替你做出那些需要情感和价值观参与的决策。

这些,才是我们真正需要修炼的东西。


总结:三条带走的判断

  1. DeepSeek V4 是一次真实的技术跃升,开源+百万上下文+Agent 增强,三个维度同时推进,值得认真关注和使用
  2. 国产算力+国产大模型的绑定,正在加速,这是比技术参数更值得关注的战略信号
  3. AI 越强,"人的判断力"越值钱——这是我的核心判断,也是我做推敲星球的基本逻辑

V4 已经上线了,你打算第一个用它来做什么?

欢迎来评论区聊聊。

给TA打赏
共{{data.count}}人
人已打赏
生活智库

青岛公交1路:四方宣化路—安徽路湖北路

2025-2-7 22:23:08

杂谈

为什么打喷嚏时,我们无法睁着眼睛?

2025-7-3 17:00:15

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索