共计 1911 个字符,预计需要花费 5 分钟才能阅读完成。
过去一周,AI 领域接连释放三个强烈信号:开源模型几乎追平闭源前沿,闭源巨头用「上下文理解」重新定义 coding 助手,而「Vibe Coding」正在让「不会编程的人」也能发布 App——同时也敲响了安全警钟。
一、DeepSeek-V4:开源阵营的「性价比核弹」
4 月 24 日,DeepSeek 正式发布 V4 系列预览版,包含 DeepSeek-V4-Pro(1.6T 总参 / 49B 激活)和 DeepSeek-V4-Flash(284B 总参 / 13B 激活),采用 MIT 协议开源。这是目前最大的开源权重模型。
1. 百万级上下文进入低成本时代
V4 系列支持 1M token 上下文 ,但真正震撼的是效率。在 1M token 场景下,V4-Pro 的单 token FLOPs 仅为 V3.2 的 27%,KV Cache 只有 10%;V4-Flash 更是压缩到 10% FLOPs 和 7% KV Cache。这意味着长文档分析、代码库理解等场景,终于从「demo 玩具」变成了「可负担的生产工具」。
2. 价格屠夫再下一城
| 模型 | 输入 ($/M) | 输出 ($/M) |
|---|---|---|
| DeepSeek-V4-Flash | $0.14 | $0.28 |
| GPT-5.4 Nano | $0.20 | $1.25 |
| DeepSeek-V4-Pro | $1.74 | $3.48 |
| Claude Opus 4.7 | $5.00 | $25 |
| GPT-5.5 | $5.00 | $30 |
V4-Flash 比 GPT-5.4 Nano 还便宜;V4-Pro 作为大模型,定价只有 Claude Opus 4.7 的 1/7。Simon Willison 的评价很精准:「Almost on the frontier, a fraction of the price」(几乎达到前沿,价格却是零头)。
3. 本地部署可行
V4 引入了 Hybrid Sparse Attention 架构,配合 FP4 专家权重,让 1.6T 参数的 MoE 模型在消费级硬件上推理成为可能。Flash 版本经轻量量化后,有望在 128GB MacBook Pro 上运行。
开发者怎么用 ?通过 OpenRouter 或官方 API 直接调用;长上下文场景如代码库 RAG、法律合同分析,现在可以「一次性丢进去」而不用分段切割。
二、OpenAI GPT-5.5 与 Codex:闭源阵营的「上下文反击」
4 月 23 日,OpenAI 发布 GPT-5.5(代号 Spud),面向 Plus / Pro / Enterprise 用户推送,并集成进 Codex 编程助手。CEO Greg Brockman 强调:「这不是增量更新,而是模型研发思路的重大转变。」
GPT-5.5 的核心改进在于「猜到你真正想要什么」,无需过度详细的 prompt。在编码场景中,资深工程师反馈它能提前发现潜在问题,并处理复杂代码合并。在 Terminal-Bench 2.0 编程基准上,GPT-5.5 以微弱优势超越 Anthropic 的 Claude Mythos Preview。
不过,OpenAI 对此次发布采取了更谨慎的安全策略:GPT-5.5 被归类为网络安全「高风险」,API 并未同步开放,仅表示「很快推出」。对依赖 API 构建产品的企业开发者而言,这意味着 DeepSeek-V4 在「可编程接入」层面暂时占得先机。
三、Vibe Coding 狂潮:安全警钟与行动指南
模型能力爆炸的副作用,是 Vibe Coding 的全民化。据 Sensor Tower 数据,2026 年初至今 App Store 新增应用数量同比暴增 84%,主要推手正是 Claude Code、OpenAI Codex 等 AI 编程工具。
但瑞士开发者 Tobias Brunner 最近分享了一个真实「恐怖故事」:某医疗机构负责人用 coding agent 自行搭建患者管理系统,结果数据库零访问控制、所有患者数据明文暴露在公网、就诊录音被发送到美国 AI 服务商。作者完全不知道自己造了一个什么级别的安全隐患。
开发者行动指南
| 你的需求 | 建议动作 |
|---|---|
| 想低成本跑长上下文任务 | 立即试用 DeepSeek-V4-Flash,$0.14/M 的价格几乎等于免费 |
| 需要本地 / 私有化部署 | 关注 V4-Flash 的 GGUF/GPTQ 量化版本,128GB 内存设备有望原生运行 |
| 追求 Coding 助手极致体验 | ChatGPT / Codex 的 GPT-5.5 值得升级,上下文理解提升显著 |
| 在用 AI 生成产品代码 | 务必做安全审计:数据库权限、API 密钥管理、客户端逻辑校验,一个都不能少 |
结语
DeepSeek-V4 证明了一件事:开源模型与闭源前沿的差距,正在从「代际差」缩小为「季度差」。GPT-5.5 则证明,闭源阵营仍在「上下文智能」和「端到端产品体验」上保有优势。而 Vibe Coding 的爆发与失控,则提醒我们: 模型能力越普惠,工程纪律越珍贵。
当「人人都能写代码」时,「写得对、写得安全、写得可维护」才是你真正的护城河。