DeepSeek V4发布

张

张建站

2026/6/4 22:48:57

10分钟阅读

DeepSeek V4 上周就发布了本来想聊聊但是之前没想清楚要讲什么。今天就说说令我印象深刻的两个部分。国产芯片适配。这里我没有细研究只挑了几个关键点。简单来说就是优化了国产芯片的推理。还有一个 TileLang能在代码层适配国产芯片的算子和国外的CUDA1M上下文成为标配。国内的模型除了Qwen,其他的厂商似乎都没有做 1M 的上下文。标准的注意力机制每个新来的token都要和前面所有token算一次内积。如果把4K上下文换成100万上下文需要算的内积数量是4000倍显存占用也是4000倍。粗略估算下来100万上下文的单次推理成本比4K高约6万倍。这堵「算力墙」和「显存墙」加起来是大多数模型在128K-200K就停住的原因。但这次DeepSeek开放的CSA HCA给了一个解决方案。具体内容比较复杂我也看不太明白只知道效果大概是这样子。两者加起来V4在100万上下文下的单次推理成本只有V3.2的约1/4。KV cache占用只有传统BF16 GQA8 baseline的约2%感觉今年年底左右大家应该也会让 1M 上下文变成模型的基本能力不再是高价位模型的专属。之前 Karpathy 分享的知识库管理其实有个前提就是模型的上下文要比较大这样在用起来才比较方便。现在看来在线的知识管理这种产品应该比较慌了没必要继续续费~~还有RAG的场景进一步被压缩。数据量少的时候直接丢到上下文数据量大且有多实体关联的时候单纯的RAP没用了又得加图。还真印证了那句话AI时代如果你学得慢很多东西不用学~具体技术报告https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf推荐阅读非本人https://mp.weixin.qq.com/s/BELLFDV6hlmmFoAcJy1RZg

别再用Excel做绩效复盘了：基于LLM+知识图谱的智能归因系统，3分钟定位团队效能瓶颈（Demo环境已开放）

更多请点击： https://codechina.net 第一章：别再用Excel做绩效复盘了：基于LLM知识图谱的智能归因系统，3分钟定位团队效能瓶颈（Demo环境已开放） 传统Excel手工归因耗时长、维度单一、因果链断裂——一份跨季…...

2026/6/4 22:46:43 阅读更多 →

滴哦小精灵 v1.5.1：全能型 Windows 桌面工具箱，集美化与高效办公于一体

链接🔗点击： https://pan.quark.cn/s/d68607b919e5 滴哦小精灵是一款兼具实用性与趣味性的桌面工具，集成了定时任务、桌面便签、悬浮快开、生日节日提醒、桌面宠物、计时器及动态桌面等多种功能。...

2026/6/4 22:46:38 阅读更多 →

告别Postman！IDEA内完成Spring Boot接口调试的终极解决方案

告别Postman！IDEA内完成Spring Boot接口调试的终极解决方案【免费下载链接】cool-request IDEA API、Java Method debug tools 项目地址: https://gitcode.com/gh_mirrors/co/cool-request 还在为API调试而频繁切换工具吗？每次修改完Controller代…...

2026/6/4 22:38:37 阅读更多 →

智能水印工具终极指南：如何批量为照片添加专业相机参数水印

智能水印工具终极指南：如何批量为照片添加专业相机参数水印【免费下载链接】semi-utils 一个批量添加相机机型和拍摄参数的工具，后续「可能」添加其他功能。项目地址: https://gitcode.com/gh_mirrors/se/semi-utils 还在为数百张照片手动添加相…...

2026/6/3 17:02:45 阅读更多 →

Go语言可扩展性设计：水平扩展

Go语言可扩展性设计：水平扩展1. 引言在互联网时代，业务的快速增长对系统的扩展性提出了极高的要求。水平扩展（Scale Out）作为分布式系统的核心设计理念，能够通过增加服务器节点来提升系统的整体处理能力。与垂直扩展&…...

2026/6/3 11:01:44 阅读更多 →

Claude Code Tool System 与 Permission 机制深度解析

代码解析 Claude Code Tool System 与 Permission 机制深度解析 0. 背景与定位 Claude Code 是一个运行在终端的 Agentic 编码工具，其核心能力来自工具系统（Tool System）——AI 通过调用工具与文件系统、Shell、网络、子 Agent 交互。而**权…...

2026/6/3 17:02:49 阅读更多 →