大模型的“记忆“：无状态架构如何实现个性化对话体验？

张

张建站

2026/4/16 2:18:34

10分钟阅读

大模型架构设计与微服务架构设计存在很大不同微服务架构中我们最关注的是服务的无状态的化设计把有状态的数据保存在数据库或者缓存中这样的好处是架构随时支持扩缩容。而大模型往往会设计成无状态的也就是没有记忆那么为什么我们会感觉和大模型聊天时他可以记住并回顾我们之前的对话内容甚至会产生大模型越用越顺手错觉也越来越熟悉我们。其实这里面有2个问题第一个为什么大模型会设计中无记忆的第二个问题为什么大模型看起来会记得我们之前的会话01—为什么大模型设计成无记忆的在[大模型是如何进行文本生成的思考篇]系列文中我们推导出结论大模型是基于Transformer架构的它通过海量文本数据训练得到上千亿的训练参数然后才学会如何预测下一个词和句子因此大模型的训练本质上就是为了得到上千亿的参数也就是基于统计规律的概率计算它所体现出来的智能也是源于这种概率计算并不是记忆存储。02—为什么大模型看起来会记得我们之前的会话答案是通过上下文技术每次在与大模型交互之前会把用户的之前的对话以及大模型的返回重新发送给了大模型。第 1 次请求[消息1] → AI 回复1 plaintext 第 2 次请求[消息1, 回复1, 消息2] → AI 回复2 plaintext 第 3 次请求[消息1, 回复1, 消息2, 回复2, 消息3] → AI 回复3但是大模型需要无限制的把每次的对话都塞进下一次的对话中吗答案是不会的因为这种交互是需要token的每次会话越长消耗的token越多所需要的计算资源也也越大所以所有的大模型都有上下文窗口不能无限制的把所有前置会话塞入下一次会话。另外就像上面的结论大模型本质是概率预测上下文越多对预测帮助并不大而且还可能随着会话轮数增多给出的答案偏离主题。接下来需要解决上下文如何管理问题通常有以下几个方案1.滑动窗口方案本质上就是只保存最近的几条2.会话压缩方案本质上是将多论会话的问题和结论压缩成简短的几句话3.持久化RAG检索方案本质上是将历史会话按照会话id为条件保存的数据库中下次会话请求时再检索出来召回。假如你从2026年开始学大模型按这个步骤走准能稳步进阶。接下来告诉你一条最快的邪修路线3个月即可成为模型大师薪资直接起飞。阶段1:大模型基础阶段2:RAG应用开发工程阶段3:大模型Agent应用架构阶段4:大模型微调与私有化部署配套文档资源全套AI 大模型学习资料朋友们如果需要可以微信扫描下方二维码免费领取【保证100%免费】配套文档资源全套AI 大模型学习资料朋友们如果需要可以微信扫描下方二维码免费领取【保证100%免费】

35岁零基础转行AI大模型开发？这份超全学习资源包，三十五岁零基础转行成为AI大模型开发者怎么样呢？

以下从3个方面帮大家分析： 35岁转行会不会太晚？零基础学习AI大模型开发能不能学会？AI大模型开发行业前景如何，学完后能不能找到好工作？ 一、35岁转行会不会太晚？ 35岁正处于人生的黄金时期，拥有…...

2026/4/16 2:18:33 阅读更多 →

紧急预警：未做动态模态路由的多模态云部署，正导致37%企业API SLA违约！

第一章：多模态大模型云端协同部署 2026奇点智能技术大会(https://ml-summit.org) 多模态大模型（如LLaVA、Qwen-VL、Fuyu-8B）在视觉理解、跨模态推理与实时交互场景中展现出强大潜力，但其参数量大、显存占用高、推理延迟敏感等特点…...

2026/4/16 2:18:17 阅读更多 →

pytest测试的时候这是什么意思？Migrating ＜class ‘kotti.resources.File‘＞

pytest测试的时候这是什么意思？kotti\tests\test_filedepot.py ..........Migrating <class kotti.resources.File> Migrating data for <class kotti.resources.File> with pk (2,) Migrating data for <class kotti.resources.File> with pk (3…...

2026/4/16 2:14:18 阅读更多 →

HagiCode Desktop 混合分发架构解析：如何用 PP 加速大文件下载籽

一、Actor 模型：不是并发技巧，而是领域单元 Actor 模型的本质是： Actor 是独立运行的实体 Actor 之间只通过消息交互 Actor 内部状态不可被外部直接访问 Actor 自行决定如何处理收到的消息 Actor 模型真正解决的是： 如何在不共享状…...

2026/4/16 0:30:59 阅读更多 →

从数据采集到回放验证：ADTF 适配 ROS 的 ADAS 测试实践饺

一、简化查询 1. 先看一下查询的例子 /// /// 账户获取服务 /// /// /// public class AccountGetService(AccountTable table, IShadowBuilder builder) {private readonly SqlSource _source new(builder.DataSource);private readonly IParamQuery _accountQuery build…...

2026/4/15 6:20:42 阅读更多 →