引言“这不是一个实验项目。这是我真正在用的生产系统。”这是一天一个开源项目系列的第81篇。今天的项目是GBrainGitHub。先说这个项目最不寻常的地方它的作者是Garry Tan谭建文——Y Combinator 现任总裁兼 CEO曾联合创立管理规模达 7 亿美元的 Initialized Capital是 Coinbase、Instacart、Flexport 的早期投资人2018 年起连续入选福布斯 Midas List全球顶级投资人榜单。这个人亲自坐下来写代码写了一个 AI 记忆系统然后开源了。更让人意外的是这不是展示用的概念项目。GBrain 是他日常真正在用的生产系统目前管理着他大脑里的17,888 份文档、4,383 位人脉、723 家公司。当一个顶级 VC 把自己的整个知识网络——投资组合、创始人关系、市场洞察——都押注在一套开源工具上这本身就是最有力的背书。10k Stars1.2k Forks——在 AI 记忆系统赛道里这是最具身份信息含量的开源项目之一。你将学到什么GBrain 的 “Brain-First” 设计哲学为什么先查本地大脑再调外部 API混合搜索架构向量检索 关键词检索的 RRF 融合Recall5 达 95%零 LLM 成本的知识图谱自动连线5 类关系用正则抽取Minions 任务队列比 LLM 子 Agent 快 13 倍的确定性任务执行编译态页面模式类 Git 的知识演化追踪前置知识了解 AI Agent 和上下文窗口的基本概念TypeScript / JavaScript 基础可选用过 Obsidian、Notion 等个人知识管理工具有助于理解应用场景项目背景它是什么GBrain是一个AI Agent 持久化记忆与知识管理系统通过 MCPModel Context Protocol协议为 AI 助手提供一个可跨会话积累、可语义检索的大脑。设计哲学Brain-First传统 Agent 工作方式 收到问题 → 直接调用外部 API搜索/数据库/工具 问题每次从外部拉数据重复、昂贵、无积累 GBrain 的 Brain-First 收到问题 → 先查本地大脑已索引的知识图谱 → 命中直接回答零额外成本 → 未命中调外部 API → 结果写回大脑 → 下次直接命中 效果大脑越用越智能越用越省钱关于作者Garry TanGarry Tan 的经历比大多数 VC 更有技术深度斯坦福计算机系统工程学士毕业后进入微软成为 Palantir 第 10 号员工2008 年联合创办博客平台 Posterous2012 年被 Twitter 以 2000 万美元收购加入 YC 担任设计合伙人亲手给 Coinbase 写下第一张种子轮支票2012 年联合创立 Initialized Capital管理规模 7 亿美元领投 Instacart、Flexport 等2023 年 1 月出任 Y Combinator CEO发起 20 亿美元募资计划他一直在自己的 YouTube 频道分享技术内容是 VC 圈里少见的真正还在写代码的人。GBrain 是这种双重身份的最直接产物。项目数据⭐GitHub Stars: 10,400Forks: 1,200Open Issues: 75最新版本: v0.16.4协议: MIT主要语言: TypeScriptBun 运行时作者实际使用规模: 17,888 页面 / 4,383 人 / 723 家公司主要功能混合搜索RRF 融合Recall5 达 95%GBrain 的检索引擎结合向量搜索和关键词搜索用Reciprocal Rank FusionRRF公式融合排名RRF 分数 Σ 1/(60 rank) 原理 向量搜索找到 [文章A排#1, 文章B排#2, 文章C排#5] 关键词搜索找到 [文章B排#1, 文章D排#2, 文章A排#4] 文章A1/(601) 1/(604) 0.01639 0.01538 0.03177 文章B1/(602) 1/(601) 0.01613 0.01639 0.03252 ← 综合第一对比纯向量搜索指标纯向量搜索GBrain 混合搜索Recall583%95%Precision539%45%知识图谱 F157.8%grep86.6%零 LLM 成本的知识图谱自动连线GBrain 最有趣的设计之一不用任何 LLM 就能自动抽取实体关系。用正则/模式匹配从 Markdown 文本中自动识别 5 类关系关系类型 触发模式示例 attended 与 X 会面于...、参加了 X 的... works_at X 在 Y 公司担任... invested_in 领投 Y 的 A 轮... founded X 创立了 Y... advises X 担任 Y 的顾问...这意味着当 Garry Tan 在笔记里写上午与 Brian Armstrong 聊了 Coinbase 的新产品系统会自动在他的知识图谱中建立[garry-tan] --attended-- [brian-armstrong]这条关系边——不花一分 Token 钱。Minions 任务队列比子 Agent 快 13 倍GBrain 把任务分为两类确定性操作用 Minions 解析 Markdown、建立链接、同步文件、关系抽取 执行延迟753ms Token 成本零 非确定性推理用 LLM Agent 总结内容、回答问题、生成洞察 执行延迟10 秒 Token 成本有Minions 是 Postgres 原生的持久化任务队列——崩溃后可自动恢复不丢任务。关键在于大多数知识管理操作是确定性的不需要 LLM 参与GBrain 把这部分成本彻底清零。26 个技能覆盖 AI 记忆全场景技能类别包含技能举例始终在线信号检测自动识别实体、脑部读-丰富-写循环数据摄入想法处理、媒体摄入、会议录音转录、结构化数据导入知识操作知识丰富、智能查询、维护清理、引用修复任务运营任务管理、定时调度、报告生成、Webhook 触发身份管理灵魂审计、初始化配置、数据迁移、每日简报30 MCP 工具支持直接从 Claude Code、Cursor、Windsurf 调用。数据集成 Recipes开箱即用的数据摄入配方✅ Gmail 邮件 → 自动摄入重要联系人和话题 ✅ Google Calendar → 会议自动页面化 ✅ X/Twitter 时间线 → 关注帖子 删推监控 ✅ Twilio OpenAI Realtime → 电话语音实时转录 ✅ Circleback → 会议录音自动转录入库快速上手# 克隆必须 git clone不能 bun install -ggitclone https://github.com/garrytan/gbrain.git ~/gbraincd~/gbrain# 安装 Bun项目运行时非 Node.jscurl-fsSLhttps://bun.sh/install|bashexportPATH$HOME/.bun/bin:$PATH# 安装依赖并链接全局命令buninstallbunlink# 初始化大脑gbrain init# 健康检查gbrain doctor--json# 导入现有 Markdown 笔记gbrainimport~/notes/ --no-embed# 先导入不嵌入gbrain embed--stale# 批量生成向量# 提问gbrain query这周我跟谁开了会# 知识图谱查询gbrain graph-query garry-tan# 启动 MCP 服务器供 Claude Code 等 AI 助手调用gbrain serve集成到 Claude Code// ~/.claude/server.json{mcpServers:{gbrain:{command:gbrain,args:[serve]}}}项目详细剖析三层架构┌─────────────────────────────────────────────────────────┐ │ Brain RepositoryGit 管理的 Markdown │ │ 唯一数据真相来源Source of Truth │ └──────────────────────────┬──────────────────────────────┘ │ gbrain import ┌──────────────────────────▼──────────────────────────────┐ │ GBrain 检索层Postgres pgvector │ │ 向量搜索 ──┐ │ │ ├── RRF 融合排序 → 混合搜索结果 │ │ 关键词搜索 ┘ │ │ 知识图谱零 LLM 自动连线 │ │ Minions 任务队列确定性操作 │ └──────────────────────────┬──────────────────────────────┘ │ gbrain serveMCP ┌──────────────────────────▼──────────────────────────────┐ │ AI Agent 技能层26 个 Skills │ │ Claude Code / Cursor / Windsurf / 任意 MCP 客户端 │ │ Trusted CLI完整文件权限 │ │ Untrusted MCP沙箱限制 │ └─────────────────────────────────────────────────────────┘编译态页面模式这是 GBrain 防止知识腐化的核心机制# Brian Armstrong ## 当前最佳理解编译态摘要 Brian Armstrong 是 Coinbase CEO专注于加密货币的合规化推进。 2026 Q1 的核心关注点是美国 SEC 监管框架谈判。 --- ## 原始证据时间线只追加不修改 2026-01-15会议记录 - 讨论 Layer2 扩容方案... 2026-02-20邮件片段 - 提及 ETF 申请进展... 2026-03-10会议记录 - SEC 谈判策略调整...顶部的编译态摘要在每次写入新证据时重新生成底部的时间线只追加。类似 Gitcommit history 不可篡改working tree 持续更新。为什么选 Bun 而不是 Node.jsBun 的优势GBrain 实际受益项 ✅ 原生 TypeScript 支持无需 ts-node 或编译步骤 ✅ 启动时间比 Node.js 快 3-4x ✅ 内置测试运行器、打包工具 ✅ 单二进制构建bun build:all → Darwin ARM64 Linux x64 对于每次命令行调用都要重启的 CLI 工具快速启动时间直接影响使用体感。安全信任边界模型CLI 调用remote: false 完整文件系统访问权 可读写 Brain Repository 适合gbrain import、gbrain query MCP Agent 调用remote: true 严格沙箱限制 只能通过定义的工具访问数据 适合Claude Code / Cursor 通过 MCP 调用这个设计解决了一个实际问题当 AI Agent 通过 MCP 调用 GBrain 时你不希望 Agent 能直接修改你的原始笔记文件——只允许它通过受控的 Skill 接口读写。“Fat Skills, Thin Harness” 哲学GBrain 的 26 个技能绝大多数是Markdown 文件而非硬编码逻辑gbrain/skills/ always-on/ signal-detection.md ← 描述如何检测实体的 Markdown brain-operation.md ← 描述读-丰富-写循环的 Markdown ingestion/ ideas.md media.md ...优势技能定义可以直接用自然语言编辑甚至可以让 AI 帮你修改技能定义——这是真正意义上的可自定义 AI 行为。项目地址与资源官方资源GitHub: https://github.com/garrytan/gbrainGarry Tan GitHub: https://github.com/garrytanY Combinator: https://www.ycombinator.comBun 运行时: https://bun.sh技术参考MCP 协议: Model Context Protocol 文档️PGLite: https://pglite.dev嵌入式 PostgreSQLpgvector: https://github.com/pgvector/pgvector总结与展望核心要点Brain-First 理念先问本地大脑再调外部 API——大脑越用越智能API 成本越来越低RRF 混合搜索向量 关键词双路融合Recall5 从 83% 提升到 95%是最实用的搜索架构改进零 LLM 知识图谱确定性模式匹配自动建立 5 类人际关系边知识积累零边际成本Minions vs Agent把确定性操作和 LLM 推理彻底分开前者快 13 倍且零成本Markdown 为真相来源数据可移植用 Git 管理不被任何云平台锁定“Fat Skills”把智能写进 Markdown 技能文件运行时逻辑极简且可自定义适合谁使用投资人 / VC管理庞大的人脉网络和被投公司信息——正是 Garry Tan 的原始用例独立研究者需要 AI 持续积累领域知识、跨会话推理的个人重度 Obsidian 用户想给 Markdown 笔记库加上 AI 检索和知识图谱能力AI Agent 开发者为自己的 Agent 构建持久记忆基础设施值得思考的问题GBrain 的存在提出了一个隐性问题当顶级投资人开始用开源 AI 工具管理自己的核心知识资产这意味着什么Garry Tan 每天的工作是从海量信息流创始人、市场信号、政策变化中找到值得押注的模式。他把这套知识系统的底层开源了——不是因为它不重要而是因为他相信真正的竞争优势来自见识和判断而不是工具本身。开源知识工具保留认知能力——这是一种值得学习的思维方式。访问我的个人网站探索更多实用知识和有趣产品