记忆树 MemoryTree

版本 1.5.2

一棵会新陈代谢的记忆树

让 AI 的记忆不再是无限膨胀的仓库，而是一片有呼吸、会随着四季更替生长、落叶的森林。

记忆树 × MemoryTree | MIT License | Python 3.8+

A self-pruning memory tree for Hermes Agent — organizes knowledge into hierarchical topics, auto-decays stale memories, and protects what matters. Zero-dependency keyword matching out of the box; plug in BGE embeddings for 10× semantic accuracy.

⚡ 开箱即用：克隆即跑，零配置关键词匹配。
🧠 三步激活语义检索：pip install sentence-transformers → export MEMORYTREE_EMBEDDING_MODEL=local:BAAI/bge-small-zh-v1.5 → 首次自动下载 BGE 模型。
不配也能用——检索精度差 10 倍，但基本功能完整。

为什么做这个项目

Hermes 原生的记忆系统是一个扁平、只增不减的 .md 文件。任何说过的话都可能被记下，但永远不会被忘记。

这会导致三个严重问题：

记忆膨胀 — 日久天长，里面积攒的无效信息会淹没真正重要的记忆。
检索噪音 — AI 回忆时需要从大量无关文本中硬搜，结果慢且不精准。
缺少认知结构 — 人类的记忆是分门别类、有逻辑层级的，而原系统只是一串列表。

记忆树解决了这些痛点：它把你的记忆组织成一棵会自己长新枝、自己落枯叶的树。

核心能力

🌲 层级化记忆结构 你的知识被自动分类、拆解成话题树（最多 6 层）。从此"苹果"是水果还是公司，系统心里有数。

🕰️ 自动遗忘与增强 每次被回想起来的记忆都会 +1 分；连续 7 天未被访问的记忆每周 -1 分，分数 ≤2 时沉入树根归档（不立即删除）。记得多的自然沉淀为长期记忆，不再用的先归档而非丢弃。

🛡️ 核心记忆保护 你可以把最重要的记忆标记为"核心"，它们的分数下限为 3（确保永不下沉到树根）。即使父节点被遗忘，核心子节点也会自动提升为根节点，避免株连。

🌊 树根深池 (v1.3.0) 两段记忆归档系统。活跃树正常新陈代谢，淘汰节点沉入树根永久保存（同层级结构，不衰减）。检索活跃树无结果时自动回退搜索树根——命中后记忆重新生长枝叶，自动恢复至活跃树。树根中超过 3 年未访问的记忆按天逐步淘汰。

🔍 逐层下钻检索 检索时像人一样从大话题一层层深入，而不是全文漫无目的地匹配。省 Token，更精准。

📦 全自动运转 衰减检查在每次对话启动时自动执行，节点先沉入树根归档而非直接删除。记忆园丁每天自动用嵌入模型重分类当天记忆，话题树越用越准。

📋 旧记忆一键迁移 原生 MEMORY.md 的旧数据可以自动迁入树形结构，原有文件备份保留，不会丢失。

⚡ SQLite 高性能存储 从单文件 JSON 升级为 SQLite 数据库。事务保证原子性，写入中途崩溃自动回滚。冷启动检索亚毫秒级完成。

🔗 原生工具封装 记忆操作已注册为 Hermes 原生工具，不再依赖外部脚本调用。通信延迟从数百毫秒降至毫秒级。

🔄 修剪同步机制 原生 memory 工具和记忆树同时写入时，园丁逻辑会自动发现原生工具的新条目，将其纳入记忆树，两个入口安全共存。

🧠 可插拔语义引擎 三种模型一键切换：KeywordModel（默认零依赖）、LocalEmbeddingModel（BGE 本地惰性加载）、OpenAIEmbeddingModel（任意兼容 API）。批量语义匹配一次编码全量对比。加载失败静默降级。

🔎 宽搜兜底 逐层下钻结果不足时自动切换到全叶子节点批量匹配，避免路径依赖导致漏检。

🧪 完整测试覆盖 26 项压力测试 + 12 项边界值测试（批量写入、事务回滚、SQL 注入防护、衰减准确性、节点上限淘汰等）。

🕐 时间戳记录 (v1.4.0) 每个记忆节点自动标记 created_at（ISO 8601 创建时间），SQLite 自动兼容旧数据库，无需手动迁移。

💻 JSON 输出 (v1.4.0) 所有 CLI 命令支持 --json 参数，输出纯净 JSON（无图标、无中文），方便脚本和程序消费。

🔀 混合搜索（BM25+RRF） (v1.5.0) 逐层下钻、关键词匹配、余弦相似度之外，新增 BM25 稀疏检索通道，通过 RRF（Reciprocal Rank Fusion）将多路检索结果融合排序。纯 Python 实现，零外部依赖。自动记录混合搜索使用次数统计。

🔐 内容哈希去重 (v1.5.0) 每次 add_memory 前计算 SHA-256 内容哈希，完全相同的内容静默跳过不重复添加。统计信息展示"跳过重复次数"和"内存哈希数"。

📝 自动沉淀日志 (v1.5.2) 关键操作（衰减/园丁/同步/删除/恢复）完成后自动在记忆树中写入结构化日志 日志/运维: 发生了什么。由代码保证必然执行，不依赖 AI 自觉性。行为层可在此基础上补写"为什么"，两层互不重复。

📥 自动安装引导 (v1.4.0) setup-embeddings 命令一键完成 BGE 嵌入模型的安装配置：自动 pip install + huggingface-hub 下载，受限网络自动降级 curl 下载。

✅ 嵌入模型兼容性修复 (v1.5.0 补丁) 修复 Intel Mac (x86_64) 上 torch 2.2.2、sentence-transformers 2.7.0、numpy 1.26.4 的兼容性问题。_get_matcher 支持本地路径加载，解决 MEMORYTREE_EMBEDDING_MODEL=local:xxx 格式在缓存目录下的路径解析问题。记忆园丁在无嵌入模型时也不再空转。

语义模型

记忆树默认使用轻量级的关键词匹配（零依赖，开箱即用）。可选集成第三方语义模型以提升理解能力：

属性	详情
模型名称	BAAI/bge-small-zh-v1.5
开发者	智源研究院 (Beijing Academy of Artificial Intelligence, BAAI)
许可协议	MIT License
用途	中文语义相似度匹配
配置方式	`pip install sentence-transformers` + 设置环境变量（详见安装章节）

⚡ 强烈建议配置嵌入模型。默认关键词匹配在"深度思考报错"这类跨语言/跨表述的查询中精度仅 0.048，启用后提升至 0.495（实测提升 10 倍）。不配也能用全部功能，只是检索精度受限。

模型说明：本项目语义匹配功能可选集成该模型。模型的版权归原作者（智源研究院）所有，我们根据其 MIT 许可协议进行使用和分发。

伦理声明：我们意识到 AI 模型可能存在偏见。本项目仅将该模型作为可选技术组件，用户需自行启用并评估其在特定应用场景下的公平性、可靠性与安全性。

与原装记忆系统的对比

维度	Hermes 原装记忆	记忆树 MemoryTree
结构	扁平线性列表	多叉树，话题层级可追溯
存储方式	MEMORY.md 文本	mindmap.db (SQLite) + 自动生成的 MEMORY.md 索引
生命周期	永存，只增不减	分数制：1–20 短期 / 21–40 长期 / 41+ 永久
检索方式	全文扫描，全量注入上下文	逐层下钻 + 索引摘要注入，大幅节省 Token
资源占用	线性增长，无清理机制	上限 10,000 非核心节点，自动衰减清理
写入性能	追加式文本，极快	SQLite 事务写入，500 节点约 200 条/秒
检索性能	全文扫描，记忆越多越慢	逐层下钻 + 混合搜索 (BM25+RRF)，冷加载亚毫秒级
数据安全	极简文本，几乎不损坏	SQLite 事务原子性，崩溃自动回滚
维护成本	需要手工整理	全自动新陈代谢，零维护
CRUD	add / replace / remove	add / search / replace / remove / recover / sync / consolidate / decay / migrate / core / recall / stats / setup-embeddings
兼容性	Hermes 内置	Skill 形式加载，与原生 tool 共存
扩展性	无	可插拔语义模型接口，JSON 输出可编程消费

检索实测

查询："在会话过程中深度思考导致报错的问题" | 存储 9 条记忆 (2 条目标)

                     关键词匹配    BGE 嵌入(本项目)
thinking mode→HTTP400   0.048        0.495 ✅
深度思考→think:false    0.145        0.487 ✅
麻辣香锅                0.037        0.262

原系统:  1.6ms | 9条全返回 | 目标混在 Top2
记忆树:  712ms | 3条精准返回 | 2/2 目标命中

关键词分数均 < 0.20 阈值，无法命中。BGE 嵌入将语义相似度提升 10 倍。

嵌入模型启用后实测对比（v1.5.0 修复）：

                     关键词匹配    BGE 嵌入(修复后)
编程语言↔Python        ~0.000        0.801 ✅
电脑↔买电脑             0.583        0.828 ✅

Intel Mac (x86_64) 兼容性已修复：sentence-transformers 2.7.0 + numpy 1.26.4 + torch 2.2.2。

原生工具 API

工具名	功能	参数
`memory_tree_add`	添加记忆，自动语义分类	`content`
`memory_tree_search`	逐层下钻检索	`query`
`memory_tree_replace`	按内容子串查找并替换	`search_text`, `new_content`
`memory_tree_remove`	删除记忆（含子树，软删除可恢复）	`search_text`, `force`
`memory_tree_sync`	从 MEMORY.md 增量导入原生条目	无
`memory_tree_recover`	恢复被软删除的记忆	`search_text`

安装

环境要求：Hermes Agent 环境 + Python 3.8+
默认依赖：零。纯标准库（sqlite3, json, difflib），克隆即用。

💡 不装任何额外依赖就能跑全部功能——只是检索用关键词匹配。装 BGE 嵌入后精度提升约 10 倍。

可选：激活 BGE 语义嵌入（推荐）：

pip install sentence-transformers
export MEMORYTREE_EMBEDDING_MODEL=local:BAAI/bge-small-zh-v1.5
# 首次自动下载模型 (~90MB)，之后纯本地运行
# 若已缓存到自定义路径，也可指定完整目录：
# export MEMORYTREE_EMBEDDING_MODEL=local:/path/to/cached/BAAI/bge-small-zh-v1.5

若网络受限导致自动下载失败，可用内置安装引导命令：

python3 mindmap_memory.py setup-embeddings
# 自动完成：pip install + huggingface-hub 下载 + curl 降级下载

安装到 Hermes：

git clone <你的仓库地址>
cd mindmap-memory
bash install.sh
# 重启 Hermes，然后 /mindmap-memory 加载技能

使用

cd ~/.hermes/skills/custom/mindmap-memory

# 添加记忆
python3 mindmap_memory.py add "你需要记住的内容"

# 检索记忆
python3 mindmap_memory.py search "关键词"

# 替换记忆
python3 mindmap_memory.py replace "旧内容" "新内容"

# 删除记忆
python3 mindmap_memory.py remove "搜索文本"

# 恢复已删除的记忆
python3 mindmap_memory.py recover
python3 mindmap_memory.py recover "关键词"

# 从 MEMORY.md 同步原生记忆
python3 mindmap_memory.py sync

# 迁移旧 MEMORY.md 到记忆树
python3 mindmap_memory.py migrate

# 查看整棵记忆树
python3 mindmap_memory.py recall

# 记忆园丁：用嵌入模型重分类当天记忆
python3 mindmap_memory.py consolidate

# 统计信息（含去重跳过次数、嵌入模型状态）
python3 mindmap_memory.py stats

# 标记核心记忆
python3 mindmap_memory.py core <节点ID>

# 安装引导 BGE 嵌入模型
python3 mindmap_memory.py setup-embeddings

# 手动触发衰减（通常不需要）
python3 mindmap_memory.py decay

# JSON 输出（所有命令均支持，纯净 JSON 无图标无中文）
python3 mindmap_memory.py search "关键词" --json
python3 mindmap_memory.py stats --json

文件结构

mindmap-memory/
├── mindmap_memory.py      # 核心引擎 (3070 行)
├── SKILL.md               # Hermes Skill 描述
├── README.md              # 项目文档（本文件）
├── CHANGELOG.md           # 更新日志
├── LICENSE                # MIT 开源许可证
├── CONTRIBUTING.md        # 贡献指南
├── SECURITY.md            # 安全策略
├── install.sh             # 一键安装脚本
├── .gitignore
├── demo_mindmap.db        # 演示用种子数据库
├── .github/
│   ├── workflows/test.yml # CI 自动测试 (Python 3.9-3.12)
│   ├── ISSUE_TEMPLATE.md  # Bug 报告模板
│   └── PULL_REQUEST_TEMPLATE.md  # PR 模板
├── scripts/
│   ├── decay_worker.py    # 定时衰减工作脚本
│   ├── migrate.py         # 旧记忆迁移工具
│   ├── sync_native.py     # 原生记忆同步便捷脚本
│   ├── seed_demo.py       # 演示数据生成脚本
│   ├── stress_test.py     # 26 项压力测试
│   ├── edge_tests.py      # 12 项边界值测试
│   └── pre_release_tests.py  # 24 项发布前补充测试（含核心保护验证）
└── tools/
    └── memory_tree_tool.py   # Hermes 原生工具注册

~/.hermes/memories/
├── mindmap.db             # SQLite 记忆数据库
├── mindmap.json.migrated  # JSON→SQLite 迁移后的备份
├── MEMORY.md              # 自动生成的索引（替换旧扁平格式）
└── decay_log/             # 遗忘日志（可后悔恢复）

设计决策

决策	取值	原因
树深度上限	6 层	超过 6 层的拆解极少被独立引用
分数区间	1–20 短期 / 21–40 长期 / 41+ 永久	约 40 周连续引用可升至永久
衰减周期	每周一次	太频繁浪费，太稀疏迟钝
加分规则	仅匹配节点 +1	避免全链加分导致遗忘机制失效
非核心节点上限	10,000	日均 3 条约需 9 年填满，衰减下更早稳态
核心记忆分数下限	3	NEW_NODE_SCORE(2) 之上，确保永不下沉到树根
树根保留天数	1095 (3年)	归档节点最后保护期，过期按天淘汰
语义匹配阈值	0.20	对短查询友好
BM25 參數 k1 / b	1.5 / 0.75	BM25 稀疏检索默认值，兼顾精确率与召回率
存储后端	SQLite	替代单文件 JSON，事务安全
时间戳字段	created_at (ISO 8601)	每条记忆独立记录创建时间，向后兼容旧数据库
嵌入模型格式	local:model_name	支持名称加载和绝对路径加载（local:/path/to/model）

已知局限

嵌入模型需要额外下载：默认使用纯关键词匹配（零依赖）。BGE 嵌入模型首次使用需 pip install sentence-transformers + 下载约 90MB 模型文件。Intel Mac (x86_64) 上 torch 最高支持到 2.2.2，需配合 sentence-transformers 2.7.0 和 numpy 1.26.4 使用（已内置兼容，首次配置稍慢）。

逐层检索存在路径依赖：如果一条记忆被放在与查询词无关的话题路径下，常规下钻可能错过。已内置宽搜兜底：当下钻结果不足时自动批量匹配所有叶子节点，此问题已大幅缓解。

偶尔遗忘潜在有用的信息：长时间未引用的技术笔记可能被沉入树根归档。三道防线：(1) 标记为核心记忆即可永久不下沉；(2) 检索时活跃树无结果会自动回溯树根，命中后重新生长枝叶恢复至活跃树；(3) 树根中记忆保留 3 年才真正淘汰。并非真正丢失。

测试

# 26 项核心压力测试
python3 scripts/stress_test.py

# 12 项边界值测试
python3 scripts/edge_tests.py

# 24 项发布前补充测试（事务回滚、错误处理、防抖、核心保护验证）
python3 scripts/pre_release_tests.py

测试覆盖：批量写入、层级结构、检索准确性与性能、访问加分、核心保护、衰减准确性、节点稳定性、语义匹配、深度限制、节点上限淘汰、数据库损坏恢复、迁移幂等、事务回滚、异常输入处理、核心记忆保护验证。

开源许可

MIT License — 完全开放，欢迎修改、使用和贡献。

致谢

本项目语义匹配功能可选集成 BAAI/bge-small-zh-v1.5 模型，该模型由智源研究院 (Beijing Academy of Artificial Intelligence, BAAI) 开发并采用 MIT 协议开源，在此表示衷心感谢。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

记忆树 MemoryTree

目录

为什么做这个项目

核心能力

语义模型

与原装记忆系统的对比

检索实测

原生工具 API

安装

使用

文件结构

设计决策

已知局限

测试

开源许可

致谢

About

Uh oh!

Releases 6

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 34 Commits
.github		.github
references		references
scripts		scripts
tools		tools
.gitignore		.gitignore
CHANGELOG.md		CHANGELOG.md
CONTRIBUTING.md		CONTRIBUTING.md
LICENSE		LICENSE
README.md		README.md
SECURITY.md		SECURITY.md
SKILL.md		SKILL.md
demo_mindmap.db		demo_mindmap.db
install.sh		install.sh
mindmap_memory.py		mindmap_memory.py

Folders and files

Latest commit

History

Repository files navigation

记忆树 MemoryTree

目录

为什么做这个项目

核心能力

语义模型

与原装记忆系统的对比

检索实测

原生工具 API

安装

使用

文件结构

设计决策

已知局限

测试

开源许可

致谢

About

Topics

Resources

License

Contributing

Security policy

Uh oh!

Stars

Watchers

Forks

Releases 6

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages