Hermes+Obsidian+llmwiki AI如何将收藏夹变成你的第二大脑-尧图网站建设

📅 发布时间：2026/6/21 1:52:26

Hermes+Obsidian+llmwiki AI如何将收藏夹变成你的第二大脑

作者：科技界的一粒微尘
每天都在收藏，从来没看过？一个链接丢给 AI 助手，自动提炼、分类、入库，这才是收藏的正确姿势

老规矩先看效果图：从收藏夹链接->Hermes智能体->LLMwiki实现ingest

你收藏了多少篇文章？打开浏览器的收藏夹、微信的"保存"、知乎的"收藏"——里面躺着几百条链接，但真正再打开看过的，可能不到10%。这个问题困扰了很多人，包括我。

过去半年，我搭建了一套从"收藏"到"知识"的完整流水线。核心就三个组件：

Hermes（AI助手） + Obsidian（笔记系统） + LLM Wiki（知识库框架）

效果很直接：看到一个想收藏的链接，丢给 AI → 自动抓取原文 → 提炼知识点 → 写入个人知识库 → 永久可检索。整个过程不需要我动手复制粘贴。

这篇文章就把这套体系完整拆解出来。

一、核心逻辑：三级处理管线

这套体系的核心不在于工具本身，而在于信息的处理层级。

很多人收藏夹吃灰的根本原因：信息只经过了"存储"这一步，没有经过"提炼"和"结构化"。

原始材料层（raw/）：原文快照，不可修改。相当于收藏夹的数字备份。你去抓一个网页，原文原封不动保存下来，带时间戳和来源地址。这一步确保哪天想回头看原始内容，随时能找到。

知识层（entities + concepts）：经 AI 提炼后的结构化知识。从一篇文章中提取出核心概念、实体、数据、踩坑记录，写成独立的知识页面。页面之间用[[wikilinks]]双向链接，形成知识网络。

检索层：本地 RAG（TF-IDF 向量检索）或 Dataview 查询。知识写进去了还得能找回来。通过关键词搜索或结构化查询，秒级定位到相关页面。

收藏夹里100条链接 → AI 帮你变成100个知识点 → 知识点之间自动关联 → 每次搜索都能找到上下文。

三级知识管线：原始材料层 / 知识层 / 检索层

二、Hermes：AI 驱动的全自动管线

Hermes 是一个开源的 AI Agent 框架。在这套体系里，它承担信息处理管线中的核心角色。

收到一个链接后，它的处理流程：

抓取原文：访问链接 → 提取文章正文和代码块 → 保存为 Markdown 格式，带上来源 URL 和 SHA256 哈希作为完整性校验。这一步对应"收藏"，但比浏览器收藏夹多了全文备份。

知识提炼：阅读文章 → 识别核心概念和技术点 → 判断适合创建"实体页"还是"概念页" → 生成符合 SCHEMA 规范的 YAML frontmatter → 写入知识库。

关联入网：新建的页面自动添加最低2个[[wikilinks]]指向已有页面。如果新知识点涉及已有的概念（比如 OpenCV 移植涉及交叉编译工具链），会在知识库中找到对应的页面，形成双向链接。

索引维护：更新知识库目录（index.md），追加操作日志（log.md），记录处理时间和来源。下次你再丢一个链接，AI 能立刻判断这是新知识点还是已有内容的补充。

真实案例：处理一篇技术文章

昨天我丢给 Hermes 一个链接：海思芯片 OpenCV 移植说明（来自易百纳技术社区）。

AI 的处理结果是：

原文保存：10,084 字的完整文章保存到raw/articles/，带来源 URL 和时间戳。

提炼概念页：创建了一篇 2,323 字的知识页面《OpenCV 交叉编译与移植》，包含：
cmake-gui 配置要点：指定 aarch64-mix210-linux 交叉编译器，设置目标架构为 ARM64
编译踩坑记录：PNG ARM NEON 宏定义兼容问题修复方法、glibc features.h 宏括号错误修复
MPP Sample 集成方案：Makefile.param 头文件路径添加、Makefile 链接库配置、Mat 与 MPP frame 互转

关联已有知识：自动添加了5个双向链接 →[[BSP 编译系统]]、[[交叉编译工具链]]、[[MPP 媒体处理流水线]]、[[鸿鸥派 HongOU PI]]

做完这些，知识库从26页变成了27页。每个知识点都不是孤岛，而是网络中的一个节点。

从收到链接到完成入库，整个过程由AI自动完成

三、Obsidian 插件：让知识库变得可用

Hermes 负责"写"，Obsidian 负责"读"。光有内容不够，还得能用得顺手。以下是我筛选出来的插件组合，每个都有明确的用途。

围绕 wiki vault 的8个核心插件，各司其职

Dataview —— 把笔记库当数据库查

当知识库膨胀到几十上百页时，靠人肉翻目录是不现实的。Dataview 让 YAML frontmatter 变成了可查询的数据库字段。

每个 wiki 页面都带有这样的元数据：

type: entity | concept | comparison | query | summary tags: [build, hisi, tutorial] confidence: high | medium | low sources: [raw/articles/xxx.md]

有了这些字段，一行查询就能找到你需要的内容。查低置信度页面（待审核）：
WHERE confidence = "low"→ 列出所有置信度低的页面，定期补充
查最近30天创建：
WHERE file.cday >= date(today) - dur(30 days)→ 新的知识回顾
查孤儿页面（没有入链）：
WHERE length(file.inlinks) = 0→ 发现孤立知识点，补充反向链接
按标签筛选实体：
WHERE contains(tags, "hisi")→ 只看海思相关的内容

这些查询可以直接写在知识库的首页 index.md 底部，每次打开自动刷新，比手动维护目录高效得多。

Templater —— 一键创建结构化页面

手工写 YAML frontmatter 很烦，有了 Templater，一切自动化。

创建一个模板文件，指定created字段自动填充当天日期，type、tags预填默认值，sources留空待补充。每次按快捷键Alt+N选模板，输入文件名，一个格式规范的新页面就自动生成。

用模板的好处是一致性。如果团队多人协作或 AI 与人工混编，统一的 frontmatter 结构让后续的 Dataview 查询和知识库 lint 检测都能正常工作。

QuickAdd —— 一键捕获到 inbox

看到好文章但没时间处理？QuickAdd 解决这个问题。

设置一个 Capture 模式，快捷键触发，弹窗输入标题和内容，自动保存到raw/articles/，文件名按日期自动命名。等你有空了再丢给 Hermes 做知识提炼。

这一步降低了"收藏"的门槛——不需要打开 Obsidian，不需要想放在哪个文件夹，一按快捷键，内容进 Inbox。

Dataview 的典型查询场景

以下三个查询在你搭建好知识库后可以立刻用起来：

场景一：每周回顾——查看本周新增的知识点

TABLE type, tags, file.cday as 创建日期 FROM "entities" OR "concepts" WHERE file.cday >= date(today) - dur(7 days) SORT file.cday DESC

这个查询列出最近7天新增的所有实体页和概念页。如果某篇文章处理完后你还没读，这就是提醒清单。

场景二：体检检查——发现孤立页面

TABLE length(file.inlinks) as 入链数 FROM "entities" OR "concepts" WHERE length(file.inlinks) = 0 SORT file.ctime DESC

入链数为0的页面就是知识网络中的"孤岛"。发现一个孤岛，说明这条知识还没有和其他内容产生关联——要么是 AI 处理时漏掉了，要么是你需要手动补充一个链接。

场景三：质量审计——低置信度页面

TABLE tags, confidence, file.mday as 最后修改 FROM "entities" OR "concepts" WHERE confidence = "low" SORT file.mday ASC

AI 提炼时如果只有单一来源，confidence 会标记为 “low”。这些页面需要人工补充其他来源来提升置信度，是维护知识的重点对象。

Kanban —— 学习进度可视化

在 Obsidian 里建一个看板，分成三个列：待学习、进行中、已完成。每次 Hermes 处理完一篇文章，把对应知识点拖到"进行中"，学完了拖到"已完成"。

看板的价值不在工具本身，而是提供了进度感。几十篇文章堆在那里容易焦虑，看板清晰地告诉你：还有几个没看、正在看哪个、已经消化了多少。

Excalidraw —— 画架构图辅助理解

处理复杂概念时，一张图胜过千言万语。Excalidraw 支持手绘风格框图，画 SoC 架构图、MPP 流水线图、AI 推理流程。

画好的图可以直接嵌入到对应的概念页中，用![[文件名.excalidraw]]引用。下次打开知识库，文字描述配架构图，阅读效率高很多。

Obsidian Git —— 自动备份

知识库是长期积累的资产，丢了损失很大。Obsidian Git 每隔30分钟自动提交一次变更，配合远程 Git 仓库，做到增量备份。

配置完成后不需要再操心"有没有保存"这件事。写过的内容自动进入版本管理，随时可以回溯。

插件组合的实际效果

这些插件单独用都只是工具，组合起来效果不一样：

输入场景：浏览器看到好文章 → QuickAdd 快捷键保存到 Inbox → 丢给 Hermes 处理 → AI 自动抓取、提炼、入库

查阅场景：打开 Obsidian → 首页 Dataview 显示"最近添加"和"待审核" → 点击新页面阅读 → 发现孤儿页面 → 补充反向链接

维护场景：定期运行 Dataview 查询低置信度页面 → 补充来源和细节 → 看 Kanban 看板 → 标记已完成

四、LLM Wiki：知识增长的结构化引擎

Obsidian 是容器，LLM Wiki 是规则。后者定义了知识应该以什么结构组织，从而保证知识库能持续增长而不变成垃圾堆。

核心规则只有几条：

三层结构：raw/存原始材料不可修改，entities/存实体（芯片、板卡、工具），concepts/存概念（协议、流程、方法论），comparisons/存对比分析。每层之间的界限清楚。

最低链接数：每个新页面至少要有2个出站[[wikilinks]]。这条规则强制新知识必须与已有知识产生关联——孤立的页面在知识网络里其实不存在。

页面阈值：仅在 ≥2 个来源中出现时创建独立页面。避免为一篇文章的细枝末节创建大量碎片页面。知识库的精炼比数量更重要。

冲突显式化：当新信息与已有内容矛盾时，不覆盖，同时记录两个立场并标记日期。contested字段标记矛盾页面，供人工审核。

这套规则不是 AI 作者自创的，它来自 Andrej Karpathy 提出的"LLM Wiki"模式——让 AI 像人类整理知识一样，持续维护一个不断增长的知识库。

五、从0到1搭建：实际操作步骤

前提条件：一台联网的 Linux 机器（WSL、云服务器、本地虚拟机都行），一个 GitHub 账号，以及 Obsidian（桌面版）。

步骤1：创建知识库目录

mkdir-p~/wiki/{raw/articles,entities,concepts,comparisons,queries}touch~/wiki/SCHEMA.md ~/wiki/index.md ~/wiki/log.md

三条命令，知识库的骨架就有了。

步骤2：配置 Hermes Agent

Hermes 是一个开源 AI 助手框架。安装完成后，在配置文件中指定知识库路径和 LLM Wiki 技能。

关键的技能文件定义了知识库结构、页面模板、处理流程和 Lint 规则。这些都在~/.hermes/skills/research/llm-wiki/下，可以根据自己的需要修改。

步骤2的详细配置

Hermes 安装完成后，关键配置在~/.hermes/config.yaml：

# 配置 LLM Wiki 技能skills:-name:llm-wikiconfig:wiki_path:~/wikiauto_ingest:truemax_pages_per_source:5# 模型配置model_providers:-name:deepseekmodel:deepseek-v4-flash

配置完成后，Hermes 就能自动识别你对知识库的指令。

步骤3的详细配置

Templater 配置文件路径：创建_templates/目录，在里面放两个模板文件。

实体页模板：

---title:<% tp.file.title %>created:<% tp.date.now("YYYY-MM-DD") %>updated:<% tp.date.now("YYYY-MM-DD") %>type:entitytags:[]confidence:mediumsources:[]---

概念页模板：

---title:<% tp.file.title %>created:<% tp.date.now("YYYY-MM-DD") %>updated:<% tp.date.now("YYYY-MM-DD") %>type:concepttags:[]confidence:mediumsources:[]---# <% tp.file.title %>## 概述## 关键内容## 相关页面

Dataview 的配置更简单——装好后不需要额外设置，直接在任意页面写查询代码块即可。

QuickAdd 建议设置一个 Capture 快捷键，绑定到raw/articles/。看到好文章按快捷键，标题和内容自动写入 Inbox 目录。

步骤3：在 Obsidian 中打开知识库

用 Obsidian 打开~/wiki/目录。安装 Dataview、Templater、QuickAdd、Excalidraw、Kanban、Obsidian Git 这些插件。

在设置中配置 Templater 的模板目录（_templates/），创建你的第一个实体页模板和概念页模板，包含完整的 YAML frontmatter 前缀。

步骤4：第一次测试

找一个链接（可以是自己的博客、刚收藏的微信文章），丢给 Hermes，看它怎么处理。

第一次跑通后，检查三个地方：文章是否完整保存到了raw/articles/，知识点是否提炼成了规范的 wiki 页面，[[wikilinks]]是否关联到了已有内容。

步骤5：持续积累

每天花5分钟，处理2-3个收藏链接。一周后知识库有20-30页的知识，一个月后可能超过100页。

关键在于不要追求完美——先入库、先提炼，后续通过 Dataview 查询定期补充和完善。

跟其他方案的对比

有人用 Notion 做知识库，有人用飞书文档，有人用纯文件夹。跟这些方案相比，这套体系的优势在三个方面：

自动化程度。其他方案需要手动整理，这套体系可以 AI 自动化处理。丢链接 → 自动提炼 → 入库关联，全程不需要人介入。

知识关联。文件夹只能单层分类，双向链接可以形成网状结构。一个"OpenCV 移植"的知识点，可以同时关联到"交叉编译工具链"、“MPP 媒体处理”、“鸿鸥派开发板”，跨领域的关联在文件夹里是做不到的。

长期可维护。纯 Markdown 格式 + 本地存储。没有平台锁定，没有数据库依赖。换一个笔记软件，把.md文件复制过去就能用。

不同方案的实际效果对比

维度	传统收藏夹	文件夹+标签	Hermes+LLM Wiki
信息留存率	<5% (看完就忘)	~30% (整理时还记得)	>80% (AI提炼+关联)
搜索效率	靠记忆翻页	关键词搜索	结构化查询+语义检索
知识关联	无	手动建链接	自动[[wikilinks]]关联
长期维护成本	极低(但无用)	高(需手动整理)	低(AI持续处理)
内容可迁移性	浏览器依赖	Markdown可迁移	纯MD+本地存储
团队共享	不行	共享文件夹	Obsidian Sync/Git
防丢失	浏览器同步	手动备份	Git自动版本管理

从表格可以看出，传统收藏夹和文件夹方案有各自的短板，而 Hermes+LLM Wiki 的组合在多个维度上都有明显优势。关键差异在于：大部分方案聚焦"存储"，这套方案聚焦"流动"——让信息从收藏走向知识。

结语

收藏夹吃灰的根源不在于"看了就忘"，而在于信息进了收藏夹就停止了流动。

这套体系的核心思路很简单：让 AI 承担"提炼"和"关联"的工作，你只需要做"收藏"和"学习"这两件事。收藏 → AI 处理 → 入库 → 检索，信息的流动从单向变成闭环。

从今天开始，不妨试试第一步：找一个你收藏了很久但没看的链接，让 AI 帮你处理一次。看到结果，你可能就停不下来了。

实际效果：一个月后的变化

这套体系我跑了约一个月。知识库从0逐步增长到27页（6个实体 + 20个概念 + 1个对比），覆盖了芯片资料、编译系统、MPP媒体处理、AI ISP、U-Boot移植、OpenCV移植等多个方向。

最直观的变化：以前收藏了又忘了的资料，现在能通过关键词搜索秒级定位到。以前感觉"学过但记不清"的问题，现在能通过 [[wikilinks]] 追溯上下文。

另一个意外收获：因为知识是结构化的，不同领域的知识点在 Graph View 里会形成跨域链接。比如 “OpenCV移植” 同时连接了 “交叉编译工具链” 和 “MPP媒体处理流水线”，这种跨领域的关联在传统笔记系统里几乎不可能自然发生。

你可能适合这篇文章如果你：

场景	频率	建议步骤
日常阅读大量技术文章	每天	先装 QuickAdd 降低收藏门槛
正在学习某个技术领域	按需	按文章步骤搭建知识库框架
需要长期积累专业知识	持续	每周投入15分钟维护即可
团队分享和知识沉淀	不定期	多人共建时用 Templater 保一致性

往期推荐：
→ [用 Obsidian + LLM Wiki 搭建嵌入式开发知识库]
→ [Obsidian 插件怎么选？从你的嵌入式项目出发]

👇 长按识别关注，不错过每一篇干货

📌版权所有 © AI的探索之旅| 转载请联系作者