Hermes+Obsidian+llmwiki AI如何将收藏夹变成你的第二大脑
作者:科技界的一粒微尘
每天都在收藏,从来没看过?一个链接丢给 AI 助手,自动提炼、分类、入库,这才是收藏的正确姿势
老规矩先看效果图:从收藏夹链接->Hermes智能体->LLMwiki实现ingest
你收藏了多少篇文章?打开浏览器的收藏夹、微信的"保存"、知乎的"收藏"——里面躺着几百条链接,但真正再打开看过的,可能不到10%。这个问题困扰了很多人,包括我。
过去半年,我搭建了一套从"收藏"到"知识"的完整流水线。核心就三个组件:
Hermes(AI助手) + Obsidian(笔记系统) + LLM Wiki(知识库框架)
效果很直接:看到一个想收藏的链接,丢给 AI → 自动抓取原文 → 提炼知识点 → 写入个人知识库 → 永久可检索。整个过程不需要我动手复制粘贴。
这篇文章就把这套体系完整拆解出来。
一、核心逻辑:三级处理管线
这套体系的核心不在于工具本身,而在于信息的处理层级。
很多人收藏夹吃灰的根本原因:信息只经过了"存储"这一步,没有经过"提炼"和"结构化"。
原始材料层(raw/):原文快照,不可修改。相当于收藏夹的数字备份。你去抓一个网页,原文原封不动保存下来,带时间戳和来源地址。这一步确保哪天想回头看原始内容,随时能找到。
知识层(entities + concepts):经 AI 提炼后的结构化知识。从一篇文章中提取出核心概念、实体、数据、踩坑记录,写成独立的知识页面。页面之间用[[wikilinks]]双向链接,形成知识网络。
检索层:本地 RAG(TF-IDF 向量检索)或 Dataview 查询。知识写进去了还得能找回来。通过关键词搜索或结构化查询,秒级定位到相关页面。
收藏夹里100条链接 → AI 帮你变成100个知识点 → 知识点之间自动关联 → 每次搜索都能找到上下文。
三级知识管线:原始材料层 / 知识层 / 检索层
二、Hermes:AI 驱动的全自动管线
Hermes 是一个开源的 AI Agent 框架。在这套体系里,它承担信息处理管线中的核心角色。
收到一个链接后,它的处理流程:
抓取原文:访问链接 → 提取文章正文和代码块 → 保存为 Markdown 格式,带上来源 URL 和 SHA256 哈希作为完整性校验。这一步对应"收藏",但比浏览器收藏夹多了全文备份。
知识提炼:阅读文章 → 识别核心概念和技术点 → 判断适合创建"实体页"还是"概念页" → 生成符合 SCHEMA 规范的 YAML frontmatter → 写入知识库。
关联入网:新建的页面自动添加最低2个[[wikilinks]]指向已有页面。如果新知识点涉及已有的概念(比如 OpenCV 移植涉及交叉编译工具链),会在知识库中找到对应的页面,形成双向链接。
索引维护:更新知识库目录(index.md),追加操作日志(log.md),记录处理时间和来源。下次你再丢一个链接,AI 能立刻判断这是新知识点还是已有内容的补充。
真实案例:处理一篇技术文章
昨天我丢给 Hermes 一个链接:海思芯片 OpenCV 移植说明(来自易百纳技术社区)。
AI 的处理结果是:
原文保存:10,084 字的完整文章保存到raw/articles/,带来源 URL 和时间戳。
提炼概念页:创建了一篇 2,323 字的知识页面《OpenCV 交叉编译与移植》,包含:
cmake-gui 配置要点:指定 aarch64-mix210-linux 交叉编译器,设置目标架构为 ARM64
编译踩坑记录:PNG ARM NEON 宏定义兼容问题修复方法、glibc features.h 宏括号错误修复
MPP Sample 集成方案:Makefile.param 头文件路径添加、Makefile 链接库配置、Mat 与 MPP frame 互转
关联已有知识:自动添加了5个双向链接 →[[BSP 编译系统]]、[[交叉编译工具链]]、[[MPP 媒体处理流水线]]、[[鸿鸥派 HongOU PI]]
做完这些,知识库从26页变成了27页。每个知识点都不是孤岛,而是网络中的一个节点。
从收到链接到完成入库,整个过程由AI自动完成
三、Obsidian 插件:让知识库变得可用
Hermes 负责"写",Obsidian 负责"读"。光有内容不够,还得能用得顺手。以下是我筛选出来的插件组合,每个都有明确的用途。
围绕 wiki vault 的8个核心插件,各司其职
Dataview —— 把笔记库当数据库查
当知识库膨胀到几十上百页时,靠人肉翻目录是不现实的。Dataview 让 YAML frontmatter 变成了可查询的数据库字段。
每个 wiki 页面都带有这样的元数据:
type: entity | concept | comparison | query | summary tags: [build, hisi, tutorial] confidence: high | medium | low sources: [raw/articles/xxx.md]有了这些字段,一行查询就能找到你需要的内容。查低置信度页面(待审核):WHERE confidence = "low"→ 列出所有置信度低的页面,定期补充
查最近30天创建:WHERE file.cday >= date(today) - dur(30 days)→ 新的知识回顾
查孤儿页面(没有入链):WHERE length(file.inlinks) = 0→ 发现孤立知识点,补充反向链接
按标签筛选实体:WHERE contains(tags, "hisi")→ 只看海思相关的内容
这些查询可以直接写在知识库的首页 index.md 底部,每次打开自动刷新,比手动维护目录高效得多。
Templater —— 一键创建结构化页面
手工写 YAML frontmatter 很烦,有了 Templater,一切自动化。
创建一个模板文件,指定created字段自动填充当天日期,type、tags预填默认值,sources留空待补充。每次按快捷键Alt+N选模板,输入文件名,一个格式规范的新页面就自动生成。
用模板的好处是一致性。如果团队多人协作或 AI 与人工混编,统一的 frontmatter 结构让后续的 Dataview 查询和知识库 lint 检测都能正常工作。
QuickAdd —— 一键捕获到 inbox
看到好文章但没时间处理?QuickAdd 解决这个问题。
设置一个 Capture 模式,快捷键触发,弹窗输入标题和内容,自动保存到raw/articles/,文件名按日期自动命名。等你有空了再丢给 Hermes 做知识提炼。
这一步降低了"收藏"的门槛——不需要打开 Obsidian,不需要想放在哪个文件夹,一按快捷键,内容进 Inbox。
Dataview 的典型查询场景
以下三个查询在你搭建好知识库后可以立刻用起来:
场景一:每周回顾——查看本周新增的知识点
TABLE type, tags, file.cday as 创建日期 FROM "entities" OR "concepts" WHERE file.cday >= date(today) - dur(7 days) SORT file.cday DESC这个查询列出最近7天新增的所有实体页和概念页。如果某篇文章处理完后你还没读,这就是提醒清单。
场景二:体检检查——发现孤立页面
TABLE length(file.inlinks) as 入链数 FROM "entities" OR "concepts" WHERE length(file.inlinks) = 0 SORT file.ctime DESC入链数为0的页面就是知识网络中的"孤岛"。发现一个孤岛,说明这条知识还没有和其他内容产生关联——要么是 AI 处理时漏掉了,要么是你需要手动补充一个链接。
场景三:质量审计——低置信度页面
TABLE tags, confidence, file.mday as 最后修改 FROM "entities" OR "concepts" WHERE confidence = "low" SORT file.mday ASCAI 提炼时如果只有单一来源,confidence 会标记为 “low”。这些页面需要人工补充其他来源来提升置信度,是维护知识的重点对象。
Kanban —— 学习进度可视化
在 Obsidian 里建一个看板,分成三个列:待学习、进行中、已完成。每次 Hermes 处理完一篇文章,把对应知识点拖到"进行中",学完了拖到"已完成"。
看板的价值不在工具本身,而是提供了进度感。几十篇文章堆在那里容易焦虑,看板清晰地告诉你:还有几个没看、正在看哪个、已经消化了多少。
Excalidraw —— 画架构图辅助理解
处理复杂概念时,一张图胜过千言万语。Excalidraw 支持手绘风格框图,画 SoC 架构图、MPP 流水线图、AI 推理流程。
画好的图可以直接嵌入到对应的概念页中,用![[文件名.excalidraw]]引用。下次打开知识库,文字描述配架构图,阅读效率高很多。
Obsidian Git —— 自动备份
知识库是长期积累的资产,丢了损失很大。Obsidian Git 每隔30分钟自动提交一次变更,配合远程 Git 仓库,做到增量备份。
配置完成后不需要再操心"有没有保存"这件事。写过的内容自动进入版本管理,随时可以回溯。
插件组合的实际效果
这些插件单独用都只是工具,组合起来效果不一样:
输入场景:浏览器看到好文章 → QuickAdd 快捷键保存到 Inbox → 丢给 Hermes 处理 → AI 自动抓取、提炼、入库
查阅场景:打开 Obsidian → 首页 Dataview 显示"最近添加"和"待审核" → 点击新页面阅读 → 发现孤儿页面 → 补充反向链接
维护场景:定期运行 Dataview 查询低置信度页面 → 补充来源和细节 → 看 Kanban 看板 → 标记已完成
四、LLM Wiki:知识增长的结构化引擎
Obsidian 是容器,LLM Wiki 是规则。后者定义了知识应该以什么结构组织,从而保证知识库能持续增长而不变成垃圾堆。
核心规则只有几条:
三层结构:raw/存原始材料不可修改,entities/存实体(芯片、板卡、工具),concepts/存概念(协议、流程、方法论),comparisons/存对比分析。每层之间的界限清楚。
最低链接数:每个新页面至少要有2个出站[[wikilinks]]。这条规则强制新知识必须与已有知识产生关联——孤立的页面在知识网络里其实不存在。
页面阈值:仅在 ≥2 个来源中出现时创建独立页面。避免为一篇文章的细枝末节创建大量碎片页面。知识库的精炼比数量更重要。
冲突显式化:当新信息与已有内容矛盾时,不覆盖,同时记录两个立场并标记日期。contested字段标记矛盾页面,供人工审核。
这套规则不是 AI 作者自创的,它来自 Andrej Karpathy 提出的"LLM Wiki"模式——让 AI 像人类整理知识一样,持续维护一个不断增长的知识库。
五、从0到1搭建:实际操作步骤
前提条件:一台联网的 Linux 机器(WSL、云服务器、本地虚拟机都行),一个 GitHub 账号,以及 Obsidian(桌面版)。
步骤1:创建知识库目录
mkdir-p~/wiki/{raw/articles,entities,concepts,comparisons,queries}touch~/wiki/SCHEMA.md ~/wiki/index.md ~/wiki/log.md三条命令,知识库的骨架就有了。
步骤2:配置 Hermes Agent
Hermes 是一个开源 AI 助手框架。安装完成后,在配置文件中指定知识库路径和 LLM Wiki 技能。
关键的技能文件定义了知识库结构、页面模板、处理流程和 Lint 规则。这些都在~/.hermes/skills/research/llm-wiki/下,可以根据自己的需要修改。
步骤2的详细配置
Hermes 安装完成后,关键配置在~/.hermes/config.yaml:
# 配置 LLM Wiki 技能skills:-name:llm-wikiconfig:wiki_path:~/wikiauto_ingest:truemax_pages_per_source:5# 模型配置model_providers:-name:deepseekmodel:deepseek-v4-flash配置完成后,Hermes 就能自动识别你对知识库的指令。
步骤3的详细配置
Templater 配置文件路径:创建_templates/目录,在里面放两个模板文件。
实体页模板:
---title:<% tp.file.title %>created:<% tp.date.now("YYYY-MM-DD") %>updated:<% tp.date.now("YYYY-MM-DD") %>type:entitytags:[]confidence:mediumsources:[]---概念页模板:
---title:<% tp.file.title %>created:<% tp.date.now("YYYY-MM-DD") %>updated:<% tp.date.now("YYYY-MM-DD") %>type:concepttags:[]confidence:mediumsources:[]---# <% tp.file.title %>## 概述## 关键内容## 相关页面Dataview 的配置更简单——装好后不需要额外设置,直接在任意页面写查询代码块即可。
QuickAdd 建议设置一个 Capture 快捷键,绑定到raw/articles/。看到好文章按快捷键,标题和内容自动写入 Inbox 目录。
步骤3:在 Obsidian 中打开知识库
用 Obsidian 打开~/wiki/目录。安装 Dataview、Templater、QuickAdd、Excalidraw、Kanban、Obsidian Git 这些插件。
在设置中配置 Templater 的模板目录(_templates/),创建你的第一个实体页模板和概念页模板,包含完整的 YAML frontmatter 前缀。
步骤4:第一次测试
找一个链接(可以是自己的博客、刚收藏的微信文章),丢给 Hermes,看它怎么处理。
第一次跑通后,检查三个地方:文章是否完整保存到了raw/articles/,知识点是否提炼成了规范的 wiki 页面,[[wikilinks]]是否关联到了已有内容。
步骤5:持续积累
每天花5分钟,处理2-3个收藏链接。一周后知识库有20-30页的知识,一个月后可能超过100页。
关键在于不要追求完美——先入库、先提炼,后续通过 Dataview 查询定期补充和完善。
跟其他方案的对比
有人用 Notion 做知识库,有人用飞书文档,有人用纯文件夹。跟这些方案相比,这套体系的优势在三个方面:
自动化程度。其他方案需要手动整理,这套体系可以 AI 自动化处理。丢链接 → 自动提炼 → 入库关联,全程不需要人介入。
知识关联。文件夹只能单层分类,双向链接可以形成网状结构。一个"OpenCV 移植"的知识点,可以同时关联到"交叉编译工具链"、“MPP 媒体处理”、“鸿鸥派开发板”,跨领域的关联在文件夹里是做不到的。
长期可维护。纯 Markdown 格式 + 本地存储。没有平台锁定,没有数据库依赖。换一个笔记软件,把.md文件复制过去就能用。
不同方案的实际效果对比
| 维度 | 传统收藏夹 | 文件夹+标签 | Hermes+LLM Wiki |
|---|---|---|---|
| 信息留存率 | <5% (看完就忘) | ~30% (整理时还记得) | >80% (AI提炼+关联) |
| 搜索效率 | 靠记忆翻页 | 关键词搜索 | 结构化查询+语义检索 |
| 知识关联 | 无 | 手动建链接 | 自动[[wikilinks]]关联 |
| 长期维护成本 | 极低(但无用) | 高(需手动整理) | 低(AI持续处理) |
| 内容可迁移性 | 浏览器依赖 | Markdown可迁移 | 纯MD+本地存储 |
| 团队共享 | 不行 | 共享文件夹 | Obsidian Sync/Git |
| 防丢失 | 浏览器同步 | 手动备份 | Git自动版本管理 |
从表格可以看出,传统收藏夹和文件夹方案有各自的短板,而 Hermes+LLM Wiki 的组合在多个维度上都有明显优势。关键差异在于:大部分方案聚焦"存储",这套方案聚焦"流动"——让信息从收藏走向知识。
结语
收藏夹吃灰的根源不在于"看了就忘",而在于信息进了收藏夹就停止了流动。
这套体系的核心思路很简单:让 AI 承担"提炼"和"关联"的工作,你只需要做"收藏"和"学习"这两件事。收藏 → AI 处理 → 入库 → 检索,信息的流动从单向变成闭环。
从今天开始,不妨试试第一步:找一个你收藏了很久但没看的链接,让 AI 帮你处理一次。看到结果,你可能就停不下来了。
实际效果:一个月后的变化
这套体系我跑了约一个月。知识库从0逐步增长到27页(6个实体 + 20个概念 + 1个对比),覆盖了芯片资料、编译系统、MPP媒体处理、AI ISP、U-Boot移植、OpenCV移植等多个方向。
最直观的变化:以前收藏了又忘了的资料,现在能通过关键词搜索秒级定位到。以前感觉"学过但记不清"的问题,现在能通过 [[wikilinks]] 追溯上下文。
另一个意外收获:因为知识是结构化的,不同领域的知识点在 Graph View 里会形成跨域链接。比如 “OpenCV移植” 同时连接了 “交叉编译工具链” 和 “MPP媒体处理流水线”,这种跨领域的关联在传统笔记系统里几乎不可能自然发生。
你可能适合这篇文章如果你:
| 场景 | 频率 | 建议步骤 |
|---|---|---|
| 日常阅读大量技术文章 | 每天 | 先装 QuickAdd 降低收藏门槛 |
| 正在学习某个技术领域 | 按需 | 按文章步骤搭建知识库框架 |
| 需要长期积累专业知识 | 持续 | 每周投入15分钟维护即可 |
| 团队分享和知识沉淀 | 不定期 | 多人共建时用 Templater 保一致性 |
往期推荐:
→ [用 Obsidian + LLM Wiki 搭建嵌入式开发知识库]
→ [Obsidian 插件怎么选?从你的嵌入式项目出发]
👇 长按识别关注,不错过每一篇干货
📌版权所有 © AI的探索之旅| 转载请联系作者