当前位置: 首页 > news >正文

实用指南:TimescaleDB 超表 物理表解释

一、PostgreSQL 基础存储逻辑(TimescaleDB 继承此机制)

PostgreSQL 的扩展,因此数据文件的就是TimescaleDB 底层存储逻辑完全继承 PostgreSQL。在 PostgreSQL 中:

  • 每个数据库对应 $PGDATA/base/<数据库 OID>目录(截图中路径为 /usr/local/pgsql/data/base/1723017230是数据库的 OID)。

  • 每个表(包括超表、普通表、分块后的 Chunk)对应一个关系档案节点(relfilenode)​,存储在数据库目录下的子目录中,子目录名即 relfilenode(如截图中的 1892518917等)。

二、TimescaleDB 超表的“物理分块”特性

TimescaleDB 超表的核心是水平分块(Chunking)​​:超表会被按时间范围(或其他维度)拆分为多个Chunk,每个 Chunk 是一个独立的 PostgreSQL 表(在底层存储上与普通表无差异)。

因此,超表的“物理存储”本质是多个 Chunk 对应的 PostgreSQL 表的集合,每个 Chunk 都有自己的 relfilenode 和数据文件。

三、数据文件类型及作用(以截图为例)

截图中展示了多个文件,核心类型包括主数据文件_fsm文件、_vm文件,以下逐一解释:

1. 主数据文件(如 1892518917等)
  • 作用​:存储表的行数据,是表的核心存储载体。

  • 结构​:

    • PostgreSQL 页面大小默认 8KB,数据文件按“页面”组织,每个页面存储若干行素材。

    • 单个数据文件最大为 1GB(可通过参数调整),超过 1GB 时会自动生成分片文件​(如 18925.118925.2…),每个分片仍为 1GB 内。

  • 示例​:截图中 18925大小为 104.31MB,是某张表(或 Chunk)的主数据文件,存储该对象的实际行数据。

2. _fsm文件(如 18925_fsm18917_fsm
  • 全称​:Free Space Map(空闲空间映射)。

  • 作用​:跟踪数据文件中哪些页面有空闲空间,支援 PostgreSQL 高效分配存储(如 INSERT 时迅速找到有足够空间的页面,避免频繁页面分裂)。

  • 特性​:

    • 每个主数据文件对应一个 _fsm文件。

    • 文件大小固定为 8KB(与 PostgreSQL 页面大小一致,按“页面”管理空闲空间信息)。

3. _vm文件(如 18925_vm18917_vm
  • 全称​:Visibility Map(可见性映射)。

  • 作用​:记录数据文件中哪些页面的所有元组对所有事务可见​(即已提交且未被后续事务修改)。

  • 特性​:

    • 每个主数据文件对应一个 _vm文件。

    • 加速 VACUUM(跳过无需清理死元组的页面)和查询(跳过需检查可见性的页面),提升性能。

    • 文件大小固定为 8KB(同页面大小)。

四、TimescaleDB 超表的文件“映射关系”

超表 → 多个 Chunk(每个 Chunk 是 PostgreSQL 表)→ 每个 Chunk 对应一套数据文件(主数据文件 + _fsm+ _vm+ 可能的分片文件)。

例如:

  • 超表 metrics按时间分块为 chunk_2023Q1chunk_2023Q2

  • chunk_2023Q1对应 relfilenode 18925,其文件为 18925(主数据)、18925_fsm18925_vm

  • chunk_2023Q2对应 relfilenode 18917,其文件为 18917(主数据)、18917_fsm18917_vm

五、额外补充:元数据与索引文件

除了上述数据文件,TimescaleDB 超表还涉及:

  • 系统表元数据​:超表的定义(如分块策略、维度列)存储在 _timescaledb_catalog模式的系统表中(如 hypertableschunks)。

  • 索引文件​:超表的索引(如时间索引、哈希索引)也以独立 PostgreSQL 表存在,对应自己的 relfilenode 和数据文件(结构与普通表一致)。

总结

TimescaleDB 超表的数据文件本质是多个 PostgreSQL 表(Chunk)的文件集合,每个 Chunk 包含:

  • 主数据文件(存储行数据,超 1GB 分片);

  • _fsm文件(空闲空间管理);

  • _vm文件(可见性优化)。

此种设计既复用了 PostgreSQL 成熟的存储引擎,又通过“分块”达成了时序数据的高效水平扩展。

http://www.rkmt.cn/news/30643.html

相关文章:

  • 记力扣2271.毯子覆盖的最多白色砖块数 练习理解 - 详解
  • 精通-Pandas-探索性分析-全-
  • 精通-HTML5-表单-全-
  • ABC429F Shortest Path Query 题解
  • 苏维埃日报08.高三生福音?大屏课表软件ClassIsland助你度过高三
  • 创建平面设计网站-全-
  • 2025年靠谱的方形冷却塔,横流式冷却塔用户口碑最好的厂家榜
  • 2025年知名的薄型液压缸,多级液压缸实力厂家TOP推荐榜
  • 2025年优质的定量包装机,自动吨袋包装机厂家最新用户好评榜
  • 2025年优质的移动盘式过滤机,真空过滤机最新TOP品牌厂家排行
  • 2025年优质的涤纶单层网布,鞋材单层网布厂家最新推荐权威榜
  • 2025年靠谱的粉末冶金,粉末冶金齿轮厂家推荐及采购参考
  • 2025年热门的吸塑PET片,食品级PET片品牌厂家排行榜
  • 2025年热门的发电机组,柴油发电机组厂家最新推荐排行榜
  • quicker目录
  • [SHELL] 个人BASH配置与美化
  • [AI应用开发平台] Coze:AI应用开发平台
  • [网络] [TOOL] 为什么要使用ss工具替代netstat?
  • [网络] [TCP] Linux UDP Socket 学习指南
  • 品牌故事不会写?这个AI指令可能帮你解决大问题
  • 电梯调度编程结对项目总结
  • 第二次作业--田佳吉
  • 启动分布式mapreduce的过程以及prompt
  • 20232310 2025-2026-1 《网络与系统攻防技术》实验三实验报告
  • [SWPUCTF 2024 秋季新生赛]http标头 WP
  • 20251025 之所思 - 人生如梦
  • 为什么Java/Python程序无需关心内存释放?揭秘垃圾回收(GC)的核心概念
  • 从图像到文本:详解藏文OCR的实现过程与核心技术
  • Jerrum–Sinclair 全有或全无定理
  • 初步学习计算机相关知识有感 - fang