当前位置: 首页 > news >正文

读书笔记:更智能的数据库索引:只关注你需要的数据

我们的文章会在微信公众号IT民工的龙马人生和博客网站( www.htz.pw )同步更新 ,欢迎关注收藏,也欢迎大家转载,但是请在文章开始地方标注文章出处,谢谢!
由于博客中有大量代码,通过页面浏览效果更佳。

本文为个人学习《Expert Oracle Database Architecture Techniques and Solutions for High Performance and Productivity(第四版本》一书过程中的笔记与理解分享,仅用于学习与交流,部分内容参考原书观点并结合>实际经验进行整理。若涉及版权问题,请联系删除或沟通处理。也请大家支持购买原版书籍。

更智能的数据库索引:只关注你需要的数据

在日常的数据库操作中,我们经常遇到这样的情况:一个庞大的数据表,其中只有一小部分数据是我们真正关心的。比如一个订单表,大部分订单都是“已完成”状态,而我们经常需要快速查找那些“未处理”的订单。

传统的索引方式就像是在图书馆里为每一本书都制作一张索引卡片——无论这本书你是否需要。这不仅浪费空间,还会降低更新效率。

smarter 的索引方案

通过函数索引,我们可以实现“选择性索引”——只为那些我们关心的数据创建索引。这就好比只为你经常查阅的书籍制作索引卡片。

具体做法:

CREATE INDEX processed_flag_idx 
ON big_table(CASE temporary WHEN 'N' THEN 'N' END);

这个索引只会为值为'N'的记录创建索引条目,完全忽略其他值。带来的好处十分明显:

  • 索引大小从 14MB 降至 32KB
  • 索引层级从 3 层减少到 2 层
  • 查询速度更快,维护成本更低

解决复杂业务约束的妙招

函数索引还能巧妙解决一些复杂的业务规则。比如要求:

  • 活跃项目名称必须唯一
  • 非活跃项目名称可以重复

通过一个简单的函数索引就能实现:

CREATE UNIQUE INDEX active_projects_must_be_unique
ON projects(CASE WHEN status = 'ACTIVE' THEN name END);

这个索引只会对活跃项目的名称进行唯一性检查,完全不影响非活跃项目。

使用时要注意的细节

虽然函数索引很强大,但使用时需要注意一些细节。比如在使用 TO_DATE 函数时:

-- 这样会报错
CREATE INDEX t_idx ON t(TO_DATE(year, 'YYYY'));-- 这样可以
CREATE INDEX t_idx ON t(TO_DATE('01'||year, 'MMYYYY'));

原因在于'YYYY'格式的日期会随着当前月份变化,不是确定性的。而'MMYYYY'格式是明确且确定的。

权衡利弊

函数索引虽然会略微影响数据插入和更新的速度,但这种影响通常很小。考虑到:

  • 数据通常只插入一次,但会被查询成千上万次
  • 查询性能的提升远远超过插入时的微小开销

因此,在大多数情况下,使用函数索引都是利远大于弊的。

通过这种智能的索引方式,我们可以让数据库系统更加高效地为我们服务,既能快速查询需要的数据,又不会浪费不必要的存储空间和计算资源。

------------------作者介绍-----------------------
姓名:黄廷忠
现就职:Oracle中国高级服务团队
曾就职:OceanBase、云和恩墨、东方龙马等
电话、微信、QQ:18081072613
个人博客: (http://www.htz.pw)
CSDN地址: (https://blog.csdn.net/wwwhtzpw)
博客园地址: (https://www.cnblogs.com/www-htz-pw)

http://www.rkmt.cn/news/8981.html

相关文章:

  • 关于天猫精灵喵控的初步拆机研究
  • C++完全攻略:从新手到高手的编程进化之路 - 详解
  • Visual Studio 报错:“9_自定义命令”名称在默认命名空间“9_自定义命令”中无效。请更正项目文件中的 RootNamespace 标记值。
  • 图解23:datetime和timestamp的区别
  • 在Java中识别泛型信息
  • Kali Linux 光标与快捷键全攻略
  • Docker - ZZH Ubuntu Image - Desktop
  • 图解17:5中网络IO模型
  • 【session反序列化】 - 指南
  • 在k8s集群中解决master节点与node通信
  • PHP中常见数组操作函数
  • 修复Ubuntu系统文件损坏:手动fsck指令
  • window表现驱动开发—视频呈现网络简介
  • 一类特征方程在数列递推中的应用
  • 深入解析:GC 算法的种类及垃圾收集器
  • rust跨文件调用代码
  • 深入解析:深度学习从入门到精通 - AutoML与神经网络搜索(NAS):自动化模型设计未来
  • 个人项目-文本查重
  • 深入解析:[数据结构] LinkedList
  • 数字图像基础知识
  • 设置Redis在CentOS7上的自启动配置
  • 挂载配置文件以Docker启动Redis服务
  • ​​Final Cut Pro 11.0 for Mac 剪视频安装教程|DMG文件安装步骤详解​(附安装包)
  • 实用指南:物联网赋能24H共享书屋:智能化借阅管理的完整解决方案!
  • 准备工作之动态内存分配[基于郝斌课程]
  • 2025.6第一套六级听力生词
  • CSP-S 2025游记
  • atof() - 字符串转double类型
  • 深入解析:解密llama.cpp:从Prompt到Response的完整技术流程剖析
  • 详细介绍:深圳比斯特|电池组PACK自动化生产线厂家概述