面对海量销售数据按城市分类统计常给人带来诸多头疼的地方。传统筛选及透视表功能能起一定作用。可是一旦数据格式不统一或者城市名称带空格又或者有别名其统计效率就会大幅降低。REGEXP函数正是专门为处理这类问题才出现的。它通过正则表达式来匹配模式能够快速地从毫无条理的文本里提取出需要的信息这样就让城市层面的销售统计工作变得简单高效、干脆利落。城市名称不统一怎么办在实际业务将开展的进程当中的时候于同一座城市而言在不一样的表格之内其书写方式那真可谓是各种各样、纷繁复杂。就像“北京市”它存在着被写成“北京”的可能性也有被写成“BJ”的概率甚至还会出现带有括号的“北京(总部)”这样的形式样式表述表现。要是直接采用运用VLOOKUP函数或者IF嵌套函数进行来处理应对随着内容持续不断地增加增多会越写越混乱无序后期的维护成本花销也会极其高昂繁多。而在这样一种情形状况之下REGEXP函数所具有具备的模式匹配匹配能力便能够施展发挥出作用效能了。比如你手上持有一列销售记录其中城市字段展现出不一样的写法多种诸如“上海东区”“上海 - 核心”“上海市域”等等。处于这般情形下依靠 REGEXP 函数并搭配一个简易的模式好比“上海”就能够把所有含有该关键词的记录精确提取出来。更为进阶的用法是首先去建立一张标准城市对照表紧接着运用正则表达式为每一个城市设定多个匹配模式像这样的话仅仅只需要一条公式便能够完成以往需要多层IF才可以实现的城市归类操作。用REGEXP你还能够过滤掉干扰内容像“广州(天河区)”这种带有括号的写法运用模式“[^\\(]”就能够仅仅提取括号前面的城市名接着与标准表进行匹配如此一来即便原始数据来源杂乱无的统计结果依旧清晰无误有标点。学习REGEXP需要从哪里入手初次接触正则表达式的不少人会因其中的符号而心生畏惧实际上只要掌握几个基础模式便能够解决百分之八十的销售统计方面的问题首先推荐从“匹配开头结尾”这个概念着手“匹配任意字符”这个概念其次“匹配数字”这个概念随后与之对应的符号分别是^$.以及\\d。着手拿实际发生的案例去加以练习操的方法效率是最为高妙的去寻觅一份本公司所拥有着的销售数据先是试着运用REGEXP把呈现为“城市-区域”样式的格式拆解分隔成为两列接着再去进行从“城市金额”这样的文本里将金额之总和提取出来的操作每成功解决一个不起眼的小问题你对于正则表达式的理解就会在程度上深上一层。下面是具有更强系统性的后续学习路径首先要对REGEXP的三个关键参数也就是文本、模式以及替换文本进行极为全面且到位至极的透彻理解。在已然对这三个参数拥有了深入至极的把握过后紧接着就要立即展开开展针对常用模式组合的学习。比如说“匹配中文字符”之时可选用采用[\\u4e00-\\u9fa5]这样一种模式而“匹配括号内内容”的时候则会采用运用\\([^)]*\\)此种方式。