当前位置:首页 > 技术分析 > 正文内容

这几种正则表达式的“字符集合”,想要入门regexp函数,必须了解

前言回顾:

大家好,今天我们来分几篇文章讲讲REGEXP正则表达式函数中的正则表达式字符,因为只有掌握了这些字符之后,我们才能结合具体实际需求,编写REGEXP函数的第二参数,将各类符号进行连接组合使用,实现对复杂文本进行匹配、提取和替换的目的。


REGEXP函数是基于正则表达式,对复杂文本进行匹配、提取和替换的函数。


基本语法结构

REGEXP(原始字符串,正则表达式,[匹配模式],[替换内容])


匹配模式是可选项,0或忽略表示提取,1表示判断是否包含,2表示替换。

替换内容是可选项,仅在匹配模式为2时有效,用来替换匹配的内容。


常用的正则表达式核心符号主要大体分为六大类


1.基础元字符



2.量词符



3.定位符



4.字符集合



5.分组与引用



6.特殊符号




今天我们主要讲讲第四大类字符集合这个大类的符号还比较好理解


我们再来结合几个具体的小例子,并运用REGEXP函数代入,感受一下字符集合的含义与作用。




[abc]表示匹配 a、b、c 中的任意一个字符


输入函数公式

=REGEXP(A2,"[ac]")


可以将A2单元格字符串中包含a与c的字母提取,显示出来。


当然了,也可以判断a与c是否存在于A2单元格中,还可以查找a与c,替换为指定的其他值(替换为空即删除)。



[^abc]表示匹配除a、b、c以外的其他字符


输入函数公式

=REGEXP(A2,"[^ac]")


可以将A2单元格字符串中除a与c以外的其他字符提取出来。



[a-z]表示匹配小写字母a到z,即匹配到所有的小写字母


输入函数公式

=REGEXP(A2,"[a-z]")


可以提取到A2单元格字符串中所有的小写字母。



[A-Z0-9]表示匹配大写字母和数字的组合


输入函数公式:

=REGEXP(A2,"[A-Z0-9]")


可以提取到A2单元格字符串中所有的大写字母和数字。



[特殊符号]表示匹配特定符号(需转义或直接写入)


比如说[\+\-*/]表示匹配加减乘除符号,因为加减乘除符号在正则表达式中可能存在特殊的含义与作用,要与加减乘除符号本身相区分的话,必须要在各个符号前面加上符号“\”,符号“\”就是我们常说的转义符。


输入函数公式

=REGEXP(A2,"[\+\-\*\/]")


就可以将A2单元格字符串中包含+-*/(加减乘除)的符号提取出来显示。

当然了,也可以判断+-*/是否存在于A2单元格中,还可以查找+-*/,替换为指定的其他值(替换为空即删除)。



下面我们继续用几个简单的职场实际案例,继续深入理解集合符的具体作用!


案例1

例如我们想要将A列各个单元格中的手机号码提取出来。手机号码有几种格式,一种是包含空格间隔的手机号码,一些是用符号“-”间隔的手机号码,剩余的为正常的手机号码。


我们可以这样输入正则表达式函数

=REGEXP(A2,"[0-9\-\s+]{11,}")

或=REGEXP(A2,"[0-9\-\ ]{11,}")


正则表达式符号含义

[0-9\-\s+]:表示匹配数字、横线-(须加转义符\)或空格

其中\s+:表示1个或多个空格。 红色底色处代表敲击一个空格键产生的,也表示空格。

{11,}:表示至少11位,以适应数量不等的分隔符。




案例2

例如我们想要判断A列各个单元格的产品编号是否含有规则为:"3位大写字母+3位数字+1位大写字母" 的这种信息部分。


我们可以这样输入正则表达式函数

=REGEXP(A2,"[A-Z]{3}-[0-9]{3}-[A-Z]",1)


正则表达式符号含义

[A-Z]{3}:代表3位大写字母。

[0-9]{3}:代表3位数字。

[A-Z]:代表1位大写字母


这样“编号XQD-456-F国产”符合规则,返回TRUE;“编号abc-123-x进口”不符合规则,返回FALSE。




案例3

A列数据是用户账号信息,平台允许只能由字母、数字、下划线组成。我们想要删除文本中的非字母、数字、下划线的字符(如@、#等)。即清理非法字符。


我们可以这样输入正则表达式

=REGEXP.REPLACE(A1, "[^A-Za-z0-9_]", "")


正则表达式符号含义:

[^A-Za-z0-9_]:匹配非字母、数字、下划线的字符


替换为空字符串,实现清理删除目的。




案例4

我们想要提取A列各单元格中的日期数据。日期数据包含两种格式,提取格式为 YYYY/MM/DD 或 YYYY-MM-DD 的日期。


我们可以这样输入函数公式

=REGEXP(A2,"\d{4}[-/]\d{1,2}[-/]\d{1,2}")


正则表达式符号解析

\d{4}:4位年份

[-/]:匹配横线 - 或斜杠 /

\d{1,2}:匹配1位数或2位数的月份或日。


扫描二维码推送至手机访问。

版权声明:本文由ruisui88发布,如需转载请注明出处。

本文链接:http://www.ruisui88.com/post/4585.html

标签: 正则 ?=
分享给朋友:

“这几种正则表达式的“字符集合”,想要入门regexp函数,必须了解” 的相关文章

Linux发行版需要杀软吗?卡巴斯基推出免费KVRT病毒扫描清理工具

IT之家 6 月 4 日消息,你认为使用 Linux 发行版,需要杀毒软件吗?或许很多用户认为 Linux 发行版偏小众,因此受到黑客攻击的风险也相对较小,不过卡巴斯基并不这么认为,近期推出了适用于 Linux 平台的杀毒软件。最新上线的 Linux 版本 Kaspersky Virus Remov...

一次Java内存占用高的排查案例,解释了我对内存问题的所有疑问

问题现象7月25号,我们一服务的内存占用较高,约13G,容器总内存16G,占用约85%,触发了内存报警(阈值85%),而我们是按容器内存60%(9.6G)的比例配置的JVM堆内存。看了下其它服务,同样的堆内存配置,它们内存占用约70%~79%,此服务比其它服务内存占用稍大。那为什么此服务内存占用稍大...

「云原生」Containerd ctr,crictl 和 nerdctl 命令介绍与实战操作

一、概述作为接替Docker运行时的Containerd在早在Kubernetes1.7时就能直接与Kubelet集成使用,只是大部分时候我们因熟悉Docker,在部署集群时采用了默认的dockershim。在V1.24起的版本的kubelet就彻底移除了dockershim,改为默认使用Conta...

佳能 EOS R8 深度评测

佳能 EOS R8 的定位是入门级全画幅无反光镜可换镜头相机。尽管在产品阵容中处于这一位置,R8 仍然是一个强大的相机,配备了先进的 R6 II 同款成像传感器、快速处理器和令人难以置信的自动对焦系统,体积小、重量轻、价格低。这款相机是发烧友、旅行者、家庭以及任何想要全画幅传感器相机的人的绝佳选择。...

三勾点餐系统java+springboot+vue3,开源系统小程序点餐系统

项目简述前台实现:用户浏览菜单、菜品分类筛选、查看菜品详情、菜品多属性、菜品加料、添加购物车、购物车结算、个人订单查询、门店自提、外卖配送、菜品打包等。后台实现:菜品管理、订单管理、会员管理、系统管理、权限管理等。 项目介绍三勾点餐系统基于java+springboot+element-plus+u...

Firefox正针对Vue.js进行优化,下版本响应速度将“显著提升”

IT之家 9 月 7 日消息,据 Mozilla 官方博客发文显示,Firefox 浏览器正针对 Vue.js 进行优化,此前 FireFox 浏览器在面向 Vue 3 时遇到了一些性能问题。▲ 图源 Mozilla 官方博客目前开发人员已经对此进行了解决,在 Firefox 118 内部版本中进行...