JavaScript正则表达式简介

正则表达式就是一个用来描述字符模式的对象。它被用来在文本中执行模式匹配(pattern-matching)以及”查找-替换”(search-and-replace)的任务。JavaScript中正则的风格类似Perl中正则的风格。

正则表达式是事先声明一组规则,用于匹配字符串中的字符。在字符串查找、替换等应用中非常实用,在javascript中对正则表达式有很好的支持,提供了RegExp对象来支持正则表达式。

基本语法

元字符

在正则表达式的模式中,有一些字符是有特殊含义的,被称为元字符。元字符都是针对单个字符匹配的。

 \w 匹配大小写英文字符及数字 0 到 9 之间的任意一个及下划线,相当于 [a-zA-Z0-9_]

 \W 不匹配大小写英文字符及数字 0 到 9 之间的任意一个,相当于 [^a-zA-Z0-9_]

 \s 匹配任何空白字符,相当于 [ \f\n\r\t\v]

 \S 匹配任何非空白字符,相当于 [^\s]

 \d 匹配任何 0 到 9 之间的单个数字,相当于 [0-9]

 \D 不匹配任何 0 到 9 之间的单个数字,相当于 [^0-9]

 [\u4e00-\u9fa5] 匹配任意单个汉字(这里用的是 Unicode 编码表示汉字的 )

如:将自定字符串中的数字替换成‘-’符号

// 将msg变量定义字符串中的数字替换成‘-’字符串
var msg = "j1a2v3a4s5c6r7i8p9t";
msg = msg.replace(/\d+/g, "-");
alert(msg);

界定符

比较通用的正则表达式界定符是双斜杠 /regex/。如:下面将替换掉msg字符串两端的空白。

var msg = "  javascript  ";
msg = msg.replace(/(^\s+)|(\s+$)/g, "");
alert("|" + msg + "|");

原子的概念

正则表达式中的原子分为可见原子和不可见原子。

 [\f\n\r\t\v] 属于不可见原子,其他表示可见原子

量词

 \* 匹配 0 到多个元字符,相当于 {0,}

 ? 匹配 0 到 1 个元字符,相当于 {0,1}

 {n} 匹配 n 个元字符

 {n,} 匹配至少 n 个元字符

 {n,m} 匹配 n 到 m 个元字符

 \+ 匹配至少 1 个元字符,相当于 {1,}

如:将字符串中2个以上的a替换成个‘-’字符

var msg = "javascaaariaapt";
msg = msg.replace(/a{2,}/g, "-");
alert(msg);

边界

 \b 匹配单词边界

 ^ 字符串必须以指定的字符开始

 $ 字符串必须以指定的字符结束

如:去掉字符串开始的a和结束的b

var msg = "aaajavascaaariaaptbbb";
msg = msg.replace(/(^a+)|(b+$)/g, "");
alert(msg);

捕获分组

正则表达式中,使用 () 将若干单位(可以是字符,正则表达式)组织在一起,成为一个独立单元。

正则表达式中,分组分为捕获分组和非捕获分组。

如:替换掉指定字符串首尾的空白字符。

var msg = "  javascript ";
alert( msg.replace(/(^\s+)|(\s+$)/g, "") );
游手好闲地学习,并不比学习游手好闲好。 —— 约翰·贝勒斯
0 不喜欢
说说我的看法 -
全部评论(
没有评论
关于
本网站专注于 Java、数据库(MySQL、Oracle)、Linux、软件架构及大数据等多领域技术知识分享。涵盖丰富的原创与精选技术文章,助力技术传播与交流。无论是技术新手渴望入门,还是资深开发者寻求进阶,这里都能为您提供深度见解与实用经验,让复杂编码变得轻松易懂,携手共赴技术提升新高度。如有侵权,请来信告知:hxstrive@outlook.com
公众号