3. 量词
量词也称重复。掌握{m,n}的准确含义后,只需要记住一些简写形式。
3.1 简写形式
{m,} 表示至少出现m次。
{m} 等价于{m,m},表示出现m次。
? 等价于{0,1},表示出现或者不出现。记忆方式:问号的意思表示,有吗?
+ 等价于{1,},表示出现至少一次。记忆方式:加号是追加的意思,得先有一个,然后才考虑追加。
* 等价于{0,},表示出现任意次,有可能不出现。记忆方式:看看天上的星星,可能一颗没有,可能零散有几颗,可能数也数不过来。
3.2 贪婪匹配和惰性匹配
看如下的例子
- var regex = /\d{2,5}/g;
- var string = "123 1234 12345 123456";
- console.log( string.match(regex) );
- // => ["123", "1234", "12345", "12345"]
其中正则/\d{2,5}/,表示数字连续出现2到5次。会匹配2位、3位、4位、5位连续数字。
但是其是贪婪的,它会尽可能多的匹配。你能给我6个,我就要5个。你能给我3个,我就3要个。反正只要在能力范围内,越多越好。
我们知道有时贪婪不是一件好事(请看文章最后一个例子)。而惰性匹配,就是尽可能少的匹配:
- var regex = /\d{2,5}?/g;
- var string = "123 1234 12345 123456";
- console.log( string.match(regex) );
- // => ["12", "12", "34", "12", "34", "12", "34", "56"]
其中/\d{2,5}?/表示,虽然2到5次都行,当2个就够的时候,就不在往下尝试了。
通过在量词后面加个问号就能实现惰性匹配,因此所有惰性匹配情形如下:
- {m,n}?
- {m,}?
- ??
- +?
- *?
对惰性匹配的记忆方式是:量词后面加个问号,问一问你知足了吗,你很贪婪吗?
4. 多选分支
一个模式可以实现横向和纵向模糊匹配。而多选分支可以支持多个子模式任选其一。
具体形式如下:(p1|p2|p3),其中p1、p2和p3是子模式,用|(管道符)分隔,表示其中任何之一。
例如要匹配”good”和”nice”可以使用/good|nice/。测试如下:
- var regex = /good|nice/g;
- var string = "good idea, nice try.";
- console.log( string.match(regex) );
- // => ["good", "nice"]
但有个事实我们应该注意,比如我用/good|goodbye/,去匹配”goodbye”字符串时,结果是”good”:
- var regex = /good|goodbye/g;
- var string = "goodbye";
- console.log( string.match(regex) );
- // => ["good"]
而把正则改成/goodbye|good/,结果是:
- var regex = /goodbye|good/g;
- var string = "goodbye";
- console.log( string.match(regex) );
- // => ["goodbye"]
也就是说,分支结构也是惰性的,即当前面的匹配上了,后面的就不再尝试了。
4.1 匹配16进制颜色值
要求匹配:
ffbbad
Fc01DF
FFF
ffE
分析:
表示一个16进制字符,可以用字符组[0-9a-fA-F]。
其中字符可以出现3或6次,需要是用量词和分支结构。
使用分支结构时,需要注意顺序。
正则如下:
- var regex = /#([0-9a-fA-F]{6}|[0-9a-fA-F]{3})/g;
- var string = "#ffbbad #Fc01DF #FFF #ffE";
- console.log( string.match(regex) );
- // => ["#ffbbad", "#Fc01DF", "#FFF", "#ffE"]
4.2 匹配时间
以24小时制为例。
要求匹配:
23:59
02:07
分析:
共4位数字,第一位数字可以为[0-2]。
当第1位为2时,第2位可以为[0-3],其他情况时,第2位为[0-9]。
第3位数字为[0-5],第4位为[0-9]
正则如下:
- var regex = /^([01][0-9]|[2][0-3]):[0-5][0-9]$/;
- console.log( regex.test("23:59") );
- console.log( regex.test("02:07") );
- // => true
- // => true
4.3 匹配日期
比如yyyy-mm-dd格式为例。
要求匹配:
2017-06-10
分析:
年,四位数字即可,可用[0-9]{4}。
月,共12个月,分两种情况01、02、……、09和10、11、12,可用(0[1-9]|1[0-2])。
日,最大31天,可用(0[1-9]|[12][0-9]|3[01])。
正则如下:
- var regex = /^[0-9]{4}-(0[1-9]|1[0-2])-(0[1-9]|[12][0-9]|3[01])$/;
- console.log( regex.test("2017-06-10") );
- // => true