前面章节介绍了正则表达式的懒惰和贪心匹配,本章节将介绍占有匹配。
占有匹配会覆盖整个目标然后尝试寻找匹配内容,但它只尝试一次,不会回溯。占有匹配就是在普通量词之后添加一个加号(+)。它不 “咀嚼” 而是直接 “吞咽”,然后才想知道 “吃” 的是什么。
占有匹配很像贪心匹配,它会选定尽可能多的内容。但与贪心匹配不同的是它不进行回溯。它不会放弃所找到的内容,它很自私,这也是把它称为占有匹配的原因。它紧紧 “抱” 住自己所选的内容,一点也不放弃。
但占有匹配的优点是速度快,因为不需要回溯。当然,匹配失败的话也很快。
为了理解这一点,我们先尝试匹配以 5 开头的多个 5,然后再匹配以5结尾的多个 5。
在 RegexBuddy 中,输入如下以5开头的表达式:
上图中,所有的 5 都被标亮了。占有匹配看起来和贪心匹配是一样的,但没有回溯。在 RegexBuddy 中,输入这个带有 5 结尾的表达式去证明这一点:
上图中,没有任何匹配,原因就是它没有回溯。它一下就选定所有的输入,不再回过来查看。因此没在结尾找到 5,也不知道该从哪里找起。
如果将加号去掉,它会找到所有的 5,因为它变成了贪心匹配了。如下图:
占有量词和其他量词配合使用,如下表: