正则表达式

限定符

?(问号前的字符可有可无)

*(匹配0个或多个字符)

+(匹配出现一次以上的字符)

{范围如2,6}(指定次数)

如果要匹配多个字符用括号括起来

| : 或者

[] : 匹配由特定构成的单词 如果出现^则匹配除^以外的字符

例如0-9代表所有的非数字字符,但是包含换行符

元字符

\d : 代表数字字符

\w : 代表单词字符(英文、数字以及下滑线)

\s :代表空白符(包含Tab和换行)

\D : 非数字字符

\W : 非单词字符

\S : 非空白字符

. : 代表任意字符

^号匹配行首

$匹配行尾

贪婪与懒惰

<.+>会匹配所有包括<>

<.+?>就不会