惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

T
Threatpost
V
Vulnerabilities – Threatpost
TaoSecurity Blog
TaoSecurity Blog
C
Cybersecurity and Infrastructure Security Agency CISA
P
Proofpoint News Feed
G
GRAHAM CLULEY
S
Securelist
P
Palo Alto Networks Blog
MongoDB | Blog
MongoDB | Blog
A
Arctic Wolf
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
WordPress大学
WordPress大学
Project Zero
Project Zero
T
Threat Research - Cisco Blogs
L
Lohrmann on Cybersecurity
C
Cyber Attacks, Cyber Crime and Cyber Security
F
Fortinet All Blogs
博客园 - 叶小钗
B
Blog RSS Feed
C
Cisco Blogs
Google DeepMind News
Google DeepMind News
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
Apple Machine Learning Research
Apple Machine Learning Research
G
Google Developers Blog
K
Kaspersky official blog
D
Docker
Latest news
Latest news
Cisco Talos Blog
Cisco Talos Blog
T
Tor Project blog
Cyberwarzone
Cyberwarzone
Security Latest
Security Latest
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
D
Darknet – Hacking Tools, Hacker News & Cyber Security
Spread Privacy
Spread Privacy
Microsoft Azure Blog
Microsoft Azure Blog
C
Check Point Blog
J
Java Code Geeks
Simon Willison's Weblog
Simon Willison's Weblog
T
Tenable Blog
Recent Announcements
Recent Announcements
T
Tailwind CSS Blog
H
Help Net Security
L
LINUX DO - 热门话题
T
The Exploit Database - CXSecurity.com
Jina AI
Jina AI
S
SegmentFault 最新的问题
MyScale Blog
MyScale Blog
NISL@THU
NISL@THU
美团技术团队
腾讯CDC

博客园 - Kent

55种网页常用小技巧 - Kent - 博客园 (转文)IP Domain etc. javascript setTimeout 和 setInterval CodeFile、Src、Codebehind三者的差别解释 - Kent - 博客园 Microsoft SQL Server 2005的国际功能(转贴) SQL Server 中易混淆的数据类型 关于 SQL Server 使用 Unicode 数据 Sys.WebForms.PageRequestManagerParserErrorException 错误的解决办法 SQLserver2005中的四个评价函数 常用DOS命令(转贴) 类的一般标准写法 C#: 为datatable添加column的方法 C#: 三种符号的区别 C#:List 取代数组的方法 javascript:parseFloat javascript:trim function javascript: split & array javascript:eval function Javascript: Replace function.
正则表达式(regular expression)
Kent · 2006-09-23 · via 博客园 - Kent

  正则表达式(regular expression)对象包含一个正则表达式模式(pattern)。它具有用正则表达式模式去匹配或代替一个串(string)中特定字符(或字符集合)的属性(properties)和方法(methods) 要为一个单独的正则表达式添加属性,可以使用正则表达式构造函数(constructor function),无论何时被调用的预设置的正则表达式拥有静态的属性(the predefined RegExp object has static properties that are set whenever any regular expression is used, 我不知道我翻得对不对,将原文列出,请自行翻译)

  • 创建:
    一个文本格式或正则表达式构造函数
    文本格式: /pattern/flags
    正则表达式构造函数: new RegExp("pattern"[,"flags"]);
  • 参数说明:
    pattern --
    一个正则表达式文本
    flags --
    如果存在,将是以下值:
    g:
    全局匹配
    i:
    忽略大小写
    gi:
    以上组合

[注意] 文本格式的参数不用引号,而在用构造函数时的参数需要引号。如:/ab+c/i new RegExp("ab+c","i")是实现一样的功能。在构造函数中,一些特殊字符需要进行转意(在特殊字符前加"\")。如:re = new RegExp("\\w+")

正则表达式中的特殊字符

字符

含意

\

做为转意,即通常在"\"后面的字符不按原来意义解释,如/b/匹配字符"b",当b前面加了反斜杆后/\b/,转意为匹配一个单词的边界。
-
-
对正则表达式功能字符的还原,如"*"匹配它前面元字符0次或多次,/a*/将匹配a,aa,aaa,加了"\"后,/a\*/将只匹配"a*"

^

匹配一个输入或一行的开头,/^a/匹配"an A",而不匹配"An a"

$

匹配一个输入或一行的结尾,/a$/匹配"An a",而不匹配"an A"

*

匹配前面元字符0次或多次,/ba*/将匹配b,ba,baa,baaa

+

匹配前面元字符1次或多次,/ba*/将匹配ba,baa,baaa

?

匹配前面元字符0次或1次,/ba*/将匹配b,ba

(x)

匹配x保存x在名为$1...$9的变量中

x|y

匹配xy

{n}

精确匹配n

{n,}

匹配n次以上

{n,m}

匹配n-m

[xyz]

字符集(character set),匹配这个集合中的任一一个字符(或元字符)

[^xyz]

不匹配这个集合中的任何一个字符

[\b]

匹配一个退格符

\b

匹配一个单词的边界

\B

匹配一个单词的非边界

\cX

这儿,X是一个控制符,/\cM/匹配Ctrl-M

\d

匹配一个字数字符,/\d/ = /[0-9]/

\D

匹配一个非字数字符,/\D/ = /[^0-9]/

\n

匹配一个换行符

\r

匹配一个回车符

\s

匹配一个空白字符,包括\n,\r,\f,\t,\v

\S

匹配一个非空白字符,等于/[^\n\f\r\t\v]/

\t

匹配一个制表符

\v

匹配一个重直制表符

\w

匹配一个可以组成单词的字符(alphanumeric,这是我的意译,含数字),包括下划线,如[\w]匹配"$5.98"中的5,等于[a-zA-Z0-9]

\W

匹配一个不可以组成单词的字符,如[\W]匹配"$5.98"中的$,等于[^a-zA-Z0-9]

说了这么多了,我们来看一些正则表达式的实际应用的例子:

E-mail地址验证:
 function test_email(strEmail) {
  var myReg = /^[_a-z0-9]+@([_a-z0-9]+\.)+[a-z0-9]{2,3}$/;
  if(myReg.test(strEmail)) return true;
  return false;
 }
HTML
代码的屏蔽
 function mask_HTMLCode(strInput) {
   var myReg = /<(\w+)>/;
   return strInput.replace(myReg, "&lt;$1&gt;");
 }

正则表达式对象的属性及方法
  预定义的正则表达式拥有有以下静态属性:input, multiline, lastMatch, lastParen, leftContext, rightContext$1$9。其中inputmultiline可以预设置。其他属性的值在执行过exectest方法后被根据不同条件赋以不同的值。许多属性同时拥有长和短(perl风格)的两个名字,并且,这两个名字指向同一个值。(JavaScript模拟perl的正则表达式)
正则表达式对象的属性

属性

含义

$1...$9

如果它()存在,是匹配到的子串

$_

参见input

$*

参见multiline

$&

参见lastMatch

$+

参见lastParen

$`

参见leftContext

$'         

参见rightContext

constructor   

创建一个对象的一个特殊的函数原型

global      

是否在整个串中匹配(bool)

ignoreCase    

匹配时是否忽略大小写(bool)

input       

被匹配的串

lastIndex    

最后一次匹配的索引

lastParen    

最后一个括号括起来的子串

leftContext   

最近一次匹配以左的子串

multiline    

是否进行多行匹配(bool)

prototype    

允许附加属性给对象

rightContext   

最近一次匹配以右的子串

source      

正则表达式模式

lastIndex    

最后一次匹配的索引


正则表达式对象的方法

方法

含义

compile     

正则表达式比较

exec       

执行查找

test       

进行匹配

toSource     

返回特定对象的定义(literal representing),其值可用来创建一个新的对象。重载Object.toSource方法得到的。

toString     

返回特定对象的串。重载Object.toString方法得到的。

valueOf     

返回特定对象的原始值。重载Object.valueOf方法得到

例子
<script language = "JavaScript">
var myReg = /(\w+)\s(\w+)/;
var str  = "John Smith";
var newstr = str.replace(myReg, "$2, $1");
document.write(newstr);
</script>
将输出"Smith, John"