好好学一遍JavaScript 笔记(七)——RegExp对象与常用正则

来源:岁月联盟 编辑:exp 时间:2012-02-15

javaScript RegExp对象:
global——Boolean值、表示g(全局选项)是否已设置
ignoreCase——Boolean值、表示i(忽略大小写选项)是否已设置
lastIndex——整数、代表下次匹配将会从哪个字符位置开始(只有当使用exec()或test()函数才会填入、否则为0)
multiline——Boolean值、表示m(多行模式选项)是否已设置
source——正则表达式的源字符串形式。例如、表达式/[ba]*/的source将返回"[ba]*"。
一般不会使用global、ignoreCase、multiline和source属性、因为一般之前就已知道了这些数据。
真正有用的属性是lastIndex、它可以告诉你正则表达式在某个字符串中停止之前、查找了多远。
[javascript]
var sToMatch = "bbq is short for barbecue";  
var reB = /b/g;  
reB.exec(sToMatch);    
alert(reB.lastIndex);    //out: 1  
reB.exec(sToMatch);    
alert(reB.lastIndex);    //out: 2   
reB.exec(sToMatch);    
alert(reB.lastIndex);    //out: 18  
reB.exec(sToMatch);    
alert(reB.lastIndex);    //out: 21   
正则表达式reB查找的是b。当它首次检测sToMatch时、
它发现在第一个位置——也就是位置0——是b;
因此、lastIndex属性就被设置成1、
而再次调用exec()时就从这个地方开始执行。
再次调用exec()、表达式在位置1又发现了b、
于是将lastIndex设值为2.第三次调用时、发现b在位置17、
于是又将lastIndex设值为18、如此继续。
如果想从头开始匹配、则可以将lastIndex设为0。
静态属性:
[javascript]
/** 
  * 它们都有两个名字:一个复杂名字和一个以美元符号开头的简短名字。 
  * 长名        短名     描述 
  * input        $_     最后用于匹配的字符串(传递给exec()或test()的字符串) 
  * lastMatch    <span><span class="comment">$&</span></span>     最后匹配的字符 
  * lastParen    $+     最后匹配的分组 
  * leftContext  $`     在上次匹配的前面的子串 
  * multiline    $*     用于指定是否所有表达式都使用多行模式的布尔值 
  * rightContext $'     在上次匹配之后的子串 
  */  
 var sToMatch = "古道西风瘦马、夕阳西下、断肠人在天涯!";    
 var reB = /(西)风/g;  
 reB.test(sToMatch);  
 alert(RegExp.$_);  //out:古道西风瘦马、夕阳西下、断肠人在天涯!  
 alert(RegExp.leftContext);  //out:古道   
 /* 
  * 使用短名时有些字符是不合法的需要使用[]  
  * ["$'"] 
  * ["$+"] 
  * ["<span><span class="comment">$&</span></span>"]   
  * ["$`"] 
  */  
 alert(RegExp["<span><span class="string">$'</span></span>"]);  //out:瘦马、夕阳西下、断肠人在天涯!   
常用正则验证——原链接:http://topic.csdn.net/u/20080820/14/dadb903c-8724-422e-a3bd-f2f1c4e812c6.html
[javascript]
^/d+$  //匹配非负整数(正整数 + 0)   
^[0-9]*[1-9][0-9]*$  //匹配正整数   
^((-/d+)|(0+))$  //匹配非正整数(负整数 + 0)   
^-[0-9]*[1-9][0-9]*$  //匹配负整数   
^-?/d+$    //匹配整数   
^/d+(/./d+)?$  //匹配非负浮点数(正浮点数 + 0)   
^(([0-9]+/.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*/.[0-9]+)|([0-9]*[1-9][0-9]*))$  //匹配正浮点数   
^((-/d+(/./d+)?)|(0+(/.0+)?))$  //匹配非正浮点数(负浮点数 + 0)   
^(-(([0-9]+/.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*/.[0-9]+)|([0-9]*[1-9][0-9]*)))$  //匹配负浮点数   
^(-?/d+)(/./d+)?$  //匹配浮点数   
^[A-Za-z]+$  //匹配由26个英文字母组成的字符串   
^[A-Z]+$  //匹配由26个英文字母的大写组成的字符串   
^[a-z]+$  //匹配由26个英文字母的小写组成的字符串   
^[A-Za-z0-9]+$  //匹配由数字和26个英文字母组成的字符串   
^/w+$  //匹配由数字、26个英文字母或者下划线组成的字符串   
^[/w-]+(/.[/w-]+)*@[/w-]+(/.[/w-]+)+$    //匹配email地址   
^[a-zA-z]+://匹配(/w+(-/w+)*)(/.(/w+(-/w+)*))*(/?/S*)?$  //匹配url   
匹配中文字符的正则表达式: [/u4e00-/u9fa5]   
匹配双字节字符(包括汉字在内):[^/x00-/xff]  
应用:计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)  
String.prototype.len=function(){return this.replace([^/x00-/xff]/g,"aa").length;}   
匹配空行的正则表达式:/n[/s| ]*/r   
匹配HTML标记的正则表达式:/<(.*)>.*<///1>|<(.*) //>/   
匹配首尾空格的正则表达式:(^/s*)|(/s*$)  
[javascript]
/* 正则表达式用例 
* 1、^/S+[a-z A-Z]$ 不能为空 不能有空格  只能是英文字母  
  * 2、/S{6,}         不能为空 六位以上  
  * 3、^/d+$          不能有空格 不能非数字  
  * 4、(.*)(/.jpg|/.bmp)$ 只能是jpg和bmp格式  
  * 5、^/d{4}/-/d{1,2}-/d{1,2}$ 只能是2004-10-22格式  
  * 6、^0$            至少选一项  
  * 7、^0{2,}$        至少选两项  
  * 8、^[/s|/S]{20,}$ 不能为空 二十字以上  
  * 9、^/+?[a-z0-9](([-+.]|[_]+)?[a-z0-9]+)*@([a-z0-9]+(/.|/-))+[a-z]{2,6}$邮件  
  * 10、/w+([-+.]/w+)*@/w+([-.]/w+)*/./w+([-.]/w+)*([,;]/s*/w+([-+.]/w+)*@/w+([-.]/w+)*/./w+([-.]/w+)*)* 输入多个地址用逗号或空格分隔邮件  
  * 11、^(/([0-9]+/))?[0-9]{7,8}$电话号码7位或8位或前面有区号例如(022)87341628  
  * 12、^[a-z A-Z 0-9 _]+@[a-z A-Z 0-9 _]+(/.[a-z A-Z 0-9 _]+)+(/,[a-z A-Z 0-9 _]+@[a-z A-Z 0-9 _]+(/.[a-z A-Z 0-9 _]+)+)*$  
  *     只能是字母、数字、下划线;必须有@和.同时格式要规范 邮件  
  * 13 ^/w+@/w+(/./w+)+(/,/w+@/w+(/./w+)+)*$上面表达式也可以写成这样子,更精练。  
    14   ^/w+((-/w+)|(/./w+))*/@/w+((/.|-)/w+)*/./w+$  
补充:
[javascript]
21。匹配空行的正则表达式:/n[/s| ]*/r  
21。匹配空行的正则表达式:/^/s*$/m  
  
22。匹配HTML标记的正则表达式:/<(.*)>.*<///1>|<(.*)//>/  
22。匹配HTML标记的正则表达式:/<([^>]+)>[^<>]*<///1>|<([^>]+)//>/  
这个实际上作用不大,因为正则表达式不能支持嵌套匹配,仅 .NET 的表达式引擎有这个功能。  
  
23。匹配首尾空格的正则表达式:(^/s*)|(/s*$)  
23。匹配首尾空格的正则表达式:^/s+|/s+$  
为 JavaScript 的 String 增加 trim() 函数:  
String.prototype.trim = function() {  
return this.replace(/^/s+/, '').replace(//s+$/, '');  
}  
  
* 4、(.*)(/.jpg|/.bmp)$ 只能是jpg和bmp格式  
* 4、([^.]+)/.(jpg|bmp) 只能是jpg和bmp格式  
  
* 8、^[/s|/S]{20,}$ 不能为空 二十字以上  
* 8、^/S{20,}$ 不能为空 二十字以上  

常用正则链接:
http://www.aslibra.com/doc/regex.htm
http://www.jb51.net/article/21484.htm
http://www.blueidea.com/tech/program/2004/2273.asp
http://www.douban.com/group/topic/3402632/
http://www.blogjava.net/Vikings/archive/2006/01/06/26893.html

摘自 旦旦而学的专栏