php正则表达式处理方面的一个坑,php中文正则表达式
微wx笑
2019-09-20【编程语言】
262
10
0关键字:
正则 表达式 校验 php
前两天为博客添加功能,评论增加可输入显示个人网址链接功能,其中使用到了正则表达式,但是php的正则表达式处理与Javascript不一致,姓名验证的功能JS处理正常,php就不行了。
目录
前两天为博客添加功能,评论增加可输入显示个人网址链接功能,其中使用到了正则表达式,但是php的正则表达式处理与Javascript不一致,姓名验证的功能JS处理正常,php就不行了。
JS代码:
1 2 3 4 5 6 7 | var reg = /^[\u4E00-\u9FA5A-Za-z0-9]+$/; if (formData.author != undefined && formData.author.length > 0){ if (!reg.test(formData.author)){ that.toast( '姓名格式错误,可包含中文、英文及数字' ); return false ; } } |
php代码:
1 2 3 4 5 6 7 8 9 | $author = trim(RepPostVar( $add [author])); if ( $author ){ if ( strlen ( $author ) < 5 || strlen ( $author ) > 20){ lgyPl_v2::printerror( "AuthorLenFail" , "history.go(-1)" ,1); } if (!preg_match( "/^[\u4E00-\u9FA5A-Za-z0-9]+$/" , $author )) { lgyPl_v2::printerror( "AuthorFail" , "history.go(-1)" ,1); } } |
验证电子邮件地址和个人网址的正则表达式都工作正常,估计这个是跟“\u4E00-\u9FA5”有关。
解决方案:
php正则表达式匹配中文时的写法与JS不同。
如下,是匹配字母或者汉字的,一定要在后面加模式修饰符 u , 不然就出错!JS使用“\u4E00”的形式,php中要使用“\x{4E00}”的形式
1 2 3 | if (!preg_match( "/^[\x{4E00}-\x{9FA5}A-Za-z0-9]+$/u" , $author )) { lgyPl_v2::printerror( "AuthorFail" , "history.go(-1)" ,1); } |
u (PCRE_UTF8)
此修正符打开一个与 perl 不兼容的附加功能。 模式字符串被认为是utf-8的. 这个修饰符 从 unix 版php 4.1.0 或更高,win32版 php 4.2.3 开始可用。 php 4.3.5 开始检查模式的 utf-8 合法性。
utf8格式的匹配模式字符串必须要使用 u 修饰符。 否则出现程序意料之外的异常情况。
PHP的中文正则表达式:
1 | /^[\x{4e00}-\x{9fa5}]+$/u |
本文由 微wx笑 创作,采用 署名-非商业性使用-相同方式共享 4.0 许可协议,转载请附上原文出处链接及本声明。
原文链接:https://www.ivu4e.cn/blog/lang/2019-09-20/224.html