php正则表达式处理方面的一个坑,php中文正则表达式
微wx笑 2019-09-20【编程语言】 10 0关键字: 正则 表达式 校验 php
前两天为博客添加功能,评论增加可输入显示个人网址链接功能,其中使用到了正则表达式,但是php的正则表达式处理与Javascript不一致,姓名验证的功能JS处理正常,php就不行了。
前两天为博客添加功能,评论增加可输入显示个人网址链接功能,其中使用到了正则表达式,但是php的正则表达式处理与Javascript不一致,姓名验证的功能JS处理正常,php就不行了。
JS代码:
var reg = /^[\u4E00-\u9FA5A-Za-z0-9]+$/; if (formData.author != undefined && formData.author.length > 0){ if(!reg.test(formData.author)){ that.toast('姓名格式错误,可包含中文、英文及数字'); return false; } }
php代码:
$author = trim(RepPostVar($add[author])); if ($author){ if (strlen($author) < 5 || strlen($author) > 20){ lgyPl_v2::printerror("AuthorLenFail","history.go(-1)",1); } if (!preg_match("/^[\u4E00-\u9FA5A-Za-z0-9]+$/",$author)) { lgyPl_v2::printerror("AuthorFail","history.go(-1)",1); } }
验证电子邮件地址和个人网址的正则表达式都工作正常,估计这个是跟“\u4E00-\u9FA5”有关。
解决方案:
php正则表达式匹配中文时的写法与JS不同。
如下,是匹配字母或者汉字的,一定要在后面加模式修饰符 u , 不然就出错!JS使用“\u4E00”的形式,php中要使用“\x{4E00}”的形式
if (!preg_match("/^[\x{4E00}-\x{9FA5}A-Za-z0-9]+$/u",$author)) { lgyPl_v2::printerror("AuthorFail","history.go(-1)",1); }
u (PCRE_UTF8)
此修正符打开一个与 perl 不兼容的附加功能。 模式字符串被认为是utf-8的. 这个修饰符 从 unix 版php 4.1.0 或更高,win32版 php 4.2.3 开始可用。 php 4.3.5 开始检查模式的 utf-8 合法性。
utf8格式的匹配模式字符串必须要使用 u 修饰符。 否则出现程序意料之外的异常情况。
PHP的中文正则表达式:
/^[\x{4e00}-\x{9fa5}]+$/u
本文由 微wx笑 创作,采用 署名-非商业性使用-相同方式共享 4.0 许可协议,转载请附上原文出处链接及本声明。
原文链接:https://www.ivu4e.cn/blog/lang/2019-09-20/224.html