php正则表达式处理方面的一个坑,php中文正则表达式
微wx笑
 2019-09-20【编程语言】
 10
 0关键字:
正则  表达式  校验  php  
前两天为博客添加功能,评论增加可输入显示个人网址链接功能,其中使用到了正则表达式,但是php的正则表达式处理与Javascript不一致,姓名验证的功能JS处理正常,php就不行了。
前两天为博客添加功能,评论增加可输入显示个人网址链接功能,其中使用到了正则表达式,但是php的正则表达式处理与Javascript不一致,姓名验证的功能JS处理正常,php就不行了。
JS代码:
        var reg = /^[\u4E00-\u9FA5A-Za-z0-9]+$/;
        if (formData.author != undefined && formData.author.length > 0){
          if(!reg.test(formData.author)){
              that.toast('姓名格式错误,可包含中文、英文及数字');
              return false;
          }
        }php代码:
    $author = trim(RepPostVar($add[author]));
    if ($author){
        if (strlen($author) < 5 || strlen($author) > 20){
            lgyPl_v2::printerror("AuthorLenFail","history.go(-1)",1);
        }
          if (!preg_match("/^[\u4E00-\u9FA5A-Za-z0-9]+$/",$author)) {
              lgyPl_v2::printerror("AuthorFail","history.go(-1)",1);
       }
    }验证电子邮件地址和个人网址的正则表达式都工作正常,估计这个是跟“\u4E00-\u9FA5”有关。
解决方案:
php正则表达式匹配中文时的写法与JS不同。
如下,是匹配字母或者汉字的,一定要在后面加模式修饰符 u , 不然就出错!JS使用“\u4E00”的形式,php中要使用“\x{4E00}”的形式
      	if (!preg_match("/^[\x{4E00}-\x{9FA5}A-Za-z0-9]+$/u",$author)) {
      		lgyPl_v2::printerror("AuthorFail","history.go(-1)",1);
     	}u (PCRE_UTF8)
此修正符打开一个与 perl 不兼容的附加功能。 模式字符串被认为是utf-8的. 这个修饰符 从 unix 版php 4.1.0 或更高,win32版 php 4.2.3 开始可用。 php 4.3.5 开始检查模式的 utf-8 合法性。
utf8格式的匹配模式字符串必须要使用 u 修饰符。 否则出现程序意料之外的异常情况。
PHP的中文正则表达式:
/^[\x{4e00}-\x{9fa5}]+$/u本文由 微wx笑 创作,采用 署名-非商业性使用-相同方式共享 4.0  许可协议,转载请附上原文出处链接及本声明。
原文链接:https://www.ivu4e.cn/blog/lang/2019-09-20/224.html



