编程语言您现在的位置是:首页 > 博客日志 > 编程语言

php正则表达式处理方面的一个坑,php中文正则表达式

<a href='mailto:'>微wx笑</a>的头像微wx笑 2019-09-20编程语言 10 0关键字: 正则  表达式  校验  php  

前两天为博客添加功能,评论增加可输入显示个人网址链接功能,其中使用到了正则表达式,但是php的正则表达式处理与Javascript不一致,姓名验证的功能JS处理正常,php就不行了。

前两天为博客添加功能,评论增加可输入显示个人网址链接功能,其中使用到了正则表达式,但是php的正则表达式处理与Javascript不一致,姓名验证的功能JS处理正常,php就不行了。GZD无知

JS代码:

        var reg = /^[\u4E00-\u9FA5A-Za-z0-9]+$/;
        if (formData.author != undefined && formData.author.length > 0){
          if(!reg.test(formData.author)){
              that.toast('姓名格式错误,可包含中文、英文及数字');
              return false;
          }
        }

php代码:

    $author = trim(RepPostVar($add[author]));
    if ($author){
        if (strlen($author) < 5 || strlen($author) > 20){
            lgyPl_v2::printerror("AuthorLenFail","history.go(-1)",1);
        }
          if (!preg_match("/^[\u4E00-\u9FA5A-Za-z0-9]+$/",$author)) {
              lgyPl_v2::printerror("AuthorFail","history.go(-1)",1);
       }
    }

验证电子邮件地址和个人网址的正则表达式都工作正常,估计这个是跟“\u4E00-\u9FA5”有关。GZD无知


GZD无知

解决方案:

php正则表达式匹配中文时的写法与JS不同。GZD无知

如下,是匹配字母或者汉字的,一定要在后面加模式修饰符 u , 不然就出错!JS使用“\u4E00”的形式,php中要使用“\x{4E00}”的形式GZD无知

      	if (!preg_match("/^[\x{4E00}-\x{9FA5}A-Za-z0-9]+$/u",$author)) {
      		lgyPl_v2::printerror("AuthorFail","history.go(-1)",1);
     	}

u (PCRE_UTF8)

此修正符打开一个与 perl 不兼容的附加功能。 模式字符串被认为是utf-8的. 这个修饰符 从 unix 版php 4.1.0 或更高,win32版 php 4.2.3 开始可用。 php 4.3.5 开始检查模式的 utf-8 合法性。GZD无知

utf8格式的匹配模式字符串必须要使用  u 修饰符。 否则出现程序意料之外的异常情况。GZD无知

PHP的中文正则表达式: 

/^[\x{4e00}-\x{9fa5}]+$/u


GZD无知

本文由 微wx笑 创作,采用 署名-非商业性使用-相同方式共享 4.0 许可协议,转载请附上原文出处链接及本声明。
原文链接:https://www.ivu4e.cn/blog/lang/2019-09-20/224.html

很赞哦! () 有话说 ()