zoukankan      html  css  js  c++  java
  • php过滤ascii控制字符

    版权声明:程序猿小鱼 https://blog.csdn.net/u012664888/article/details/25575715
    还记得曾经在工作中,将爬来的其他站点的数据导到xml。可是会遇到一个问题:即网页会有ascII的控制字符。
    一開始以为是别人为了防止採集而增加的。然后发现一个就往过滤表里加一个。

    直到慢慢发现,他们都是ascii表里的字符。

    找到原因了,就好攻克了。

     /**
      * 依据ascii码过滤控制字符
      * @param type $string
      */
     public static function special_filter($string)
     {
      if(!$string) return '';
     
      $new_string = '';
      for($i =0; isset($string[$i]); $i++)
      {
       $asc_code = ord($string[$i]);	//得到其asc码
       
       //下面代码旨在过滤非法字符
       if($asc_code == 9 || $asc_code == 10 || $asc_code == 13){
        $new_string .= ' ';
       }
       else if($asc_code > 31 && $asc_code != 127){
        $new_string .= $string[$i];
       }
      }
     
      return trim($new_string);
     }


查看全文
  • 相关阅读:
    os和sys模块
    time模块
    collections模块
    re模块
    Python初识一
    Python闭包函数
    压栈
    isinstance()和issubclass()
    匿名函数--lambda函数
    机器学习入门文章
  • 原文地址:https://www.cnblogs.com/ldxsuanfa/p/10561742.html
  • Copyright © 2011-2022 走看看