zoukankan      html  css  js  c++  java
  • PHP 优化详解

    笔者收集的这些技巧来源较广,完整性不能保证。 由于数量较多,这些优化技巧没有经过测试。请各位看官在使用之前自行测试,毕竟这些技巧是否能派上用场,还是需要由PHP所在的独特环境所决定的。

    目录索引

    1. 找到瓶颈(Finding the Bottleneck)
    2. 缓存 (Caching)
    3. 编译 vs. 解释(Compiling vs. Interpreting)
    4. 代码减肥 (Content Reduction)
    5. 多线程与多进程(Multithreading & Multiprocessing)
    6. 字符串(Strings)
    7. 正则表达式(Regular Expressions)
    8. 迭代结构 (Iteration Constructs (for, while))
    9. 选择结构 (Selection Constructs (if, switch))
    10. 函数与参数 (Functions & Parameters)
    11. 面向对象结构 (Object-Oriented Constructs)
    12. Session处理 (Session Handling)
    13. 类型转换 (Type Casting)
    14. 压缩(Compression)
    15. 错误处理(Error Handling)
    16. 声明、定义与范围(Declarations, Definitions, & Scope)
    17. 内存泄漏(Memory Leaks)
    18. 不要重复发明轮子(Don’t Reinvent the Wheel)
    19. 代码优化(Code Optimization)
    20. 使用RAM(Using RAM Instead of DASD)
    21. 使用服务(Using Services (e.g., SQL))
    22. 安装与配置(Installation & Configuration)
    23. 其他(Other)
     

    找到瓶颈(Finding the Bottleneck)

    面对一个性能问题是,第一步永远是找到问题产生的原因,而不是去看技巧列表。搞明白产生瓶颈的原因,找到目标并且实施修复,然后再重新测试。查找瓶颈只是万里长征的第一步,这里有些常用技巧,希望对最重要的第一步找到瓶颈能有所帮助。

    • 使用监控方法(比如监控宝),进行benchmark和监控,网络,特别是网络状况瞬息万变,做得好的话5分钟就可以找到瓶颈。
    • 剖析代码。必须了解那部分代码耗时最多,在这些地方多多关注。
    • 想找到瓶颈,请检查每个资源请求(比如,网络、CPU、内存、共享内存、文件系统、进程管理、网络连接等等……)
    • 先对迭代结构和复杂的代码进行benchmark
    • 在在真实负载下用真实数据进行真实测试,当然,如果可以最好用产品服务器。

    缓存 (Caching)

    有些人认为缓存是解决性能问题最有效的办法之一,试试这些:

    • 使用OPCODE(操作码)缓存,这样脚本就不会在每次访问时重新编译一次。比如:启用Windows平台上的windows缓存扩展。可以缓存opcode,文件,相对路径,session数据和用户数据。
    • 考虑在多服务器环境下使用分布式缓存
    • 在调用imap_header()之前先调用imap_headers()

    编译 vs. 解释(Compiling vs. Interpreting)

    将PHP源码编译成机器码。动态解释执行同样的编译,但它是按行执行的。编译为opcode是折中选择,它可以将PHP源码翻译为opcode,之后opcode再转为机器码。以下为关于编译与解释的相关技巧:

    • 上线之前将PHP代码编译为机器码。opcode缓存尽管并不是最好的选择,但依旧比解释型来得强。或者,考虑将PHP代码编译成一个C扩展。
    • PHP的opcode编译器(bcompiler)还不能在产品环境中使用,但是开发者应该关注http://php.net/manual/en/book.bcompiler.php.

    代码减肥 (Content Reduction)

    越少越块。 这些技巧可以帮助减少代码:

    • 每页提供更少的功能
    • 清理网页内容
    • 如果解释型执行,请清理注释和其他空白
    • 减少数据库查询

    多线程与多进程(Multithreading & Multiprocessing)

    由快到慢依次为:

    1. 多线程(单一进程中)
    2. 多进程(比如,pcntl_fork,计划任务)
    3. 单进程(一行又一行)

    PHP不支持多线程,但是可以用C写多线程的PHP扩展。有一些办法可以使用多进程或模拟多进程,但支持的并不是很好,没准儿比单进程还慢。

    字符串(Strings)

    字符串处理,是大多数编程语言中最常用的操作之一。这里有些技巧可以帮我们让字符串处理速度更快一些:

    • PHP的连接运算(点运算),是最快的链接方式
    • 避免在print中链接字符串,用逗号分割后用ECHO
    • 尽可能使用str_前缀的字符串函数替代正则表达式
    • pos()比preg_mach()和ereg()都快
    • 有人说单引号包裹字符串比双引号更快,有人说没有区别。当然,如果想在字符串中引用变量,单引号没戏。
    • 如果想判断字符串长度是否小于某值(比如5),请使用isset($s[4])<5。
    • 如需将多个小字符串连接成一个大字符串,试着先开启ob_start输出缓存,再用echo输出到缓冲区,完成后使用ob_get_contents读取字符串

    正则表达式(Regular Expressions)

    正则表达式为们带来了灵活多样的比较与查找字符串的方法,单他的性能开销却着实不低

    • 尽可能使用STR_前缀的字符串处理函数代替正则表达式
    • 使用[aeiou]的不是(a|e|i|o|u)
    • 正则表达式越简单速度越快
    • 尽可能不要设置PCRE_DOTALL修饰符
    • 用^.*代替.*
    • 简化正则表达式。(比如使用a*代替(a+)*

    迭代结构 (Iteration Constructs (for, while))

    迭代(重复,循环)是最基本的结构化编程方法,很难想像有不使用它的程序。这里有些技巧,帮助我们改进迭代结构的性能:

    • 尽可能讲代码移出到循环外(函数调用、SQL查询等等……)
    • 使用i=maxval;while(i–)代替for(i=0;i<maxval;i++),这样可以减少一个操作,如果maxval是一个函数调用就更明显了。
    • 使用foreach迭代集合与数组

    选择结构 (Selection Constructs (if, switch))

    与迭代结构相同,选择结构也是最基本的结构化变成方法。以下技巧或许能改善性能:

    • switches和else-if中,应该将最近常出现true的列在前面,较少出现true的请靠后
    • 有人说if-else比swtich/case快,当然,有人反对。
    • 用elseif替代else if.

    函数与参数 (Functions & Parameters)

    将函数的代码分解成小函数代码可以消除冗余,让代码具有可读性,但代价是什么?这里有些技巧,以帮助更好的使用函数:

    • 引用传递出对象和数组,而不是传值
    • 如果只在一个地方使用,使用内联。如果在多个地方调用,考虑内联,但请注意可维护性
    • 了解你所用函数的复杂度。比如similar_text()为O(N^3),这意味着字符串长度增加一倍,处理时间将增加8倍
    • 不要通过“返回引用”来提升性能,引擎会自动优化它。
    • 以常规方式调用函数,而不是使用call_user_func_array()或eval()

    面向对象结构 (Object-Oriented Constructs)

    PHP的面向对象特性,可能会影响到性能。以下提示可以帮助我们尽量减少这种影响:

    • 不是一切都需要面向对象, 性能的损失可能会超过其优点本身
    • 创建对象比较慢
    • 如果可以,尽可能时候用数组而不是对象
    • 如果一个方法可以静态化,请静态声明
    • 函数调用比派生类方法调用要快,派生类方法调用比基类调用要快
    • 考虑将基类中最常用的代码复制到派生类中,但要注意维护性隐患
    • 避免使用原生的getters与setters。如果不需要他们,请删除并且属性公开
    • 创建复杂的PHP类时,考虑使用单件模式

    Session处理 (Session Handling)

    创建sessions有很多好处,但有时会产生没必要的性能开支。以下技巧可以帮助我们最大限度减少性能开支:

    • 不要使用auto_start
    • 不要启用use_trans_sid
    • 将session_cache_limited设置为private_no_expire
    • 为虚拟主机(vhost)中的每个用户分配自己的目录
    • 使用基于内存的session处理,而不是基于文件的session处理

    类型转换 (Type Casting)

    从一种类型转换为另一种类型需要成本

    压缩(Compression)

    在传输前,压缩文本和数据:

    • 使用ob_start()在代码起始处
    • 使用ob_gzhandler()可以下载提速,但是注意CPU开支
    • Apache的mod_gzip模块可以即使压缩

    错误处理(Error Handling)

    错误处理影响性能。我们能做的是:

    • 记录错误日志,别再使用“@”抑制错误报告,抑制对性能一样有影响
    • 不要只检查错误日志,警告日志一样需要处理

    声明、定义与范围(Declarations, Definitions, & Scope)

    创建一个变量、数组或者对象,对性能都有影响:

    • 有人说,声明和使用全局变量/对象,比局部变量/对象要快,有人反对。请测试再决定。
    • 在使用变量前声明所有变量,不要声明不使用的变量
    • 在循环中尽可能使用$a[],避免使用$a=array(…)

    内存泄漏(Memory Leaks)

    如果内存分配后不释放,这绝对是个问题:

    • 坚持释放资源,不要指望自带/自动的垃圾回收
    • 使用完后尽量注销(unset)变量,尤其是资源类和大数组类型的
    • 使用完毕就关闭数据库连接
    • 每次使用ob_start(),记得ob_end_flush()或者ob_end_clean()

    不要重复发明轮子(Don’t Reinvent the Wheel)

    为什么要花费时间去解决别人已经解决的问题?

    • 了解PHP,了解它的功能和扩展。如果你不知道,可能会无法利用一些现成的功能
    • 使用自带的数组和字符串函数,它们绝对是性能最好的。
    • 前人发明的轮子,并不意味着在你的环境下吸能是最好的,多多测试

    代码优化(Code Optimization)

    • 使用一个opcode optimizer
    • 如果将被解释运行,请精简源码

    使用RAM(Using RAM Instead of DASD)

    RAM比磁盘快很多很多,使用RAM可以提升一些性能:

    • 移动文件到Ramdisk
    • 使用基于内存的session处理,而不是基于文件的session处理

    使用服务(Using Services (e.g., SQL))

    SQL经常被用来访问关系型数据库,但我们的PHP代码可以访问许多不同的服务。下面是一些访问服务是需要牢记的:

    • 不要一遍又一遍地问服务器向东的事情。使用memoization缓存第一次的结果,以后访问直奔缓存;
    • 在SQL中,使用mysql_fetch_assoc()代替mysql_fetch_array(),可以减少结果集中的整数索引。以字段名访问结果集,而不用索引数字。
    • 对于Oracle数据库,如果没有足够的可用内存,增加oci8.default_prefetch。将oci8.statement_cache_size设置为应用中的语句数
    • 请使用mysqli_fetch_array()替换mysqli_fetch_all(), 除非结果集将发送到其他层进行处理。

    安装与配置(Installation & Configuration)

    安装与配置PHP时,请考虑性能:

    • 添加更多内存
    • 删除竞争性的应用与服务
    • 只编译所需要用的扩展
    • 将PHP静态编译进APACHE
    • 使用-O3 CFLAGS开启所有编译器优化
    • 只安装所需使用的模块
    • 升级到最新版本的次要版本。主板本升级,等到第一次bug修复后再进行,当然,也别等太久
    • 为多CPU环境进行配置
    • 使用 -enable-inline-optimization
    • 设置session.save_handler=mm ,以 -with-mmto编译,使用共享内存
    • 使用RAM disk
    • 关闭resister_global和magic_quotes_*
    • 关闭expose_php
    • 关闭 always_populate_raw_post_data 除非你必须使用它
    • 非命令行模式下请关闭register_argc_argv
    • 只在.php文件中使用PHP
    • 优化max_execution_time, max_input_time, memory_limit与output_buffering的参数
    • 将Apache配置文件中allowoverride设置为none提升文件/目录的访问速度
    • 使用-march, -mcpu, -msse, -mmmx, and -mfpmath=sseto使CPU最优化
    • 使用MySQL原生驱动(mysqlnd)替换libmysql、mysqli扩展以及PDO MYSQL驱动
    • 关闭 register_globals、register_long_arrays以及register_argc_argv. 开启auto_globals_jit.

    其他(Other)

    还有些技巧比较难归类:

    • 使用include()、require(),避免使用include_once()和require_once()
    • 在include()/require()中使用绝对路径
    • 静态HTML被PHP生成的HTML要快
    • 使用ctype_alnum、ctype_alpha以及ctype_digit代替正则表达式
    • 使用简单的servlets或CGI
    • 代码在产品环境中使用时,尽可能写日志
    • 使用输出缓冲
    • 请使用isset($a)代替比较$a==null;请使用$a===null代替is_nul($a)
    • 需要脚本开始执行时间,请直接读取$_SERVER[’REQUEST_TIME’],而不是使用time()
    • 使用echo替代print
    • 使用前自增(++i)代替后自增(i++),大多数编译器现在都会优化,但是他们不优化时,请保持这样的写法。
    • 处理XML,使用正则表达式代替DOM或者SAX
    • HASH算法:md4, md5, crc32, crc32b, sha1比其他的散列速度都要快
    • 使用spl_autoload_extensions时,文件扩展名请按最常用–>最不常用的顺序,尽量排除掉压根不用的。
    • 使用fsockopen或fopen时,使用IP地址代替域名;如果只有一个域名,使用gethostbyname()可以获取IP地址。使用cURL速度会更快。
    • 但凡可能,用静态内容代替动态内容。
  • 相关阅读:
    [USACO 2012 Feb B]Moo
    [Atcoder ARC124] XOR Matching 2-小思维 | 暴力
    loj数列分块入门
    2019牛客暑期多校2-Partition problem深搜
    Codeforces 1554C
    [USACO 2012 Feb G]Cow Coupons----贪心&带悔(看完稳AC)
    Codeforces 220B-Little Elephant and Array-扫描线 & 树状数组
    [AtCoder ARC098] Donation| 建图 | 树型dp
    关于幂等性以及怎么实现幂等性
    【OOM】解决思路
  • 原文地址:https://www.cnblogs.com/doseoer/p/6288127.html
Copyright © 2011-2022 走看看