zoukankan      html  css  js  c++  java
  • PrepareStatement的功与过

    PrepareStatement的功与过

    背景

    最近同事说遇到一个问题:"使用JDBC驱动进行PrepareStatemet查询时,同一个SQL,当传递某些参数时执行特别慢(用psql命令行单独执行又特别快)。初步分析:JDBC里的执行计划选择不正确,当表的数据分布不均匀,且SQL传递参数不一样时,PrepareStatement仍然用的原来的执行计划”。最后的解决方案和结论是:

    • 方案是通过在jdbcURL上设置参数"prepareThreshold=0"解决(项目使用的PostgreSQL数据库)
    • 结论是prepareThreshold参数默认是5,客户端会编译并缓存preparestatement的执行计划,设置为0就能禁用客户端缓存

    疑问

    • 首先,对解决方案本身没有疑问,因为设置这个参数后,日志里打印出这个SQL确实快了,问题确实解决了。
    • 主要的疑问产生在“客户端会编译并缓存preparestatement的执行计划,设置为0就能禁用客户端缓存”在这个结论上。感觉这个结论是错误的,主要因为生成执行计划需要很多数据库的元信息和统计值等,jdbc驱动很难自己生成执行计划。

    PrepareStatement的功与过

    PrepareStatement的主要作用是什么呢?有一些经验的Java程序员都知道:

    • 通过参数化可以防止SQL注入
    • 可以提高性能,数据库服务不用每次都硬解析SQL生成执行计划

    PrepareStatement会引入哪些问题呢?

    • 遇到最多的是因为SQL只编译解析一次,执行计划的重用导致会忽略实际传入的参数对执行计划的影响。

    prepareThreshold 参数的含义

    那么JDBC 驱动到底能不能编译SQL并生成执行计划么?prepareThreshold=0的含义是什么呢?

    参阅了几遍官方文档一篇博客及查看了PostgreSQL JDBC驱动源码后总算明白了,起码算是逻辑自洽了。

    • 首先,prepareThreshold 是一个开关,开启server prepare的开关,即开启重用SQL的开关。

      public static void main(String args[]) throws Exception
      	{
      	    Class.forName("org.postgresql.Driver");
      	    String url = "jdbc:postgresql://xx.xx.14.173:6362/abase";
      	    Connection conn = DriverManager.getConnection(url,"sa","123456");
      
      	    PreparedStatement pstmt = conn.prepareStatement("SELECT ?");
      
      	    // cast to the pg extension interface
      	    org.postgresql.PGStatement pgstmt = pstmt.unwrap(org.postgresql.PGStatement.class);
      
      	    // on the third execution start using server side statements
      	    pgstmt.setPrepareThreshold(0);
      
      	    for (int i=1; i<=5; i++)
      	    {
      	        pstmt.setInt(1,i);
      	        boolean usingServerPrepare = pgstmt.isUseServerPrepare();
      	        ResultSet rs = pstmt.executeQuery();
      	        rs.next();
      	        System.out.println("Execution: "+i+", Used server side: " + usingServerPrepare + ", Result: "+rs.getInt(1));
      	        rs.close();
      	    }
      
      	    pstmt.close();
      	    conn.close();
      	}
      
      • pgstmt.setPrepareThreshold(0);时,结果为:

        Execution: 1, Used server side: false, Result: 1
        Execution: 2, Used server side: false, Result: 2
        Execution: 3, Used server side: false, Result: 3
        Execution: 4, Used server side: false, Result: 4
        Execution: 5, Used server side: false, Result: 5
        
        
      • pgstmt.setPrepareThreshold(1);时,结果为:

        Execution: 1, Used server side: true, Result: 1
        Execution: 2, Used server side: true, Result: 2
        Execution: 3, Used server side: true, Result: 3
        Execution: 4, Used server side: true, Result: 4
        Execution: 5, Used server side: true, Result: 5
        
      • pgstmt.setPrepareThreshold(2);时,结果为:

        Execution: 1, Used server side: false, Result: 1
        Execution: 2, Used server side: true, Result: 2
        Execution: 3, Used server side: true, Result: 3
        Execution: 4, Used server side: true, Result: 4
        Execution: 5, Used server side: true, Result: 5
        
    • SQL的解析过程

      postgres=# create table test as select 111 a; /*测试表*/
      postgres=> show log_parser_stats ; /*log_parser_stats参数为开启状态*/
      log_parser_stats
      ------------------
       on
      postgres=# show log_planner_stats ; /*log_planner_stats参数为开启状态*/
      log_planner_stats
      -------------------
       on
      

      java 测试程序

       public static void main(String args[]) {
      		try {
      			Class.forName("org.postgresql.Driver").newInstance();
      			String url = "jdbc:postgresql://xx.xx.14.173:6362/abase?prepareThreshold=3";
      			Connection conn = DriverManager.getConnection(url, "sa", "123456");
      			int foovalue = 111;
      			PreparedStatement st = conn.prepareStatement("SELECT * FROM test WHERE a = ?");
      			st.setInt(1, foovalue);
      			ResultSet rs = st.executeQuery();
      			ResultSet rs1 = st.executeQuery();
      			ResultSet rs2 = st.executeQuery();
      			ResultSet rs3 = st.executeQuery();
      			while (rs3.next()) {
      				System.out.println(rs3.getString(1));
      			}
      			rs.close();
      			rs1.close();
      			rs2.close();
      			rs3.close();
      			st.close();
      		} catch (Exception ee) {
      			System.out.print(ee.getMessage());
      		}
      	}
      

      通过表查看数据库csv日志:

      postgres=# select command_tag,message from postgres_log ;
      command_tag | message
      PARSE | PARSER STATISTICS
      PARSE | PARSE ANALYSIS STATISTICS
      PARSE | REWRITER STATISTICS
      BIND | PLANNER STATISTICS
      SELECT | execute : SELECT * FROM test WHERE a = $1
      PARSE | PARSER STATISTICS
      PARSE | PARSE ANALYSIS STATISTICS
      PARSE | REWRITER STATISTICS
      BIND | PLANNER STATISTICS
      SELECT | execute : SELECT * FROM test WHERE a = $1
      PARSE | PARSER STATISTICS
      PARSE | PARSE ANALYSIS STATISTICS
      PARSE | REWRITER STATISTICS
      BIND | PLANNER STATISTICS
      SELECT | execute S_1: SELECT * FROM test WHERE a = $1
      BIND | PLANNER STATISTICS
      SELECT | execute S_1: SELECT * FROM test WHERE a = $1
      

      结果:POSTGRESQL解析日志中记录了三步PARSER STATISTICS->PARSE ANALYSIS STATISTICS ->REWRITER STATISTICS -> BIND PLANNER STATISTICS当执行第四遍的时候已经忽略了解析的过程,会直接绑定执行计划

    结论

    • prepareThreshold 是一个是否开启server prepare开关
      • 当为0时,禁用server prepare。相当于每次SQL都是硬解析。
      • 当为1时,开启server prepare。相当于每次都走服务端的缓存。复用已有的SQL解析结果和执行计划,不进行SQL解析。
      • 当n大于1时,执行第n次时开启server prepare。相当于从第N次开始复用SQL解析结果和执行计划,不进行SQL解析。
    • 要进行preparestatement时,需要客户端(jdbc驱动)和服务端(db server)相互配合,都需要编译和进行缓存,都需要占用内存空间。
      • jdbc驱动主要将SQL解析成native SQL format,不是向后台传送的原生的full sql text
      • jdbc驱动要缓存一些结果的类型和结果的元数据信息但不缓存执行计划
    • 同时也有一些其他的功能和例外情况需要注意,具体参见官方文档,比如
      • select * 后,做ddl 会对驱动已经缓存的元数据信息有影响
      • set search_path、每次参数传递时类型不一致等也会对服务器缓存的执行计划有影响,导致选择错误
      • 将 preferQueryMode设置为extendedCacheEverything时,可以将常规的statement 也设置成类似preparestatemt的行为,避免过渡的SQL解析
  • 相关阅读:
    web前端开发(4)
    web前端开发(3)
    web前端开发(2)
    【计算机算法设计与分析】——SVM
    【计算机算法与分析】——7.1分枝-限界法
    【模式识别与机器学习】——判别式和产生式模型
    【模式识别与机器学习】——logistic regression
    【模式识别与机器学习】——最小二乘回归
    【模式识别与机器学习】——似然函数
    【计算机算法设计与分析】——6.4图的着色
  • 原文地址:https://www.cnblogs.com/wangzhen3798/p/12206811.html
Copyright © 2011-2022 走看看