Hibernate是一个持久化框架,经常需要访问数据库。如果我们能够降低应用程序对物理数据库访问的频次,那会提高应用程序的运行性能。缓存内的数据是对物理数据源中的数据的复制,应用程序运行时先从缓存中读写数据。
缓存就是数据库数据在内存中的临时容器,包括数据库数据在内存中的临时拷贝,它位于数据库与数据库访问层中间。ORM在查询数据时首先会根据自身的缓存管理策略,在缓存中查找相关数据,如发现所需的数据,则直接将此数据作为结果加以利用,从而避免了数据库调用性能的开销。而相对内存操作而言,数据库调用是一个代价高昂的过程。
Hibernate缓存包括两大类:一级缓存和二级缓存。
- Hibernate一级缓存又被成为“Session的缓存”。Session缓存是内置的,不能被卸载,是事务范围的缓存。在一级缓存中,持久化类的每个实例都具有唯一的OID。
- Hibernate二级缓存又被称为“SessionFactory的缓存”。由于SessionFactory对象的生命周期和应用程序的整个过程对应,因此Hibernate二级缓存是进程范围或者集群范围的缓存,有可能出现并发问题,因此需要采用适当的并发访问策略,该策略为被缓存的数据提供了事务隔离级别。第二级缓存是可选的,是一个可配置的插件,默认下SessionFactory不会启用这个插件。
那么什么样的数据适合放入到缓存中?
- 很少被修改的数据
- 不是很重要的数据,允许出现偶尔并发的数据
- 不会被并发访问的数据
- 常量数据
什么样的数据不适合放入到缓存中?
- 经常被修改的数据
- 绝对不允许出现并发访问的数据,如财务数据,绝对不允许出现并发
- 与其他应用共享的数据
一、Hibernate一级缓存
看一下控制台的输出:
我们可以看到,虽然我们调用了两次session的load方法,但实际上只发送了一条SQL语句。我们第一次调用load方法时候,得到了查询结果,然后将结果放到了session的一级缓存中。此时,当我们再次调用load方法,会首先去看缓存中是否存在该对象,如果存在,则直接从缓存中取出,就不会在发送SQL语句了。
但是,我们看一下下面这个例子:
我们解释一下上面的代码,在第5、6、7、8行,我们是先将session关闭,然后又重新打开了新的session,这个时候,我们再看一下控制台的输出结果:
我们可以看到,发送了两条SQL语句。其原因是:Hibernate一级缓存是session级别的,所以如果session关闭后,缓存就没了,当我们再次打开session的时候,缓存中是没有了之前查询的对象的,所以会再次发送SQL语句。
一级缓存小结:
- 一级缓存是事务级别的,每个事务(session)都有单独的一级缓存。这一级别的缓存是由Hibernate进行管理,一般情况下无需进行干预。
- 每个事务都拥有单独的一级缓存不会出现并发问题,因此无须提供并发访问策略。
- 当应用程序调用Session的save()、update()、saveOrUpdate()、get()或load(),以及调用查询接口的 list()、iterate()(该方法会出现N+1问题,先查id)方法时,如果在Session缓存中还不存在相应的对象,Hibernate就会把该对象加入到第一级缓存中。当清理缓存时,Hibernate会根据缓存中对象的状态变化来同步更新数据库。 Session为应用程序提供了两个管理缓存的方法: evict(Object obj):从缓存中清除参数指定的持久化对象。 clear():清空缓存中所有持久化对象,flush():使缓存与数据库同步。
- 当查询相应的字段,而不是对象时,不支持缓存。我们可以很容易举一个例子来说明,看一下下面的代码。
我们首先是只取出Customer的name属性,然后又尝试着去Load一个Customer对象,看一下控制台的输出:
二、Hibernate二级缓存
我们可以发现控制台只发出了一条SQL语句。我们的二级缓存是sessionFactory级别的,所以当我们session关闭再打开之后,我们再去查询对象的时候,此时Hibernate会先去二级缓存中查询是否有该对象。
同样,二级缓存缓存的是对象,如果我们查询的是对象的一些属性,则不会加入到缓存中。
三、查询缓存
我们的一级二级缓存都是对整个实体进行缓存,它不会缓存普通属性,如果想对普通属性进行缓存,则可以考虑使用查询缓存。
但需要注意的是,大部分情况下,查询缓存并不能提高应用程序的性能,甚至反而会降低应用性能,因此实际项目中要谨慎的使用查询缓存。
对于查询缓存来说,它缓存的key就是查询所用的HQL或者SQL语句,需要指出的是:查询缓存不仅要求所使用的HQL、SQL语句相同,甚至要求所传入的参数也相同,Hibernate才能直接从缓存中取得数据。只有经常使用相同的查询语句、并且使用相同查询参数才能通过查询缓存获得好处,查询缓存的生命周期直到属性被修改了为止。