Java 之 I/O 系列 目录
一 序列化概述
序列化,简单来讲,就是以“流”的方式来保存对象,至于保存的目标地址,可以是文件,可以是数据库,也可以是网络,即通过网络将对象从一个节点传递到另一个节点。
在Java的I/O结构中,有ObjectOutputStream和ObjectInputStream,它们可以实现将对象输出为二进制流,并从二进制流中获取对象,那为什么还需要序列化呢?这需要从Java变量的存储结构谈起,我们知道对Java来说,基础类型存储在栈上,复杂类型(引用类型)存储在堆中,对于基础类型来说,上述的操作时可行的,但对复杂类型来说,上述操作过程中,可能会产生重复的对象,造成错误。
而序列化的工作流程如下:
1)通过输出流保存的对象都有一个唯一的序列号。
2)当一个对象需要保存时,先对其序列号进行检查。
3)当保存的对象中已包含该序列号时,不需要再次保存,否则,进入正常保存的流程。
正是通过序列号的机制,序列化才可以完整准确的保存对象的各个状态。
序列化保存的是对象中的各个属性的值,而不是方法或者方法签名之类的信息。对于方法或者方法签名,只要JVM能够找到正确的ClassLoader,那么就可以invoke方法。
序列化不会保存类的静态变量,因为静态变量是作用于类型,而序列化作用于对象。
用来实现序列化的类都在java.io包中,我们常用的类或接口有:
ObjectOutputStream:提供序列化对象并把其写入流的方法
ObjectInputStream:读取流并反序列化对象
Serializable:一个对象想要被序列化,那么它的类就要实现 此接口
二 序列化示例
先通过一个简单的例子演示一起序列化/反序列化的过程
Book.java
1 public class Book implements Serializable { 2 3 private int isbn; 4 public Book(int isbn){ 5 this.isbn = isbn; 6 } 7 public int getIsbn() { 8 return isbn; 9 } 10 public void setIsbn(int isbn) { 11 this.isbn = isbn; 12 } 13 14 public String toString(){ 15 return "Book [isbn = "+isbn+"]"; 16 } 17 18 }
Student.java
1 public class Student implements Serializable { 2 3 private Book book; 4 private String name; 5 6 public Student(Book book, String name) { 7 this.book = book; 8 this.name = name; 9 10 } 11 12 public Book getBook() { 13 return book; 14 } 15 16 public void setBook(Book book) { 17 this.book = book; 18 } 19 20 public String getName() { 21 return name; 22 } 23 24 public void setName(String name) { 25 this.name = name; 26 } 27 28 public String toString() { 29 return "Student [bool=" + book + ", name=" + name + "]"; 30 } 31 32 }
Simulator.java
1 /** 2 * 序列化 3 * @ClassName: Simulator 4 * @author Xingle 5 * @date 2014-6-25 下午5:45:00 6 */ 7 public class Simulator { 8 public static void main(String[] args) { 9 new Simulator().go(); 10 } 11 12 private void go() { 13 Student student = new Student(new Book(2014), "xingle"); 14 try { 15 ObjectOutputStream out = new ObjectOutputStream(new FileOutputStream("test")); 16 out.writeObject(student); 17 System.out.println("object has been written "); 18 out.close(); 19 } catch (FileNotFoundException e) { 20 e.printStackTrace(); 21 } catch (IOException e) { 22 e.printStackTrace(); 23 } 24 25 try { 26 ObjectInputStream in = new ObjectInputStream(new FileInputStream("test")); 27 Student stuRead = (Student) in.readObject(); 28 System.out.println("object read here"); 29 System.out.println(stuRead); 30 } catch (FileNotFoundException e) { 31 e.printStackTrace(); 32 } catch (IOException e) { 33 e.printStackTrace(); 34 } catch (ClassNotFoundException e) { 35 e.printStackTrace(); 36 } 37 38 } 39 40 }
运行结果:
object has been written
object read here
Student [bool=Book [isbn = 2014], name=xingle]
可以看到,读取到的对象与保存的对象状态一样。这里有几点需要说明一下:
1、基本类型 的数据可以直接序列化
2、对象要被序列化,它的类必须要实现Serializable接口;如果一个类中有引用类型的实例变量,这个引用类型也要实现Serializable接口。比如上面 的例子中,Student类中有一个Book类型 的实例就是,要想让Student的对象成功序列化,那么Book也必须要实现Serializable接口。
3、这个语句:
ObjectOutputStreamout = newObjectOutputStream(new FileOutputStream("seria"));
我们知道 FileOutputStream类有一个带有两个参数的重载Constructor——FileOutputStream(String,boolean),其第二个参数如果为true且String代表的文件存在,那么将把新的内容写到原来文件的末尾而非重写这个文件,这里我们不能用这个版本的构造函数,也就是说我们必须重写这个文件,否则在读取这个文件反序列化的过程中就会抛出异常,导致只有我们第一次写到这个文件中的对象可以被反序列化,之后程序就会出错。
下面的问题是如果 我们上面 用到的Book类没有实现Serializable接口,但是我们还想序列化Student类的对象 ,怎么办。
Java为我们提供了transient这个关键字。如果一个变量被声明成transient,那么 在序列化的过程 中,这个变量是会被无视的。我们还是通过对上面的代码进行小的修改来说明 这个问题。
新的Book类不实现Serializable接口
1 public class Book { 2 3 private int isbn; 4 public Book(int isbn){ 5 this.isbn = isbn; 6 } 7 public int getIsbn() { 8 return isbn; 9 } 10 public void setIsbn(int isbn) { 11 this.isbn = isbn; 12 } 13 14 public String toString(){ 15 return "Book [isbn = "+isbn+"]"; 16 } 17 18 }
因为我们要序列化Student类的对象,所以我们必须实现Serializable接口,然而Book是Student的一个实例变量,它的类没有实现Serializable接口,所以为了顺序完成序列化,我们把这个实例变量声明为transient以在序列化的过程中跳过它。
1 public class Student implements Serializable { 2 3 private transient Book book; 4 private String name; 5 6 public Student(Book book, String name) { 7 this.book = book; 8 this.name = name; 9 10 } 11 12 public Book getBook() { 13 return book; 14 } 15 16 public void setBook(Book book) { 17 this.book = book; 18 } 19 20 public String getName() { 21 return name; 22 } 23 24 public void setName(String name) { 25 this.name = name; 26 } 27 28 public String toString() { 29 return "Student [bool=" + book + ", name=" + name + "]"; 30 } 31 32 }
Simulator.java和上面的一样,看一下运行结果:
object has been written
object read here
Student [bool=null, name=xingle]
可以看到,student对象被成功的序列化了。因为序列化过程中跳过了Book实例,所以当恢复对象状态的时候 ,它被赋予了默认值null,这也就意味着我们不能使用它。那如果Book类没有实现Serializable接口,但我们还想对它的状态进行保存,这可以实现吗?
java针对这种情况有一种特殊的机制—— 一组私有(回调)方法(这个马上在代码中看到),可以在要被序列化的类中实现它们,在序列化和的序列化的过程中它们会被自动调用。所以在这组方法中我们可以调用ObjectOutputStream/ObjectInputStream的一些有用方法来实现对象状态的保存。下面还是通过例子来说明:
Book类和Simulator类都不变,我们来看一下新的Student类:
1 public class Student implements Serializable { 2 3 private transient Book book; 4 private String name; 5 6 public Student(Book book, String name) { 7 this.book = book; 8 this.name = name; 9 10 } 11 12 public Book getBook() { 13 return book; 14 } 15 16 public void setBook(Book book) { 17 this.book = book; 18 } 19 20 public String getName() { 21 return name; 22 } 23 24 public void setName(String name) { 25 this.name = name; 26 } 27 28 public String toString() { 29 return "Student [bool=" + book + ", name=" + name + "]"; 30 } 31 32 //这个方法会在序列化的过程中被调用 33 private void writeObject(ObjectOutputStream out) 34 { 35 try { 36 //这个方法会把这当前中非静态变量和非transient变量写到流中 ,在这里就把name写到了流中。 37 out.defaultWriteObject(); 38 //ObjectOutputStream中提供了写基本类型数据的方法 39 out.writeInt(book.getIsbn()); 40 } catch (IOException e) { 41 e.printStackTrace(); 42 } 43 } 44 45 //这个方法会在反序列化的过程中被调用 46 private void readObject(ObjectInputStream in) 47 { 48 try { 49 //和defaultWriteObject()方法相对应,默认的反序列化方法,会从流中读取 非静态变量和非transient变量 50 in.defaultReadObject(); 51 //用这个方法来读取一个int型值,这里我们是读取书号 52 int isbn = in.readInt(); 53 book = new Book(isbn); 54 } catch (ClassNotFoundException e) { 55 e.printStackTrace(); 56 } catch (IOException e) { 57 e.printStackTrace(); 58 } 59 } 60 61 }
看下执行结果:
object has been written
object read here
Student [bool=Book [isbn = 2014], name=xingle]
正如预料 的一样,成功了。要注意的点我在代码的注释中有说明,请好好看下代码。
还有一点在代码中没写出来 ,就是一定要注意写入和读取的顺序一定要对应。像上面如果你是先写基本类型数据的话,那在读取的时候也一定要先读取基本类型的数据,文件是有position的。
最后,还有两个问题:
1、如果一个类没有实现Serializable接口,但是它的基类实现 了,这个类可不可以序列化?
2、和上面相反,如果一个类实现了Serializable接口,但是它的父类没有实现 ,这个类可不可以序列化?
第1个问题:一个类实现 了某接口,那么它的所有子类都间接实现了此接口,所以它可以被 序列化。
第2个问题:Object是每个类的超类,但是它没有实现 Serializable接口,但是我们照样在序列化对象,所以说明一个类要序列化,它的父类不一定要实现Serializable接口。但是在父类中定义的状态能被正确 的保存以及读取吗?
还有一点,序列化保存对象的状态,而静态(static)变量不是对象的 状态,所以它们不会被序列化。