from:廖雪峰IO教程
IO
IO是input&output,以内存为中心:
input就是把数据读到内存,output就是把内存的数据输出
InputStream/OutputStream
IO流以byte为最小单位,因此也称为字节流。例如,我们要从磁盘中读取文件,文件包含六个字节,就相当于读入了六个字节的数据
Reader/Writer
读取的是字符,并且字符不全是单字节表示的ASCII字符,那么就按照char来读取更加方便,这种流称为字符流
File对象
File f = new File("/usr/bin/javac");
File对象三种形式表示的路径
1. getPath() //相对路径
2. getAbsolutePath() //绝对路径
3. getCanonicalPath() //规范路径
文件/目录、权限、大小、创建/删除文件
boolean isFile()
boolean isDirectory()
boolean canRead()
boolean canWrite()
boolean canExecute()
long length()
File f = new File("/usr/bin/javac");
if(file.createNewFile()){
//创建文件成功
if(gile.delete()){
//删除文件成功
}
}
遍历
File[] fileList = file.listFiles();
创建目录和路径
boolean mkdir() 创建当前File对象表示的目录
boolean mkdirs() 创建当前File对象表示的目录,并且在必要时把不存在的父目录也创建出来
boolean delete()
在文件路径需要拼接时使用Path会更方便
InputStream
最重要的方法 read()
public abstract int read() throws IOException;
FileInputStream是InputStream的一个子类,下面的代码演示了如何完整的读取一个FileInputStream的所有字节:
public void readFile throw IOException{
InputStream in = null;
try{
in = new FileInputStream("src/readme.txt");
int n;
while(n = in.read() != -1){
System.out.println(n);
}
}finally{
if(in != null){
input.close();
}
}
}
java7 try(resource):
public void readFile throw IOException{
try(InputStream in = new FileInputStream("src/readme.txt")){
int n;
while(n = in.read() != -1){
System.out.println(n);
}
}
}
缓冲
在读取流的时候,一次性读取一个字节并不是高效的方法,使用缓冲区一次性读取多个字节效率往往高很多,InputStream提供了两个重载方法来支持读取多个字节
int read(byte[] b) 读取若干字节到byte[]数组,返回读取的字节数
int read(byte[] b, int off, int len) 指定byte[]数组的偏移量和最大偏移数
使用缓冲区一次性读取多个字节的代码如下:
public void readFile() throw IOException {
try(InputStream in = new FileInputStream("src/readme.txt")){
byte[] buffer = new buffer[1000];
int n;
while(n = in.read(buffer) != -1){
System.out.println("read " + n + " bytes.");
}
}
}
阻塞
在调用InputStream 的 read() 方法读取数据时,我们说read()是阻塞的,意思是in.read()后面的代码必须等待read()返回之后才能执行
InputStream实现类
ByteArrayInputStream
byte[] data = { 11, 22, 33, 44, 55 };
try(InputStream in = new ByteArrayInputStream(data)){
...
}
ByteArrayInputStream 实际是把一个byte[] 在内存中变成一个InputStream
OutputStream
最基本方法
public abstract void write(int b) throw IOException
虽然传入的是int,但是只会写入8个字节,就是int的最低8位
OutputStream的flush()方法,write()会自动把字节写到缓冲区,缓冲区满会自动调用flush()方法,close()也会调用flush()方法
特殊情况就是比如IM的对话,使用OutputStream的write()写入网络流,如果不flush()就会等到缓冲区满才发送,所以需要手动调用flush()方法
public void writeFile() throw IOException {
byte[] data;
try(ByteArrayOutputStream out = new ByteArrayOutputStream("out/readme.txt")){
out.write("Hello".getBytes("UTF-8"));
data = out.toByteArray();
}
System.out.println(data);
}
Filter 模式
Java IO标准库的InputStream根据来源可以包括:
FileInputStream 从文件读取数据源
ServletInputStream 从HTTP请求读取数据源
Socket.getInputStream() 从TCP连接读取数据源
...
如果我们要给FileInputStream增加缓冲功能,则可以从FileInputStream派生一个类
BufferedFileInputStream extends FileInputStream
添加签名计算签名可以DigestFileInputStream,添加加密解密可以CipherFileInputStream
如果要增加功能的组合就需要更多子类
为了解决继承会导致子类太多的问题,JDK将InputStream分为两大类
一类是直接提供数据的基础InputStream,如:
- InputStream
- FileInputStream
- ServletInputStream
另一类是提供额外附加功能的:上面三个 - BufferedFileInputStream
- DigestFileInputStream
- CipherFileInputStream
当我们需要给一个基础的"InputStream"添加功能时,比如数据来自于文件
InputStream in = new FileInputStream("drc/readme.md");
InputStream buffered = new BufferedInputStream(in);
InputStream gzip = new GzipInputStream(buffered);
OutputStream也是这样提供功能
读取classpath资源
String conf = "C:\\conf\\default.properties";
try(InputStream in = new FileInputStream(conf)){
}
直接从File路径中读取文件必须在C盘的conf文件夹下有一个default.properties的文件
从classpath读取文件就可以避免不同环境下文件路径不一致的问题:如果我们把default.properties放在classpath中就不用关心他的实际存放路径
在classpath中的文件,路径总是以/开头
try(InputStream in = getClass().getResourceAsStream("/default.properties")){
//调用classpath很重要的一点是如果资源文件不存在,它将返回null,因此我们需要检查返回的InputStream是否为null
if(in != null){
}
}
序列化
序列化是指把一个Java对象变成二进制内容,本质上就是一个字节数组
为什么要把对象序列化呢?因为序列化之后可以吧byte[]保存到文件之中,或者通过网络传输到远程
有了序列化就又反序列化,即把一个二进制内容(也就是byte数组)变回Java对象。有了反序列化,保存在文件中的byte[]数组就能重新变成Java对象,或者从网上读取byte[]数组然后把他变成Java对象
一个对象要是能序列化,必须实现一个java.io.Serializable接口
Serializable接口没有定义任何方法,我们把这样的接口称为空接口,这样的接口时标记接口,实现标记接口仅仅是给自己贴了个标记,没有增加任何方法
ObjectOutputStream既可以写入基本类型,也可以写入String,也可以写入实现了Serializable接口的Object,因为写入Object时需要大量的类型信息,所以写入的内容很大
ByteArrayOutputStream buffer = new ByteArrayOutputstream();
try(ObjeactOutputStream out = new OutputStream(buffer)){
out.writeInt(123);
out.writeUTF("Hello");
out.writeObject(Double.valueOf(123.456));
}
反序列化
与序列化 ObjectOutputStream相反,ObjectInputStream从一个字节流读取Java对象
除了能读取基本类型和String类型之外,调用readObject()还可以直接返回一个Object对象,要把它变成一个特定类型,必须强制转型
readObject()可能抛出的异常有:
classNotFoundException: 没有找到匹配的class。没有找到匹配的class。常见于一个程序的Person对象在接收程序未定义
InvalidClassException: Class不匹配。常见于发送方的age和接收方的age不是一个类型,一个是int一个是long
为了避免这种class变动导致的不兼容,Java的序列化允许class定义一个特殊的serialVersionUID静态变量,用于标识Java类的序列化版本,通常可以由ide自动生成,如果增加或者修改了字段就可以改变serialVersionUID字段,这样就能避免不匹配的class版本
public class Person implements Serializable {
private static final long serialVersionUID = 2709425275741743919L;
}
反序列化时,由JVM直接构造出Java对象,不调用构造方法,构造方法内部的代码,在反序列化时根本不可能执行
安全性
由于Java的反序列化机制可以导致一个实例能直接从byte[]数组构建,而不经过构造方法,因此他存在一定的安全问题。一个精心构造的byte[]反序列化之后能够执行特定的Java代码,从而导致严重的Java漏洞
Reader
Reader是JavaIO库提供的另一个输入流接口。是一个字符流,即以char为单位读取
public int read() throw IOException
和InputStream的read()方法的区别在于int返回值的范围,InputStream是0-255,Reader是0-65535
public void readFile() throws IOException{
try(Reader reader = new FileReader("src/readme.md", StandardCharsets.UTF_8)){
}
}
Reader还提供了一次性读取若干字符并填充到char[]数组的方法:
public int read(char[] c) throws IOException
利用这个方法我们可以先设置一个缓冲区。然后每次尽力的填充缓冲区:
public void readFile() throws IOException{
try(Reader reader = new FileReader("src/readme.md", StandardCharsets.UTF_8)){
char[] c = new char[10000];
int n;
while(n = reader.read(buffer) != -1){
System.out.println("read" + n + "chars.");
}
}
}
InputStreamReader
Reader 和 InputStream 有什么关系
除了特殊的CharArrayReader和StringReader,普通的Reader实际上是基于InputStream构造的,因为Reader要从InputStream读取字节流然后在转化为char就形成了字符流。
如果我们查看FileReader的源码,其中持有一个FileInputStream
既然Reader本质上是一个基于InputStream的byte到char的转换器,那么如果我们有一个InputStream,想把它转化为一个Reader,是完全可行的。InputStreamReader本质上就是这样一个转换器,他可以吧任何一个InputStream转换为Reader
try(FileReader reader = new InputStreamReader(new InputStream("src/readme.md"), "UTF_8")){
}
上述代码实际上就是FileReader的一种实现方式
PrintStream
PrintStream扩展了OutputStream接口
PrintStream相比于OutputStream,有两个变化:
- 增加了一组方法:print()/println()
- 不会抛出IOException
PrintWriter
PrintWriter扩展了Writer接口,增加了print()/println()方法,最终输出的是char数据