容器中管理数据主要有两种方式:
- 数据卷(Data Volumes)
- 数据卷容器(Data Volume Containers)
下面介绍如何在容器内创建数据卷,并且把本地的目录或文件挂载到容器内的数据卷中。接下来,会介绍如何使用数据卷容器在容器和主机、容器和容器之间共享数据,并实现数据的备份和恢复。
数据卷
数据卷是一个可供容器使用的特殊目录,它绕过文件系统,可以提供很多有用的特性:
- 数据卷在容器之间共享 和重用。
- 对数据卷的修改会立马生效。
- 对数据卷的更新,不会影响镜像。
- 卷会一直存在,直到没有容器使用。
数据卷的使用,类似于Linux 下对目录或文件进行 mount 操作。
在容器内创建一个数据卷
在用 docker run 命令的时候,使用 -v 标记可以在容器内创建一个数据卷。多次使用 -v 标记创建多个数据卷
下面使用 training/webapp 镜像创建一个Web 容器,并创建一个数据卷挂载到容器的 /webapp 目录:
root@localhost:~# sudo docker run -d -P --name web -v /webapp training/webapp python app.py
注意:-P 是允许外部访问容器需要暴露的端口。
挂载一个主机目录作为数据卷
root@localhost:~# sudo docker run -d -P --name web -v /src/webapp:/opt/webapp training/webapp python app.py
上面的命令加载主机 /src/webapp 目录到容器的 /opt/webapp 目录:
Docker 挂载数据卷的默认权限是读写(rw),用户通过,ro 指定为只读。
root@localhost:~# sudo docker run -d -P --name web -v /src/webapp:/opt/webapp:ro
挂载一个本地主机文件作为数据卷
root@localhost:~# sudo docker run --rm -it -v ~/.bash_history:/.bash_history ubuntu /bin/bash
这样就可以记录在容器输入过的命令历史了。
数据卷容器
如果用户需要在容器之间共享一些持续更新的数据,最简单的方式是使用数据卷容器。
1.创建一个数据卷容器 dbdata, 并在其中创建一个数据卷挂载到 /dbdata:
root@localhost:~# sudo docker run -it -v /dbdata --name dbdata ubuntu
2.查看 /dbdata 目录
3.在其他容器使用 --volumes-from 来挂载 dbdata 容器中的数据卷,
例如 创建 db1 和 db2 两个容器,并从 dbdata 容器挂载数据卷:
root@localhost:~#sudo docker run -it --volumes-from dbdata --name db1 ubuntu
root@localhost:~# sudo docker run -it --volumes-from dbdata --name db2 ubuntu
此时容器db1 和 db2 都挂载同一个数据卷到相同的 /dbdata 目录。三个容器任何一方在该目录的写入,其他容器都可以看到。
可以多次使用 --volumes-from 参数来从多个容器挂载多个数据卷。还可以从其他已经挂载了容器卷的容器来挂载数据卷:
root@localhost:~# sudo docker run -d --name db3 --volumes-from db1 training/postgres
注意: 使用 --volumes-from 参数扰挂载数据卷的容器自身并不需要保持在运行状态。
如果删除了挂载的容器(包括 dbdata、db1、db2),数据卷并不会自动删除。
利用数据卷容器迁移数据
利用数据卷容器对其中的数据进行备份、恢复,以实现数据迁移。
备份
使用下面的命令来备份 dbdata 数据卷容器内的数据卷:
root@localhost:~# sudo docker run --volumes-from dbdata -v $(pwd):/backup --name worker ubuntu tar cvf /backup/backup.tar /dbdata
恢复
下面要恢复数据到一个容器
1.创建一个带有数据卷的容器dbdata2:
root@localhost:~# sudo docker run -v /dbdata --name dbdata2 ubuntu /bin/bash
2.创建另一个新的容器,挂载 dbdata2 的容器,并使用 untar 解压备份文件到所挂载的容器卷中:
root@localhost:~# sudo docker run --volumes-from dbdata2 -v $(pwd):/backup busybox tar xvf /backup/backup.tar
小结
数据是最宝贵的资源, Docker 无疑为数据管理提供了充分的支持。
在生产环境中,建议在使用容器卷或数据卷容器之外,定期将主机的本地数据进行备份,或者使用支持容错的存储系统,包括 RAID或分布文件系统,如 Ceph、GPFS、HDFS等。
参考文档
《Docker 技术入门与实战》第6章 数据管理