RNAcocktail 是RNA-seq pipeline, 介绍完。
docker 是。。。
要安装和配置docker前提你必须有root的权限!
docker 是个容器,把软件和他的坏境一同打包在一起!
http://www.runoob.com/docker/docker-tutorial.html
docker centos系统安装。install, pull 都在root环境下!
#centos
sudo yum -y install docker
#测试
service docker start
docker run hello-world
镜像源
选个国内的镜像提升下载速度
https://ieevee.com/tech/2016/09/28/docker-mirror.html#%E9%80%89%E6%8B%A9%E4%B8%89alicloud
我使用的是阿里云的加速器,速度超快的!
https://dev.aliyun.com/search.html
分配给一般用户使用
docker 默认只能由root运行。将一般用户加入docker组即可
#创建docker组,一般自己就有
sudo groupadd docker
#将当前用户加入docker组,或者其他用户
sudo gpasswd -a ${USER} docker
#重新启动docker服务(下面是CentOS7的命令)
sudo systemctl restart docker
#当前用户退出系统重新登陆
#运行docker命令
docker ps
docker 使用
安装RNAcocktail 软件集合
docker pull marghoob/rnacocktail
运行方式有多种,这是交互模式
docker run -a stdin -a stdout -a stderr -i -t -v /public1:/public1 5aef8cc6eabd run_rnacocktail.py align -h
docker run -a stdin -a stdout -a stderr -i -t -v /data4:/data4 -v /data5:/data5 5aef8cc6eabd
51a11dbcbbc2 是容器ID
之后是你要运行的命令,如果不带命令,就直接进入交互模式。
要注意的时,运行docker的时候,你是进入了一个容器(container)里面,就是另一个世界,完全一个新的环境, 而且你的当前目录也变了!
这里的-v /public1:/public1
是把现实世界的/public1目录映射到容器里面生成/public1。
你运行程序的输入输出都要加绝对路径,或者在cd到你想运行的目录,否者你当程序运行结束,退出容器回到原来世界(环境)的时候,你找不到运行结果!
简化命令
当然是alias
vim /etc/profile
加入下面这行
alias docker_rnacocktail="docker run -a stdin -a stdout -a stderr -i -t "
以后运行命令就是
docker_rnacocktail -v /public1:/public1 51a11dbcbbc2 run_rnacocktail.py align -h
还是有很多命令,docker必须把image ID(51a11dbcbbc2)放在参数后面, 没办法!
安全问题
我下载的这个RNAcockt 镜像运行时的root,即进入这个容器时,你在那个环境里是root,这样很危险!所以我再RNAcocktail的基础上改装成新的镜像,在运行时是非root用户!
Dockerfile 生成新镜像(images)
vim Dockerfile
FROM b29cb6c43221
MAINTAINER Nong "523135753@qq.com"
RUN useradd -m -d /home/RNAcocktail -s /bin/bash -b /home/RNAcocktail RNAcocktail
RUN /bin/echo 'RNAcocktail:123456' |chpasswd
RUN /bin/echo 'root:123456' |chpasswd
USER RNAcocktail
note:新镜像就是创建了一个普通用户(RUN
),并使用普通用户为默认用(USER
),
生成镜像
docker build -t docker.io/marghoob/rnacocktail:mytag .
修改镜像内容
hisat2_jun2bed.py
这个脚本有个小bug,在有chromosome 名字嗲有 ‘_‘ 这种是会出错,我修改了
#!/usr/bin/python
import sys
import os
if len(sys.argv) >= 2:
HISATJun_filename = sys.argv[1]
bed_filename = sys.argv[2]
else:
print("usage: python hisat2_jun2bed.py HISAT2_splicesites.txt junction.bed")
sys.exit(1)
jun_s = set()
junction=open(HISATJun_filename,'r')
output_file = open(bed_filename,'w')
for line in junction:
if line[0:5]=='track':
continue
else:
line_list=line.strip().split("\t")
leftpos=str(int(line_list[1]))
rightpos=str(int(line_list[2]))
locus = "__".join([line_list[0],leftpos,rightpos,line_list[3]]) #change _ to __
jun_s.add(locus)
output_file.write("track name=junctions description=\"HISAT2 junctions\"\n")
i=0
for locus in jun_s:
output_ls = []
locus_ls = locus.split("__")#change _ to __
chr_name = locus_ls[0]
int_start = int(locus_ls[1])-51
if int_start<=0:
start = "1"
width_start = str(49+int_start)
else:
start = str(int_start)
width_start = "50"
end = str( int(locus_ls[2]) + 50 )
distance = str( int(locus_ls[2]) - int(locus_ls[1])+51 )
sign = locus_ls[3]
name = "HISAT" + str(i)
i += 1
output_ls = [chr_name,start,end,name,"50",sign,start,end,"0,0,0","2",width_start+",50","0,"+distance]
output_file.write( '\t'.join(output_ls) + "\n" )
junction.close()
output_file.close()
问题是怎么改镜像
参考这篇文章:http://blog.csdn.net/jiankunking/article/details/62056392
进入一个docker,记住进入后的docker id 961bcbc2bc85
,然后修改。
exit, 退出后修改命令
docker commit -m 'fix hisat2_jun2bed.py and unmask' -a 'Docker rnacocktail' 961bcbc2bc85 marghoob/rnacocktail:fixed
其中,-m 来指定提交的说明信息,跟我们使用的版本控制工具一样;-a 可以指定更新的用户信息;之后是用来创建镜像的容器的 ID;最后指定目标镜像的仓库名和 tag 信息。创建成功后会返回这个镜像的 ID 信息。
参考:
http://www.runoob.com/docker/docker-image-usage.html
http://blog.csdn.net/yygydjkthh/article/details/47694929
http://www.simapple.com/374.html