生信软件及环境配置
安装Anaconda(没有程序需求可以装miniconda)
从官网下sh版本的直接安装在自己的家目录
安装完在家目录下面会有一个anaconda文件夹
在ubuntu上安装好anaconda后,如果输入conda命令报错,大概率是没有把conda加入环境变量
所有可执行二进制文件都存放在:~/anaconda3/bin
在终端输入:sudo gedit ~/.bashrc
(命令行模式可以使用vim ~/.bashrc
进行打开,如果只是在自己的家目录操作好像不需要使用sudo)
在 ~/.bashrc最后一行加入 export PATH=~/anaconda3/bin:$PATH
然后保存退出
命令行界面输入source ~/.bashrc
激活环境
测试:
(rna) dicklim@ubuntu:~$ conda -V
conda 4.8.2
在ubuntu实机上测试了可以使用
配置Anaconda(20200524测试可用)
配置过程主要就是替换channel,因为官网channel太慢了,所以改用清华的源。
清华镜像站里的方法,不是非常好用生成condarc之后去改,我试了几次没成功,所以我我还是决定用命令行模式来修改
基本语法:conda config --add channels https://
后面跟要加的url
下面贴一些比较常用的命令:
# Anaconda Python 免费仓库
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
# Conda Forge
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
# msys2
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/
# bioconda
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda/
# menpo
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/menpo/
# pytorch
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/
# r
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r/
# for legacy win-64
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/peterjc123/
# 这句代码感觉不是必要
conda config --set show_channel_urls yes
这儿加镜像我觉得是要啥加啥,没必要直接全加(不知道会不会拖慢速度)
像free和main都是必要的,剩下pytorch是深度学习用的,bioconda是生信的,conda-forge查了一下是个更快的社区之类的?
最后那个show_channel_urls好像是在家目录生成一个url文件,感觉这句代码不是非常必须。
pip换源
有些软件可能conda不是非常好装,可以使用pip安装,不过pip也需要换源
参考链接:更换pip源到国内镜像
#临时使用
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple some-package
#注意,simple 不能少, 是 https 而不是 http
#设为默认
#升级 pip 到最新的版本 (>=10.0.0) 后进行配置:
pip install pip -U
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
#如果您到 pip 默认源的网络连接较差,临时使用本镜像站来升级 pip:
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pip -U
创建生信环境
这一步主要是在anaconda里辟出一块专门的区域来安装生信软件免得因为版本问题和别的软件起冲突。一般语法如下:
#显示当前已有的环境
conda env list
#建立一个环境,-n指定其名字(这个环境叫rna),后面跟上这个环境要的条件,python的语法啊,要装的包啊啥的
conda create -n rna python=2 bwa
#建立之后conda会根据你的需求下载一些东西来完成环境的建立
#激活环境
conda activate rna #(source activate rna也可以,但是这句语法有点老了)
#退出环境
conda deactivate #(就deactivate一下就行,source一样,有点老了)
安装生信软件
据说是可以进行搜索?如果有就可以不用再装了?
反正我直接安装了,就基本命令都是conda install xxx
注:conda可以一次安装很多软件,写成conda install xxx1 xxx2 xxx3
主要是安装以下软件:(20200524测试)后续有新的软件可能增加
- 工具包(sra-tools好像是ncbi下东西的一个软件)
- sra-tools fastqc multiqc samtools
-
注:samtools会报错
error while loading shared libraries: libcrypto.so.1.0.0: cannot open shared object file: No such file or directory
参考文件:samtools的lib问题
ln -s /usr/local/lib/libssl.so.1.1 /usr/lib/libssl.so.1.1
ln -s /usr/local/lib/libcrypto.so.1.1 /usr/lib/libcrypto.so.1.1
- 对fastqc和mutliqc进行质控:
- trimmomatic cutadapt trim-galore
- 比对:
- star hisat2 bowtie bowtie2 tophat bwa subread
- 注:tophat是要下tophat2,网上给的是tophat,版本是2.1,这个就是tophat2,所以下的时候注意看一下版本。
-
注2:tophat建议下2.1.0版本,2.1.1跑的时候会出错,可以直接
conda install tophat=2.1.0
,试了一下是可以的。或者可以去官网下二进制版本,好像也可以不过有点烦。贴个链接tophat manual - 注3:bowtie适合比对50bp以下的片段,bowtie2适合50以上的,这两个不是升级关系,是两个不同功能的软件。
- 计数
- htseq bedtools deeptools
后续如果有坑就写这里
STAR非常吃内存!!!非常吃内存!!非常吃内存!!!