1. 准备电脑
配置Windows 10
在Microsoft Store中安装Canonical Group Limited. 开发的Ubuntu。
开始Ubuntu Linux的安装,安装过程中提供Ubuntu系统的账号密码。
百度报错原因,可能是未安装Windows子系统支持。
尝试该解决办法。
重启后,开始安装。
输入子系统的用户名和密码,完成安装。
安装Java
配置Linux
Linux基本命令了解一下
https://www.cnblogs.com/yoci/p/10208452.html
升级Linux Distribution至最新版本。终端中输入:
sudo apt-get update && sudo apt-get upgrade -y
安装必要的packages。终端中输入:
sudo apt-get install -y curl unzip build-essential ncurses-dev
sudo apt-get install -y byacc zlib1g-dev python-dev git cmake
sudo apt-get install -y default-jdk ant
配置终端
升级“shell” 。在终端中输入:
curl http://data.biostarhandbook.com/install/bash_profile.txt >> ~/.bash_profile
curl http://data.biostarhandbook.com/install/bashrc.txt >> ~/.bashrc
注意:只能输入一次!
新的设置不会在当前终端界面立即生效,需要重新打开终端,或输入:
source ~/.bash_profile
2. 安装conda和active bioconda
conda2是一个开源的软件包管理系统和环境管理系统,用于安装多个版本的软件包及其依赖项,并在它们之间轻松切换。它在Linux、OSX和Windows上工作,是为Python程序开发的,但可以打包和分发任何程序。
接下来要用bioconda的定制conda版本来安装生物信息学软件包。你需要安装conda然后点击bioconda对应的通道。
在 Windows Bash中输入(可能需要微批恩,会报无法解析域名错误):
curl -OL https://repo.continuum.io/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh
来安装miniconda,安装时接受所有默认选项
重新打开一个终端,输入:
conda --version
来查看conda是否被正确安装了,若正确安装,输入:
conda update -y -n base conda
更新conda至最新版本
Bioconda是一个分发生物信息软件的channel,可以在Conda package manager中启用。在终端中运行以下命令,启用bioconda channel
conda config --add channels bioconda
conda config --add channels conda-forge
3. 安装软件
创建生物信息学环境
conda create -y --name bioinfo python=3.6
再次重启终端
(Q:为什么人类都登上月球了,搭个环境还要重启这么多次终端?A:又不是不能用。)
激活并安装生物信息学工具
# 激活生物信息学环境,注意,每次重新打开终端都需要运行以激活生物信息学环境
conda activate bioinfo
# 安装Biostar Handbook中用到的多数生物信息学工具,需要花点时间
curl http://data.biostarhandbook.com/install/conda.txt | xargs conda install -y
由于Entrez Direct是一个会造成很多麻烦的工具,现在就提前检查一下它是否有效。上述安装完成后,运行以下命令以验证是否可以从命令行访问NCBI:
efetch -db nuccore -id 2 -format gb
我做对了没有?
Biostar Handbook作者提供了一个用于诊断的脚本
mkdir -p ~/bin
curl http://data.biostarhandbook.com/install/doctor.py > ~/bin/doctor.py
chmod +x ~/bin/doctor.py
~/bin/doctor.py
安装出现问题没法解决?
建议还是重新搭建一遍环境:
conda create -y --name bioinfo python=3.6
conda activate bioinfo
curl http://data.biostarhandbook.com/install/conda.txt | xargs conda install -y
在Biostar Handbook Issue Tracker上寻找问题的解决方案并汇报新的问题
https://github.com/biostars/biostar-handbook-issues
有新的工具要装?
书里面已经将大部分常用的工具都安装好了
如果有的话,第一步看看conda有没有提供
conda activate bioinfo
conda install 工具名称
安装时要仔细注意⚠信息,有些工具是同当下的环境冲突的。
conda create --name 新环境名称 -y
conda activate 新环境名称
conda install 新工具名称
可以打开两个窗口,一个conda activate bioinfo、一个conda activate 新环境名称。
部分程序要通过源代码安装,安装指导在附录中,暂时不看往下走。
怎么升级tools?
# Upgrade a package.
conda update "<toolname>""
通过自动安装的tools没用了?
可能是工具开发者未及时更新,建议通过源代码安装。
想要更新conda?
conda update -n base conda
如何整理归档文件?
作者给出了一些教学:
整理生物学计算项目的快速指南
http://journals.plos.org/ploscompbiol/article?id=10.1371/journal.pcbi.1000424
基于GitHub的研究流程
http://www.carlboettiger.info/2012/05/06/research-workflow.html
文件目录布局建议
http://nicercode.github.io/blog/2013-04-05-projects/
最普适性的建议是“简洁”,如果怕忘了自己干了什么,后面会教你怎么用track record,而不是写很长长长长的路径名称。
• 指向二进制文件的链接 Links to binaries go into ~/bin.
• 参考基因组 Reference genomes go into ~/refs.
• 工具的源代码 Source code for tools go into ~/src.