今天找计算测序覆盖度的时候发现了这个工具,github 主页是https://github.com/bioconvert/bioconvert;帮助文档的链接是 https://bioconvert.readthedocs.io/en/master/
关于各种各样的文件格式 可以参考下图
看帮助文档的时候还发现他可以直接下载测序数据
下面我们尝试一下
内容主要来自 https://bioconvert.readthedocs.io/en/master/tutorial.html
首先是安装
使用conda 先新建一个虚拟环境
conda create -n bioconvert
启动环境
conda activate bioconvert
安装
conda install python==3.6
pip install bioconvert
这里遇到了报错,忘记截图了,我是把pandas安装了一下
conda install pandas
然后运行pip命令
pip install bioconvert==0.4.3 -i https://pypi.tuna.tsinghua.edu.cn/simple
这边应该是安装成功了
查看帮助文档bioconvert --help
报错
查了一下是python版本需要大于3.6,我刚好安装的是3.6
重新安装一下python
将整个虚拟环境删除然后重新安装
conda remove -n bioconvert --all
重新安装
conda create -n bioconvert python=3.7
conda activate bioconvert
pip install pandas -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install bioconvert==0.4.3 -i https://pypi.tuna.tsinghua.edu.cn/simple
这下没有报错,但是遇到了很多警告信息,暂时不管了
试一下,NCBI下载了一个genbank文件,线板fasta格式的序列提取出来 https://www.ncbi.nlm.nih.gov/nuccore/FN433596
bioconvert genbank2fasta staphylococcus_aureus.gb
使用命令的时候会跳出来很多警告信息
接下来又尝试了 from sources 的安装方法
这套命令运行下来 依然有一个警告信息,但是比之前少了很多
帮助文档里还提到了使用conda直接安装,但是我这边就一直没有成功,暂时不知道什么原因
最后再试一下gb文件中提取fasta文件
bioconvert genbank2fasta sequence.gb output.fasta
这次成功了 输出的HHH是哈哈哈哈的意思吗 哈哈哈哈
欢迎大家关注我的公众号
小明的数据分析笔记本
小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记;3、生物信息学入门学习资料及自己的学习笔记!