Kraken软件可以通过序列对样本进行物种注释,kraken2在该软件基础之上做了一些更新,其中包括注释的加速、支持氨基酸序列的注释等其他特性。...
正则表达式使用一些既定的表达式来实现文本检索和其他字符串处理的功能,在python中,re模块可以使用正则表达式能够快速的提取目标文本、文本替换...
我们在分析测序数据或者下载数据库数据时,经常需要合并数据。期间不可避免的出现重复序列,为了减少减少后续资源的使用,更快速地分析数据,往往需要先对...
随着测序技术的普及和组装技术的完善,物种基因组版本更新很快。如果我们手头的数据是使用老版本基因组分析的结果,可以使用现成的工具直接转换(转换会有...
在基因家族分析中,hmmsearch用来在很多候选序列中寻找具有某种基因家族结构域的蛋白。在寻找时,需要提供基因家族对应的隐马模型。前段时间给大...
在基因家族分析中,通过pfam数据库检索获得已知基因家族的hmm模型(隐马模型)是必不可少的一步,最近发现pfam数据库有变动,和大家分享一下。...
三代测序因为长读长的特点,在基因组组装方面有明显的优势。今天给大家介绍一款基因组组装软件,miniasm。该软件可用于Pacbio和ONT两个平...
之前写过一篇如何使用blast+套件进行本地blast库的创建及比对,今天跟大家聊聊比对结果的输出格式。 比对命令 通过outfmt参数指定输出...
之前写过一篇如何使用blast+套件进行本地blast库的创建及比对,今天跟大家聊聊比对结果的输出格式。 比对命令 通过outfmt参数指定输出...