写在前面:当学习某一重要文件格式时,更需要对此格式对应软件工具进行全面的学习(如sam/bam——samtools)。在多次花时间写脚本处理文件之后发现,80%左右的任务其实...
写在前面:当学习某一重要文件格式时,更需要对此格式对应软件工具进行全面的学习(如sam/bam——samtools)。在多次花时间写脚本处理文件之后发现,80%左右的任务其实...
疫情的爆发使得病毒基因组的研究呈现井喷式增长,其中有一部分研究是与进化相关的,病毒从何而来,病毒是否发生了进化等等一系列问题都被大家关注着。这里小Q介绍其中的一种分析--Ne...
在处理fasta序列的时候,我们经常需要获取每一条fasta序列的长度。今天小编就跟大家来分享四种获取fasta序列长度的方法。 一、awk 输出为 二、bioawk 得到的...
这个是有机结合生物信息学的linux和数据格式的练习题:下载bowtie2软件后拿到示例数据: http://ascii.911cha.com/ 做题之前的碎碎念:本来用co...
SNPs marker是全基因组范围应用广泛的分子标记,本文介绍生态基因组学中利用GATK4软件进行SNPs calling的流程(人的研究中可能略有不同)。以下所有分析过程...
问题背景: 做GWAS分析,对方只提供了具有SNP和indel的vcf文件,需要提取SNP时,提取时去发现,需要对应的索引(.idx) 这种情况下可否不去要求对方提供.idx...
作为一个java程序员,大家都应该认识JVM。JVM作为java的核心,实在太重要了。而内存溢出又是程序员常遇到的错误之一,如果你对JVM的原理足够了解,那么解决这样的问题就...
比对结束后,需要了解比对结果的情况,可以采用samtools flagstat进行统计samtools flagstat统计bam文件比对后每一个参数的解释如下: 如果有些结...
resequencing data analyses 1. mapping 率 2. sequencing depth 第一列尾染色体号;第二列碱基;第三列为碱基上的测序深...
Coverage Depth 覆盖深度 mapping depth 基因组被测序片段(短读 short reads)“覆盖”的强度有多大? 每一碱基的覆盖率是基因组碱基被测序...
分子层面对生物的研究,在个体水平上主要是看单个基因的变化以及全转录本的变化(RNA-seq);在对个体的研究的基础上,开始了群体水平的研究。如果说常规的遗传学主要的研究对象是...
网上虽然教程很多,但是很多还是不够详细,我总结一篇比较容易安装的图文教程。先展示一下效果图: 一、首先安装iTem2[http://www.iterm2.com/downlo...
一、iTerm2简介: Mac OS自带的终端,用起来虽然有些不太方便,界面也不够友好,iTerm2是一款相对比较好用的终端工具.iTerm2常用操作包括主题选择、声明高亮、...
实操一个WGS项目,从原始测序数据到比对,再到call变异,以及vcf文件的质控。 软件准备 samtools sratoolskit bcftools htslib(bcf...
Step1. 下载参考组序列+建立索引 Index the reference genome 软件:bowtie2 samtools Step2. 比对 软件:bwa 软件:...