1. 什么是VCFCVF是用于描述SNP,INDEL和SV结果的文本文件。做过DNA重测序,群体遗传进化,BSA,GWAS等项目的人都会遇到VCF文件,这个文件记录了所有样品...
1. 什么是VCFCVF是用于描述SNP,INDEL和SV结果的文本文件。做过DNA重测序,群体遗传进化,BSA,GWAS等项目的人都会遇到VCF文件,这个文件记录了所有样品...
1 简介 BCFtools 是一款多种实用工具的集合,它可以用于处理VCF文件和二进制的BCF文件。它可以接受VCF格式、压缩的VCF格式以及BCF格式,并能自动检测输入的格...
以前在Linux写循环时都用 ls * | while read id ; do command line $id ; done 的结构,这种方式写起来很简单,但是调试起来有...
一、GEO Datasets各种编号的意义 首先需要捋清楚GEO Datasets中的各种编号。 GPL,platform ID。记录测序或芯片的平台,对于芯片平台,其包含基...
一般使用 CMplot 绘制SNP密度图:包链接:https://github.com/YinLiLin/R-CMplot 要绘制 SNP 密度图,仅仅需要三列即可:a. 第...
使用bcftoolsquery -ltest.vcf > 453.list 将vcf文件中的样品名提取出来 不使用软件: head -100 all.vcf |grep "#...
SURVIVOR 是一套用于模拟/评估 SV、合并和比较样本内及样本间 SV 的工具集,其还可对SV进行重新格式化及进行统计总结,其他详细信息也可参考工具的wiki。 安装 ...
不同的结构变异(structural variation,SV)鉴定工具鉴定出的VCF结果文件格式不尽相同,但也不是完全没有规律可循,主要的格式就有两种,分别是: BND n...
本文来源 http://www.chenlianfu.com/?p=2319,稍有更改。Aspera connect是高效传输软件,可在 http://downloads.a...
RNA-seq或者ChIP-seq等等测序的上游分析流程里的比对步骤相信大家都知道,我之前也只是按照各种教程去走流程,并没有仔细的研究过每一步的内容。今天这篇文章学习一下sa...
DepthOfCoverage会输出7个文本结果。其中一个是按照interval上的每个碱基,输出一行统计信息,所以会比较慢: .DepthOfCoverage.txt结果 ...
1. bam文件平均深度计算 2. 按照平均深度对bam文件进行向下抽样 这里需要主要 downsample_fraction如果是小于0.1,例如0.05,需要测试,看是否...
what is bam bam(或者是sam,cram)文件,是比对后拿到的文件,sam文件是纯文本,非常占用存储空间,bam是sam的二进制格式,cram则是进一步压缩后的...
前期准备 给标记加上ID SNP data通常都是以VCF格式文件呈现,拿到VCF文件的第一件事情就是添加各个SNP位点的ID。先看一下最开始生成的VCF文件: 可以看到,I...
1.什么是Reads? 高通量测序平台产生的序列就称为reads。 2.什么是Contig? 拼接软件基于reads之间的overlap区,拼接获得的序列称为Contig(重...
导读 野生植物被成功地驯化为农作物是人类文明的大事件。该过程的成功很大程度上要归功于持续的人工选择。本文总结了过去十年在作物驯化和育种研究中的新发现。作物基因组图谱的构建和众...
转载自:https://www.jianshu.com/p/7d4e4948b623 群体遗传学基础知识 群体(Polulation):是指生活在一定空间范围内,能够相互交配...
一、安装 将文件放入相应目录下,不能运行可以尝试chmod 750 文件名更改权限 二、配置文件 以生成一个约10kSNP,2000群体的基因型文件为例下面文件另存为“10k...