常用的显著性阈值确定方法是:
Bonferroni correction = 显著性水平(0.01/0.05)/检验次数(number of detected markers)
Bonferroni校正P值是最严格的多重检验校正方法,由于SNP实际上不全是独立事件,可以通过LD计算,得到有效SNP个数,即Me,可以降低Bonferroni校正的严格性。
GEC (Genetic Type I error calculator)是一个基于java的应用程序,用于解决具有依赖的单核苷酸多态性的多测试问题。GEC的功能包括:
- SNP冗余程度测试,计算独立SNP数目;
- 计算p值。
官方说明书:http://pmglab.top/gec/data/archive/v1.0/UserManualV1.pdf
1.下载安装
下载地址:
http://pmglab.top/gec/#/download
1.0版本是在kggsee中实现的,没有独立的安装包,只有kggsee.jar一个。
运行:
java -Xmx10g -jar kggsee.jar
2.Me计算
java -Xmx10g -jar kggsee.jar --var-gec --nt 12 --filter-maf-le 0.02 --vcf-ref ~/sunwei/vcftools_0.1.13/bin/root.id.vcf --out root.gec
--var-gec:主要功能函数
--nt:线程数
--filter-maf-le:滤除等位基因频率小于或等于某一标准
--vcf-ref:包含基因型的参考VCF文件
--out:输出文件的路径和前缀名称
查看log文件,共扫描了370562个SNP,保留下292493个Me。
此时的显著性阈值即为:
Bonferroni correction = 显著性水平(0.01/0.05)/ Me
引用转载请注明出处,如有错误敬请指出。