240 发简信
IP属地:陕西
  • @解螺旋的矿工 谢谢老师

    从零开始完整学习全基因组测序(WGS)数据分析:第4节 构建WGS主流程

    这篇文章很长,超过1万字,是本系列中最重要的一篇,因为我并非只是在简单地告诉大家几条硬邦邦的操作命令。对于新手而言不建议碎片时间阅读,对于有一定经验的老手来说,相信依然可以有...

  • 老师,请问我在做Indel的 java -jar /path/to/GenomeAnalysisTK.jar -T VariantRecalibrator....时,出现了下面这种错误,意思是我只使用Mills数据位点做训练不够 应该扩大训练位点的数据量吗? 还是我的本身的真实结果数据中变异含量太少了,不能使用GATK的VQSR,只能使用硬过滤?
    ##### ERROR MESSAGE: NaN LOD value assigned. Clustering with this few variants and these annotations is unsafe. Please consider raising the number of variants used to train the negative model (via --minNumBadVariants 5000, for example).

    从零开始完整学习全基因组测序(WGS)数据分析:第4节 构建WGS主流程

    这篇文章很长,超过1万字,是本系列中最重要的一篇,因为我并非只是在简单地告诉大家几条硬邦邦的操作命令。对于新手而言不建议碎片时间阅读,对于有一定经验的老手来说,相信依然可以有...

  • 老师,还有在变异检测时使用dbsnp_138.vcf,4.0版本中并无强制要求有--dbsnp参数,请问这个vcf文件的对变异检测有什么作用影响吗?

    从零开始完整学习全基因组测序(WGS)数据分析:第4节 构建WGS主流程

    这篇文章很长,超过1万字,是本系列中最重要的一篇,因为我并非只是在简单地告诉大家几条硬邦邦的操作命令。对于新手而言不建议碎片时间阅读,对于有一定经验的老手来说,相信依然可以有...

  • 请问老师,在质量分数重检测BQSR时,1000G_phasel.indels.hg19.vcf,Mills_and_1000G_gold_standard.indels.hg19.sites.vcf和dbsnp_138.hg19.vcf这三个文件的作用是什么呐,工具上说是排除已知的变异区域,但这与BQSR有什么关系吗?

    从零开始完整学习全基因组测序(WGS)数据分析:第4节 构建WGS主流程

    这篇文章很长,超过1万字,是本系列中最重要的一篇,因为我并非只是在简单地告诉大家几条硬邦邦的操作命令。对于新手而言不建议碎片时间阅读,对于有一定经验的老手来说,相信依然可以有...

  • @解螺旋的矿工 谢谢老师,直接用gatk上的参考序列和变异 集合,然后再下载任意的人类测序序列(比如SRR604760的PE测序)就可以做了,对啵

    GATK4.0和全基因组数据分析实践(上)

    前言 在前面的一系列WGS文章中,我讲述了很多基因数据分析的来龙去脉,虽然许多同学觉得很有帮助,但是却缺了一个重要的环节——没有提供实际可用的数据来实战完成具体的流程,不能得...

  • 120
    GATK4.0和全基因组数据分析实践(上)

    前言 在前面的一系列WGS文章中,我讲述了很多基因数据分析的来龙去脉,虽然许多同学觉得很有帮助,但是却缺了一个重要的环节——没有提供实际可用的数据来实战完成具体的流程,不能得...

  • 老师,我从ncbi上下载了大概3G的homo_sapiens参考序列,然后下了SRR076610的pe序列,但其实我不知道SRR076610是什么测序序列,这样可做比对吗

    GATK4.0和全基因组数据分析实践(上)

    前言 在前面的一系列WGS文章中,我讲述了很多基因数据分析的来龙去脉,虽然许多同学觉得很有帮助,但是却缺了一个重要的环节——没有提供实际可用的数据来实战完成具体的流程,不能得...

  • 就比如人的测序序列,您能举个例子吗

    GATK4.0和全基因组数据分析实践(上)

    前言 在前面的一系列WGS文章中,我讲述了很多基因数据分析的来龙去脉,虽然许多同学觉得很有帮助,但是却缺了一个重要的环节——没有提供实际可用的数据来实战完成具体的流程,不能得...

  • 老师,我怎么才能知道物种的测序数据呀,比如您说的大肠杆菌的SRR测序序列

    GATK4.0和全基因组数据分析实践(上)

    前言 在前面的一系列WGS文章中,我讲述了很多基因数据分析的来龙去脉,虽然许多同学觉得很有帮助,但是却缺了一个重要的环节——没有提供实际可用的数据来实战完成具体的流程,不能得...

  • @王诗翔 .谢谢老师,那意思就是我可以将sra与geo比对后的结果与maf已知突变做对比,就可以得知比对结果的准确率好坏了,对吗?

    生信笔记收藏汇总

    更新日期:2018/3/13 这里汇总一些生信分析和数据可视化相关的推文或笔记,为知笔记里存的东西太杂太乱,花了一天的时间初步整理了下。点击跳转的是为知笔记提供的链接,可能需...

  • 请问老师,我想做snv,但是不知道从哪里下载参考序列和tumor序列,您能给个建议吗,多谢了

    生信笔记收藏汇总

    更新日期:2018/3/13 这里汇总一些生信分析和数据可视化相关的推文或笔记,为知笔记里存的东西太杂太乱,花了一天的时间初步整理了下。点击跳转的是为知笔记提供的链接,可能需...

  • 120
    从零开始完整学习全基因组测序(WGS)数据分析:第4节 构建WGS主流程

    这篇文章很长,超过1万字,是本系列中最重要的一篇,因为我并非只是在简单地告诉大家几条硬邦邦的操作命令。对于新手而言不建议碎片时间阅读,对于有一定经验的老手来说,相信依然可以有...