懒人只看这个图就好了。
benchmark
过程真的很精彩,建议通读一遍原文,附件更是有惊喜
。
b:
第一行:Peak 分布的形状
第二行:差异情况,是上升降低五五开,还是一面倒
第三行:征对以上情况,最优解。
c:不知道峰形状或者高低变化情况
只知道峰型,不知道高低变化情况,直接只看左边三列那块最优解
不知道峰型,知道高低变化情况,看 50:50 和 100:0 那两列最优解
啥都不清楚,看最后那列最优解
顺带安利下孟博刚开的 ChIP-seq 分析大全课程,只要几百,买不了吃亏买不了上当。
本次课程是 “高级生信系列课程” 的第四门课。重点针对 ChIP-seq 技术及改进技术(CUT&RUN,CUT&Tag,in situ ChIP),DNase-seq,ATAC-seq 等技术从原理、算法、数据分析实践等方面进行讲解。
毫不犹豫的说,我能走到今天,很大程度上是离不开孟博的帮助,从孟博知乎到B沾再到腾讯课堂,谢谢孟博这一群人让我们这些野生的自学人员能成长。
记得上一次看到这么精彩的还是 2017 年 NC 这篇 Gaining comprehensive biological insight into the transcriptome by performing a broad-spectrum RNA-seq analysis RNA-seq 的分析 Benchmark
另外顺带再贴一下前阵子发在 GB 上闹得沸沸扬扬的 Wilcoxon rank-sum test
,哈哈,作者面对 DESeq2 作者还做了文章发了后的回答。
Exaggerated false positives by popular differential expression methods when analyzing human population samples
作者 Twitter 链接:
Lesson learned from DE gene analysis on immunotherapy data: with large sample sizes, permutation analysis offers sanity check for FDR control & Wilcoxon rank-sum test works
文章发了后引起激烈讨论后再次出面:
https://twitter.com/jsb_ucla/status/1527891594723983361
与本文,走偏了,回到正轨。
时隔多年,我们再次看到与之匹敌的 ChIP-seq 分析的 Benchmark 文章:
Comprehensive assessment of differential ChIP-seq tools guides optimal algorithm selection
另外贴一个作者的 Twitter 链接:
这篇文章综合考虑多个因素:
1、TF、窄峰组蛋白修饰(H3K9ac、H3K72ac、H3K4me3)、宽峰组蛋白修饰(H3K27me3、H3K36me3、H3K79me2)
2、工具:
- Peak caller 工具:MACS2、SICER2(专用于宽峰)、JAMM
- 依赖 Peak caller 的差异分析工具:
ChIPComp、DBChIP、DESeq2、DiffBind、DIME、edgeR、HOMERpd、MAnorm、MAnorm2、MMDiff2、NarrowPeaks、uniquepeaks
- 不依赖 Peak caller 的差异分析工具:
MACS2的 bdgdiff 函数、ChIPDiff、ChIPnorm、chromstaR、csaw、diffReps、EpiCenter ...
考虑的几种因素:
1、实验组与对照组差异分析情况:完全下降或者上升、上升下降一半一半
这一段有点意思。
2、信噪比,也就是我们说的 FRiP 值
这里有点出乎我的意外,对于组蛋白修饰宽峰,FRiP 并不是越高越好。。。
3、染色体特征
一般我们不考虑
4、差异分析工具性能:运行时间和所需内存
大众的那几个都没很大区别
作者最后也解释了每一种可能的原因是什么。
不过 Anyway,不管上面说的是啥,你只要参考本问最开始的那个图就行了。
好了,更多的内容,自己详细看文章,如果不关心文章 Benchmark 的过程,参考上图就行了。