在网上偶然看见了maftools,想用自己的vcf文件尝试,因此在网上找了教程来进行这一转换。
本文章旨在解决两个问题,一,vcf 转maf过程;二,单样本maf如何合并成多样本maf,并输入maftools进行作图。
在网上看教程,提到细节的很少。所以我写一个粗糙版本的教程,有些细节我也没有深究,欢迎指正。
一,vcf转maf的过程。
1,参考网址:
转换命令:https://blog.csdn.net/viancheng/article/details/106330338
软件网址:https://github.com/mskcc/vcf2maf/releases
2,软件准备:
需要准备:某版本的参考基因组; 需要提前安装VEP;需要下载maftools的压缩包; 使用的vcf来自mutect2产生的vcf ; 在Linux环境下进行处理。下面是vcf格式截图:
3,转换命令:
(1)命令:
perl vcf2maf.pl --input-vcf T668077.oncefiltered.vcf --output-maf T668077.maf --tumor-id T668077 --normal-id N668077 --vcf-tumor-id T668077 --vcf-normal-id N668077 --vep-path ensembl-vep-93.4-0 --vep-data ~/.vep --ref-fasta ucsc.hg19.fasta --filter-vcf 0
参数参考自上面的转换网址:
#T668077.oncefiltered.vcf 需要转换的vcf文件。
#T668077.maf 转换后的结果
(2)需要注意的地方:
--vep-data 需要制定的是VEP的cache页面,否则会报错,找不到cache.
解决这个问题,其实是参考biostar上的 这个网址的最后一段,https://www.biostars.org/p/375080/
(3)命令报错:
虽然上述命令有报错,但是因为输出结果出来了,这个报错我也没有深究下去。
至此,形成了一个maf文件。导入maftools进行操作即可,具体操作过程不写。单样本maf作出的图。
二,单样本maf如何合并成多样本maf。
我在参考下面这个网址的时候,发现有人提问,如何把许多个单样本maf合并在一起,形成一个maf,并使用maftools进行处理。
网址:https://www.jianshu.com/p/54552f9a017d
我的做法很简单,
1,使用上面的方法,对多个vcf进行处理,形成多个maf。
2,将maf 全部合并在一起,cat即可。
当然,重复的标题行去掉。我是用同一个maf,复制了一遍,然后修改了下面2列的样本编号,模拟2个样本形成了一个maf。
3,模拟的2样本maf,使用maftools作图。