在上一篇文章中,介绍了利用gffread进行gff和gtf的格式转换,但是会丢失一些信息,比如UTR,因此这篇文章将介绍另一种方法,AGAT。
gff格式与gtf格式转换——gffread - 简书 (jianshu.com)
NBISweden / AGAT是一款可以处理gff/gtf文件中基因注释的工具,有能力检查、修复、填充任何类型的GTF和GFF的缺失信息,以创建完整的排序和标准化的gff3格式。
官网:
https://github.com/NBISweden/AGAT#update-agat
1.下载安装
依赖环境:
- R
- Perl >= 5.8
- Perl modules
1.1 方法一:Docker
# get the chosen AGAT container version
$ docker pull quay.io/biocontainers/agat:0.8.0--pl5262hdfd78af_0
1.2 方法二:Singularity
# get the chosen AGAT container version
$ singularity pull docker://quay.io/biocontainers/agat:0.8.0--pl5262hdfd78af_0
1.3 方法三:Bioconda (我是用的这个方法)
创建新的虚拟环境:
$ conda create -p /your/path/AGAT_env
激活新环境:
$ conda activate /your/path/AGAT_env
安装依赖环境:
$ conda install perl-bioperl perl-clone perl-graph perl-lwp-simple perl-json perl-carp perl-sort-naturally perl-file-share perl-file-sharedir-install perl-moose
安装:
$ conda install -c bioconda agat
1.4 方法四:Clone
$ git clone https://github.com/NBISweden/AGAT.git
$ cd ~/AGAT
$ perl Makefile.PL
$ make
$ make test
$ make install
2. 主要功能
2.1 检查,修复,填充缺失的信息到排序和标准化的gff3中
$ cd ~/AGAT/bin
$ agat_convert_sp_gxf2gxf.pl -gff CE10g_v2.0.gff3
3.2 格式转换
具体命令参加下表:
3.2.1 gff3转gtf
$ cd ~/AGAT/bin
$ agat_convert_sp_gff2gtf.pl -gff CE10g_v2.0.gff3 -o CE10g_v2.0.gtf
3.2.2 对比gffread和AGAT转出gft文件
gffread:可以看到UTR和gene都丢失了
AGAT:完整的信息
3.3 执行多种任务
引用转载请注明出处,如有错误敬请指出。