240 发简信
IP属地:北京
  • @小不点打羽毛球 好的,谢谢您!

    叶绿体基因组基因、外显子、内含子、基因间隔区提取

    Bioinformatic_Scripts/extract_sequences_from_gb_files 一、用途 从注释好的gb格式(GenBank Flat File)...

  • @小不点打羽毛球 曲老师,您好!问题已经自行解决,根据您提取CDS的脚本,输出结果都是基因名加_加其他信息,我的解决办法是在给出的list里,每个基因名字后面添加_,这样带数字的基因名字变成唯一值了,就没有检索2时把20、21、22这些给检索到一起的情况了。
    另外您是否有rps12两段连接的脚本,我现在用的办法比较笨,是从注释基因那一步,把两段rps12改名,提取CDS后,建立单基因矩阵,mafft后,把两个矩阵拼到一起,改名为rps12用。因为我数据量比较大,大于1000以上,所以手动连接不适用我,我从参考基因那一步尝试把两段连在一起,但是注释完别的物种,还是分开的,应该是您PGA程序的某个参数默认设定。

    叶绿体基因组基因、外显子、内含子、基因间隔区提取

    Bioinformatic_Scripts/extract_sequences_from_gb_files 一、用途 从注释好的gb格式(GenBank Flat File)...

  • 曲老师:您好!
    冒昧打扰您了,在使用您的PGA注释软件、CDS提取以及单基因提取的脚本时,遇到了一些问题,故特此给您发邮件询问一下,问题如下描述:
    1、使用PGA注释时,我发现注释出来的结果(使用您提供的参考gb),rps12这个基因有一段100多bp的编码区,远离另外大致位于反向重复序列上的序列完全相同的rps12编码区。当使用您的脚本提取CDS区时,去除重复后,这一长(300bp左右,末尾是终止密码子)一短(100多bp,开头是起始密码子)编程单独存在的两个序列,无法连成一个完整的基因。
    2、在使用单基因提取的脚本时,发现不知什么原因,有些单基因文件里面有其他基因序列,例如提取rpl2时,rpl2的单基因文件里含有,rpl2、rpl20、rpl22、rpl23,但是rpl20、rpl22、rpl23这些文件里仅包含各自的基因。
    感谢您的解答!祝您工作顺利。

    叶绿体基因组基因、外显子、内含子、基因间隔区提取

    Bioinformatic_Scripts/extract_sequences_from_gb_files 一、用途 从注释好的gb格式(GenBank Flat File)...

  • @小不点打羽毛球 好的,谢谢您的解答。

    叶绿体基因组注释软件PGA使用说明

    PGA-Plastid Genome Annotator[https://github.com/quxiaojian/PGA] Qu X-J, Moore MJ, Li D-...

  • 曲老师,您好,还想请教您一个问题,咱们PGA注释出来的结果,软件能否实现在每个LOCUS的下一行添加DEFINITION的结果,名字默认同LOCUS的一样就可以。因为注释完,用您公布的提取CDS的脚本,后面还得在用其他python脚本把所有物种gb文件按单基因多物种的格式聚集起来,方便后面建树。之前用到金建军老师写的脚本,直接从gb文件里按一个基因所有物种聚集为一个fasta,依次提取所有基因,一步实现之前两步功能,但是金老师的脚本好像是按definition后面的信息提取的,PGA目前注释结果里没有definition这行的信息,Geneious和GeSeq都有这行信息,因此咨询下您,看PGA也能否也呈现definition这一行结果。

    叶绿体基因组注释软件PGA使用说明

    PGA-Plastid Genome Annotator[https://github.com/quxiaojian/PGA] Qu X-J, Moore MJ, Li D-...

  • @小不点打羽毛球 好的,谢谢您

    叶绿体基因组注释软件PGA使用说明

    PGA-Plastid Genome Annotator[https://github.com/quxiaojian/PGA] Qu X-J, Moore MJ, Li D-...

  • 我看软件包里自带了裸子植物和杯子植物的参考基因组。并为涉及到苔藓和蕨类这些类群。

    叶绿体基因组注释软件PGA使用说明

    PGA-Plastid Genome Annotator[https://github.com/quxiaojian/PGA] Qu X-J, Moore MJ, Li D-...

  • 叶绿体基因组注释软件PGA使用说明

    PGA-Plastid Genome Annotator[https://github.com/quxiaojian/PGA] Qu X-J, Moore MJ, Li D-...

  • 曲老师,您好,用PGA注释苔藓植物的叶绿体基因组,是否也可以像您说的那样,使用软件包中提供的无油樟作参考注释苔藓的一个研究类群,再用这两个类群做参考,来注释苔藓的其它类群。

    叶绿体基因组注释软件PGA使用说明

    PGA-Plastid Genome Annotator[https://github.com/quxiaojian/PGA] Qu X-J, Moore MJ, Li D-...