上一篇推文主要介绍了一下使用Multi-omics Hammer软件的Genome_relate工具箱的ptree_rename功能进行对进化树进行重命名,本篇就接着上一篇推文继续介绍Multi-omics Hammer软件的Genome_relate工具箱的fasta_rename功能,即对fasta文件中基因/转录本/染色体序列进行重命名的功能。
一功能开发
其实这项功能的开发的初衷是因为使用fasta文件时遇到需要更改其中的序列名,而当前市面上并无这种简单,但是偶有需求的功能。后来想了一下,发现这一功能虽然简单,但是也是有用的,如其可以用于以下场景:(1)本地blast的时候,需要将序列名称批量修改成指定的名称;(2)两个物种间的序列名重复,需要对其中一个物种名的相应序列名称进行批量更改。因此,本软件结合这一现象,在序列提取的基础上,额外增添了序列重命名的功能,方便大家的使用。
二软件调用
介绍完上述功能需要解决的问题,下面便介绍如何通过软件完成相关分析。
2.1 我们需要先打开‘Genome
relate’选项,如图1所示。
那么,我们就可以看见我们的Genome_relate对话框了(图2)。这一对话框运算部分提供了两个选项,分别是‘is save’和‘simple alig?’选项。如果复选框勾选了‘simple alig?’选项,用户就可以将数据直接输入到比对文件对话框和背景文件对话框中即可。注意:这两个对话框如果直接将文件拖入,则会直接读取文件的内容,并展示前100行的数据(老生重弹了)。而结果文件对话框则只会显示文件的路径(预览文件可在结果预览对话框中显示)。另外,为了方便用户了解这一功能,本软件也提供了示例文件,通过点击图2的 ‘load test’选项即方框3即可加载示例数据(点击process即可查看示例文件结果)。除了上述选项外,本软件的其他界面部分也将以行为顺序进行简单介绍。
多选框:选择fasta_rename功能。
Matching files:需要修改名称的fasta文件。
Search file:用于基因/转录本名称替换的修改文件
Result Previem:结果预览。
Output files: 指定用于输出的文件。
用户将需要修改的fasta文件拖入进入相应的为对话框(输入文件对话框)。如图2方框2所示。拖入对话框后,软件会自动识别并加载数据。
随后,需要将用于更改的名称拖入search file对话框,软件也会自动识别并加载数据。
之后,将需要保存的文件路径拖入‘output files’对话框。该对话框会直接加载路径(如需要保存,需要勾选‘is save’复选框)。最后,点击图4的process按钮即方框4可运行程序完成序列名称修改。注意,预览对话框的前几行会显示哪些名称可以被修改。如果该行第三列为T,则表示原始fasta文件中包含这一序列名(并被修改),如果为F,则表示未找到这一序列名。这些查找的结果也并不是保存到输入文件中,因此,仅供用户作为参考。
三 惯例小结
除了提供基因或转录本序列名称修改,本套件还有其他功能,这些内容也在之前的推文中有所介绍(推文地址详解文末)。如果读者觉得还有什么功能需要实现,也可直接通过公众号留言。不过还是那句话,改进的进度可能要全凭本人时间安排,无法强求(因为主业更重要)。最后的最后,欢迎大家多用Multi-omics Hammer软件(下载地址:https://github.com/wangjun258/Multi-omics-Hammer)和Multi-omics Visual软件(下载地址:https://github.com/wangjun258/Multi_omics_Visual),多提宝贵建议。文末是本套件所有功能的推文,用户可以点击查看。
简书:WJ的生信小院
博客园:生信小院