Mascot软件工具是针对质谱数据,主要利用肽段序列数据检索的方法来鉴定样本中蛋白质的组成以及翻译后修饰的行业标准软件。这种针对蛋白质或核酸序列数据库的检索需要高强度的计算过程,并需要复杂的统计学算法,才能得到快速且准确的分析结果。
● 通过一个整合的软件包,支持目前主流的三种检索算法;
● 通过特有的基于随机匹配概率的打分方法,支持标准统计显著性检验分析;
● 针对大数据集检索的特点,整合FDR阈值选项及Percolator大规模数据检索质量控制算法,大大提高大规模数据检索的结果质量;
● 可检索各种类型数据库,包括序列库和谱图库;智能、自动化的数据库管理模块, 灵活的私人数据库建立方式;
● 可以自动建立检索目录,自动扫描数据库目录中已有的库文件识别其格式,无需指定酶的特异性,对于特异性的化学修饰或翻译后修饰的鉴定都非常灵活;
● 支持几乎所有常用的质谱仪输出的数据格式。通过高效率的代码可满足从单线程到多线程系统或集群的高通量计算需求;
● 支持所有的Web浏览器,给出概述性和详细的结果报告,可自定义蛋白检索报告形式,并且配以详尽的在线帮助文档帮助用户理解分析结果;
● 已有数千个学术及商业用户,被Frost & Sullivan形容为“质谱数据检索的黄金标准”
通过一个整合的软件包,同时支持目前主流的三种检索算法
Mascot Server 2.7 支持三种蛋白质搜库策略,其中包括2D-PAGE联用MALDI技术常用的 Peptide Mass Fingerprint (PMF)。在鉴定LC-MS及复杂MALDI样品中采用MS/MS Ion Search,另外Mascot提供了Sequence Query功能,可通过分子量和碎片离子信息联合搜库
基于随机匹配概率的打分方法,整合FDR阈值选项及Percolator大规模数据检索质量控制算法
Mascot计算得到的概率值描述了实验数据与质谱分析被选出的多肽或蛋白质所得到的数值之间可观察到的匹配的随机性。而正确的匹配,及非随机事件,则具有很低的概率值。 基于随机匹配概率的打分方法是识别和避免假阳性匹配出现的关键,同时也是实现自动化分析的重要前提。只有通过建立一定的打分尺度和规则,基于规则的软件系统才能直接判断所得出的每个鉴定结果是否可靠。而Mascot Percolator则为大规模蛋白质组学鉴定提供了优化的质量控制算法,同时通过灵活的FDR调节功能可以极大的改善大规模组学鉴定结果的可靠性。
上图为Mascot打分得到匹配肽段和蛋白的柱状图。计分公式为-10*Log(P), 其中P是一个概率值,表示了被观察到的匹配的随机性。如果分值落在绿色阴影区就表示是随机匹配,而正确的肽段匹配分值需要大于22。
上图为Mascot 为大规模蛋白质组学鉴定提供的Percolator算法选项和FDR控制面板,用户可以选择使用Percolator算法来优化搜库结果,同时可以调节FDR阈值来查看结果的变化。
可检索各种类型数据库,包括序列库和谱图库;智能、自动化的数据库管理模块, 灵活的私人数据库建立方式
Mascot支持蛋白质、EST或DNA序列的fasta数据库搜库功能,能够自动地将核酸序列翻译为氨基酸序列进行蛋白质的匹配, 快速鉴定包含各类蛋白信息的质谱谱图。 同时,内置NIST的MS PepSearch搜索引擎,在2.7版本开始可以检索谱图库。同时支持多个不同数据库联合搜库功能,任何AA序列库、NA序列库和谱图库都可以组合来进行多库联合搜索。
Mascot Configuration的Database Manager具有智能化的数据库文件扫描功能,方便的批量导入来源于各大蛋白质数据库的fasta或MSP文件,同时能够在线自动更新数据库,省却更新烦恼。而向导式数据库构建模块能够快捷地新建各种自定义数据库,包括能够由用户数据进行自建数据库。
2.7新版本的谱图库搜索方法为蛋白推断提供了更丰富的证据,在一个AA序列库和谱图库的联合搜库中,往往能看到既有fasta序列匹配,也有谱图库匹配。有时是谱图匹配的更好,有时是序列库匹配的更好。这种搜库方式还可以在研究者自己的质谱数据基础上,建立自己的谱图库,提供快速的数据检索方式。
功能强大的翻译后修饰、人工修饰以及定量方法管理模块
预置unimod数据库的各类修饰,各类常见的定量方法,能够快速的浏览、编辑、新建各种修饰类型和定量方法,大大便利质谱方法学工作者的日常研究。
交联肽段鉴定功能
在新版的搜索界面添加了Crosslinking Method选项,用于设置交联肽段分析的具体方法参数。而相应的搜索结果会被导入xiView。
搜索的交联肽段主要有如下四种形式:
● Intralinks:参与交联的肽段均来自同一蛋白
● Interlinks:参与交联的肽段均来自不同蛋白
● Looplinks:互相联接的氨基酸存在于同一肽段上
● Monolinks:交联剂的一端与肽段相连,另一端游离
以下截图展示的是一对交联肽段的Peptide view结果示例。
Windows系统的桌面客户端——Mascot Daemon的应用
在Windows操作系统中,Mascot提供了一个批量上传搜库任务的桌面客户端,能够保存各类搜库参数和工作任务。在2.7新版本中,加入导出和导入工作任务数据库的功能,不需担心在软件升级后,原有的工作任务列表丢失。IIS构架上运行Mascot对上传文件大小4GB的限制
●批量递交搜库任务:可以同时递交一系列的搜库文件进行同时、队列或者定时的搜库;
●实时监控任务进程:当任务递交后,能够随时监控其搜库的进度;
●建立灵活的队列任务:能够对同一质谱文件进行多参数的多轮队列搜库;
●可以通过命令行直接向Mascot Server递交任务,避开IIS构架上运行Mascot对上传文件大小4GB的限制
●和Distiller联用可以批量进行所有类型的质谱原始文件搜库。