iTAK:在线预测全基因组转录因子TF,转录调节因子TR与蛋白激酶PK

前言

康奈尔大学,FeiLab的一个预测工具。

iTAK 是依赖于数据库的用于从蛋白质或核苷酸序列中识别植物转录因子 (TF)转录调节因子 (TR)蛋白激酶 (PK),然后将单个 TF、TR 和 PK 分类为不同的基因家族的工具。

本人能力有限,本文可能存在描述不当与错误的地方,请仔细辨别后使用。

鉴定与依据

TFs 和 TRs 的识别和分类是基于主要从 PlnTFDB (Perez-Rodriguez et al., 2010)PlantTFDB [(Jin et al., 2014) 总结的一致性规则(每个基因家族的必需和禁止的蛋白质结构域),与来自 PlantTFcat (Dai et al., 2013)AtTFDB (Yilmaz et al., 2011)的家族 使用了支持证据。

PKs的鉴定依赖于Pfam数据库中与PF00069PF07714 的hits。鉴定到的PK通过与比较一系列的HMMs( Lehti-Shiu MD, Shiu S-H (2012))将其划分到不同的基因家族。

我来bici两句:iTAK发表文章中指出了两个数据库(PlnTFDB和PlantTFDB)各自的一些缺陷。plnTFDB我没用过,但是PlantTFDB在iTAK出来后是有更新的,高老师看不到这篇文章和这个工具不太可能。如果提出的问题确实存在且合理,我相信后面更新中肯定会修正的(这只是我的臆想,我的水平还不到去校对文中提到问题的水平),所以大家也不要看到iTAK发文中提到了PlantTFDB的问题就不用PlantTFDB预测TF了。

工具有没有人在用?

这个工具,我是在一个学长的毕业答辩上听来的。

我昨天在pubmed搜了下,印象比较深的是有两篇中药论文中都用到了这个工具。

另外,我在网上搜到了一家生信分析报告模板,其中就有用这个工具。

关于软件本地部署,中文中有些本地部署的流程,但不建议大家本地部署(数据库的更新依赖mysql),因为github中的数据库文件没有在线网页版的新。虽然我不更新数据库的本地部署与在线版的预测结果条数一致(具体序列ID并没有进行比较),但我还是用了在线版本的分析结果。

iTAK 1.6 在线版本主页

http://itak.feilab.net/cgi-bin/itak/index.cgi

过程

第一步:进入主页http://itak.feilab.net/cgi-bin/itak/index.cgi

不需要工具,就是网络慢点。

Clipboard_2022-05-31-18-21-52.png

第二步:输入数据,选择数据类型

蛋白质序列数据,以文件形式上传或者直接粘贴FASTA格式序列。

输入数据要求与限制(≈没限制):fasta格式,核苷酸或者蛋白序列,序列数<50k条且文件大小<100M

第三步:填写接收数据邮箱。

虽然可以在线等,但是写个邮箱稳妥点。

如果提交成功则应该会跳转类似如下界面。

Clipboard_2022-05-31-18-53-37.png

第四步:下载结果

我测试的3万多条蛋白序列,用了大概50分钟。

在线等结果或者复制邮箱中的网页链接到浏览器打开。

呈现如下结果(这里只截图了TF,TR):

点击左上角"Download" 就可以下载所有结果。

Clipboard_2022-05-31-20-56-49.png

结果文件内容

解压结果文件,层层打开文件夹PXXXXXXXXXX_output\home\kentnf\webfiles\bioinfo\itak\itak_web\itak_html\tmp\itak_online\PXXXXXXXXXX_output (这个文件夹属是有点深不可测)即可看到6个结果文件

  • tf_sequence.fasta

所有鉴定的TF/TR序列

  • tf_classification.txt

所有TF/TR的分类,tab制表符分割,包含序列的ID和各自的家族。

  • tf_alignment.txt

制表符分割的txt文档,包含所有鉴定到的TF/TR比对蛋白结构域数据库。

  • pk_sequence.fasta

所有鉴定到的PK蛋白序列。

  • Shiu_classification.txt

所有鉴定到的PK蛋白分类。制表符分割的txt文件,包含序列ID和相应的蛋白激酶家族。

  • Shiu_alignment.txt

制表符分割的txt文档,包含所有鉴定到的PK比对蛋白结构域数据库。

后话=废话

其实,这个工具我是先直接本地部署的,但是github上数据库这么久没更新,心里属实不踏实。看了下iTAK.pl ,当然是看不懂的,但是我发现了一些隐藏的选项和内容。在脚本最后的email模块发现了这个在线网址链接才知道原来还有在线版本。同时网站提供了最新数据库,但是看了下部署,竟然有用到mysql,然后直接对本地版说了拜拜。现在还没时间学习mysql。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,271评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,275评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,151评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,550评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,553评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,559评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,924评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,580评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,826评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,578评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,661评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,363评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,940评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,926评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,156评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,872评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,391评论 2 342

推荐阅读更多精彩内容