前面给大家简单介绍了
也给大家介绍了如何从ENCORI批量下载miRNA的靶基因,并且合并成表格。ENCORI数据库不提供整理好的结果一次性下载。
得到所有miRNA和所有靶基因之间的所有调控关系之后,我们就可以在本地批量预测miRNA的靶基因了
☞R批量预测miRNA和靶基因之间的调控关系-ENCORI篇
ENCORI这个数据库还可以零代码做生存曲线,这个我们前面也通过视频讲解过
ENCORI这个数据的功能还远不至于我们已经介绍过的内容,今天我们就来聊聊利用ENCORI预测RBP与靶基因的结合。
RNA 结合蛋白(RBP,RNA binding protein)能与RNA分子相互作用,影响RNA分子稳定性,剪接,细胞核输出以及靶标转录序列的翻译。因此找到RBP-RNA是如何相互作用,对于了解基因表达,细胞功能等具有重要意义。
跟预测miRNA靶基因一样,ENCORI不提一次性下载。那么如果你有好几个RBP需要研究,那么你就不得不在这个网站上查询好几次。这不是小编的风格。我们可以采用☞R下载合并ENCORI miRNA靶基因数据类似的思想来批量下载所有RBP的靶基因。
跟miRNA不一样,我们知道目前所有人的miRNA ID是什么。可以参考☞如何获取人的所有miRNA ID获取。但是我们不知道ENCORI数据库中究竟有多少RBP。庆幸的是小编也懂一点网络知识。利用chrome浏览器查看了一下网页的源代码。找到了网页中,选择RBP的下拉列表的代码。
跟普通的下来列表的代码不一样。普通的下拉列表会直接写出所有选项的内容。也就是我想知道的所有RBP的名字。
仔细研究了HTML的代码,这个网站的开发者应该是专业的,采用了ajax异步响应,RBP的列表名字是从后台数据库获取的
仔细研究了一下,通过chrome的检查工具,找到了RBPajax.php脚本的响应结果,从而成功的获取得到了ENCORI数据库中所有的RBP的名字。
那么接下来我们就可以用☞R下载合并ENCORI miRNA靶基因数据提供的方法来批量的下载RBP-mRNA,RBP-lcnRNA,RBP-circRNA之间的调控关系了。
比较懒的小伙伴或者觉得比较难得小伙伴,小编已经帮大家做好了。三个文件夹中分别存放的是每一个TF跟mRNA,lncRNA,circRNA之间的调控关系。最后也帮大家合并好了,分别在TF_mRNA_interaction.txt, TF_lncRNA_interaction.txt和TF_circRNA_interaction.txt中。ENCORI数据库中所有的TF的名字在ENCORI_TF.txt中。
下面是TF_mRNA文件夹中的文件
下面是TF_mRNA_interaction.txt中的内容