【陪你学·生信】二、一些你肯定会用到的生信工具和基本操作

今天的推送仍然是简单介绍。

【陪你学·生信】序

【陪你学·生信】一、生信能帮我们做什么

一、学会用PubMed/NCBI等搜索数据库

通过名字了解一个蛋白:

当我们得到一个氨基酸序列,通过blast发现它可能是个dUTPase,但是我们并不了解什么是dUTPase。这时候,可以用PubMed数据库搜索了解。


(1)打开网页www.ncbi.nlm.nih.gov/entrez/


(2)输入名字dUTPase,开始检索。


(3)然后就可以点进去看文章,了解蛋白了。


除了关键词,还可以通过作者,年份,领域等缩小范围;甚至在检索时加地名,缩小地理范围,找到距离你比较近的人发的文章(这个功能,嗯...方便去实验室学习。哈哈,还是蛮实用!)。与很多检索数据库一样,输入关键词可以用AND,OR,NOT使你的搜索更贴切。比如【dUTPase[TI] OR pyrophosphatase[TI] NOT Smith[AU]】的含义是关键词是dUTPase或者pyrophosphatase,但是不看作者是Smith的结果。


二、提取蛋白质序列

利用PubMed搜索文献可以说是大家最常用的(还有镜像谷歌学术啥的,以及大学图书馆买的很多类似PubMed的检索数据库),接下来也很常用的就是在提取蛋白质序列,并从分子水平进行分析。下面介绍个好用的网站ExPASy:


是由SIB 瑞士生物信息研究所开发运营的,这里可以找到蛋白质组学,基因组学,系统发育 / 进化,系统生物学,种群遗传学和转录组学的数据资源。

继续我们在【一、学会用PubMed/NCBI等搜索数据库】中的举例,我们通过序列得知与dUTPase相似,又在PubMed中找到了对应文献,现在我们想更了解它一些,准备从网上下载一些发挥dUTPase功能的蛋白质序列。我们假设找大肠杆菌中的dUTPase功能的蛋白序列。

(1)打开网站https://www.expasy.org/

(2)在合适的数据库中搜索【dUTPase coli】关键词

会看到一系列序列,我们点进去第一个P06968,就可以看到大肠杆菌中这个蛋白的很多详细信息啦。

内容相当丰富,介绍了蛋白功能,名称,分类,亚细胞定位,序列(可以下载FASTA文件),结构,相似蛋白等。

如果要下载多序列进行比对分析,勾选下载即可。

与所有检索数据库类似,关键词栏可以加各种高级设定缩小范围。举例中我们用的Advanced Search in the UniProt Knowledgebase中的数据由两部分构成。分别是TrEMBL和 Swiss-Prot,其中Swiss-Prot是从文献中提取的结果,另一个是计算机分析翻译的DNA序列,所以一般我们用filter by Swiss-Prot的数据。

三、提取DNA序列

蛋白质序列的大小差别不大,300±200aa的大小,而且不同生物的相似功能的蛋白质差异很小。DNA就不同了,首先,不是所有的DNA都编码蛋白质,它分为调节区(通常在编码区之前);非翻译区(在编码区前后)以及蛋白质编码区。在真核生物中,编码区被内含子序列分开,叫做外显子。其次不同生物中DNA序列差异很大。

提取与蛋白质对应的DNA序列:

在数据库中蛋白质-DNA序列不是一一对应的,很多不同的DNA序列对应相同的蛋白质或基因名。继续我们的dUTPase举例,如果想要知道它的DNA序列,来克隆大肠的dUTPase,怎么做呢?

首先按照上述的步骤,点击去P06968蛋白的页面,下拉至Cross-References这个分类,会发现NCBI对应的序列数据资料,可以找到下载这个蛋白对应的DNA序列。这个分类里还有很多UniProtKB以外的数据库。

四、用BLAST比较蛋白序列

当我们有一个蛋白质序列,一般下一步就是BLAST(Basic Local Alignment Search Tool)来看看其他和选择的蛋白序列相似的蛋白。通过这些信息,可以预测所选蛋白的结构,功能等。

(1)首先,打开NCBI-blast网页

https://blast.ncbi.nlm.nih.gov/Blast.cgi

(2)点击protein-protein BLAST (blastp)

(3)进行比对,其中数据库一般就是nr数据库。结果显示中的query是我们输入的序列,另一个是数据库中序列。

NCBI-blast页面除了protein-protein,还有其他的。我们简单说一下好啦。

第一个nucleotide blast,就是blastn,用核苷酸序列在核苷酸数据库中检索;最后一个protein blast就是我们上面的blastp,蛋白序列在蛋白质数据库中检索;中间的blastx是核酸序列按照六种阅读框架将其翻译成蛋白质与蛋白质数据库中的序列进行比对;而下面的tblastn是用蛋白质序列与翻译后的核苷酸数据库进行比对。一般blastn较为常用,blastx对分析新序列和EST(Expressed Sequence Tag)很有用。

关于比对结果中的得分,期望值,similarity和identity以及blast比对时采用的算法的简单介绍,请看之前的推送:

【现学现卖】序列比对之bit-score VS E-value

【现学现卖】序列比对之identity VS similarity

【现学现卖】序列比对之算法

五、利用ClustalW进行多序列比对

除了输入一个序列,在blast中搜索相似序列外,多序列比对也很常用。多序列比对可以确定特定氨基酸位置;定义蛋白质家族的特定序列;对蛋白进行分类和建树分析。

(1)首先又是打开网页,哈哈哈。这个PIR是protein information resource的缩写。在search/analysis里面选择multiple Alignment(如果两个序列就是 Pairwise Alignment)。

pir.georgetown.edu.

(2)复制粘贴(这个框里最多可以放50个序列,还有其他类似的线上工具可以试一试),并比对。结果如下,上方小框里是树状图。结果显示中,100%相同的用“*”或者竖线标识,化学上相似的用“:”和“·”标识(两个点的一般比对中得分更高),“-”是gap。

自此,这本书的part Ⅰ部分就看完啦(一共五个部分)。第一部分主要是简单介绍,继续加油!

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,529评论 5 475
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,015评论 2 379
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,409评论 0 335
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,385评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,387评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,466评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,880评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,528评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,727评论 1 295
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,528评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,602评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,302评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,873评论 3 306
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,890评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,132评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,777评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,310评论 2 342