Protein domain:
结构域的概念由Wetlaufer于1973年首次提出,他定义结构域为可以自动折叠的稳定的蛋白质结构单位。过去,结构域被描述为,折叠单位,致密结构单位,功能和进化单位。每个定义都是有效的并且经常重叠。紧密结构单位结构域在很多不同的蛋白质中被发现,它在结构环境内容易独立折叠。自然界经常把几个domains结合在一起形成多结构域和多功能蛋白质。在一个多结构域蛋白质中,每一个结构域可以独立行使它自己的功能,或者和它的临近蛋白协调一致的方式行驶。Domains既可以作为模块构建大的复合体像病毒颗粒或肌纤维,也可以提供特定的催化或结合位点,这些都在酶或调节蛋白中被发现。
Motif和domain的区别
完全不同的两个概念,但有时还有联系。
Motif:在生物学中是一个基于数据的数学统计模型,典型的是一段sequence也可以是一个结构,是特定的group的序列预测,例如一个DNA sequence可以定义为转录因子结合位点,也就是序列倾向于被这种factor结合。对蛋白质来说,sequence motifs可以被定义为蛋白质(蛋白质序列)属于一个给定的蛋白质家族。一个简单的motif可以是,例如,一个模式pattern,而这个模式被这个group中的所有成员共享。例如WTRXEKXXY(这里,X代表任何氨基酸)。当然也有更复杂的motif模型。Motif有时和特定的功能联系一起。
Protein domains:是一种结构实体,通常代表蛋白质结构中独立折叠和行驶功能的一部分。因此,蛋白质经常是这些结构域的不同的组合构建起来的。
那,motif和domains之间有什么联系?当你考虑蛋白质家族的时候,不仅要看整个序列,还有关注单独结构域。因为,它们是一个基本的功能结构单位,因此找到单个结构域domain的序列motif是很有意义的。因此,你经常会发现一个蛋白质包含多个结构域,每个结构域都有一个与它所属的家族motif匹配的序列。
最主要的区别是,domain是独立的稳定的,motif不是。
参考:2008.2:Disease candidate gene identification and prioritization using protein interaction networks