基因组变异是一个定义比较模糊的概念。 所谓的变异是相对于一个完美的“参考基因组”而言。但是其实完美的“参考基因组”并不存在,因为我们只是选择某一个物种里的其中似乎比较正常的个体进行测序组装,然后基于它进行后续的研究。简单的说,参考和变异是相对而言,变异也可能完全正常。
背景
基因突变:DNA分子中发生碱基对的替换、增添和缺失而引起的基因结构的改变。
在分裂间期双链解开,极易受外界影响而发生基因突变。
基因突变对生物的影响:氨基酸顺序、生物性状、后代
常见的基因组变异一般可以归为如下几类:SNP INDEL SNV SV
SNP 单核苷酸多态性 一个碱基的变化
SNP所表现的多态性只涉及到单个碱基的变异,这种变异可由单个碱基的 转换 或 颠换 所引起,也可由碱基的插入或缺失所致。但通常所说的SNP并不包括后两种情况;理论上讲,SNP既可能是二等位多态性,也可能是3个或4个等位多态性,但实际上,后两者非常少见,几乎可以忽略。因此,通常所说的SNP都是二等位多态性的,这种变异可能是 转换 (transition),也可能是颠换(transversion)。
SNP的产生原因我们一般就说是在基因组水平上由单个核苷酸的碱基替换(转换,颠换)
转换的发生率总是明显高于其它几种变异,具有转换型变异的SNP约占2/3,其它几种变异的发生几率相似。在哺乳动物基因组上C->T的转换比较多,这是因为基因组上的胞嘧啶C在甲基化的修饰下容易发生C->T的转变。人类遗传基因的各种差异,90%可归因于SNP引起的基因变异。在人类基因组中,每隔100至300个碱基就会存在一处SNP位点。每3个SNP位点中有2个会是胞嘧啶(C)和胸腺嘧啶(T)的相互转变。
转换 (transition) :嘌呤(A,G)和嘌呤之间的替换,或嘧啶(T,C)和嘧啶之间的替换
颠换(transversion):嘌呤(A,G)和嘧啶(T,C)之间的替换
转换和颠换如果发生在基因的蛋白质编码区内,根据点突变对基因转录和蛋白质翻译产生的影响定性,可以把点突变分为 同义突变(synonymous mutation) 和 非同义突变(non-synonymous mutation) 两种。
同义突变 = 中性突变 (neutral mutation) = 沉默突变 (silent mutation) 碱基替换不引起氨基酸改变
同义突变的原因是点突变发生在密码子的第三个核苷酸,由于遗传密码的简并性,这个突变后的密码子恰恰同突变前的密码子编码同一氨基酸,这样,突变不会改变蛋白质中的氨基酸序列。
非同义突变 = 错义突变 (missense mutation) + 无义突变 (nonsense mutation)
错义突变是指受到影响的密码子变成另一种新密码子,编码一个新的氨基酸,使氨基酸序列发生变化。错义突变大多发生在密码子的第一位或第二位核苷酸。无义突变是指一个编码氨基酸的密码子,在点突变后变成了一个终止密码子,使多肽合成提前中止,产生了缺失原有羧基端片段的缩短的肽链。在多数情况下,这种蛋白质片段是没有活性的。
不引起编码氨基酸改变的碱基替换称为同义替换,引起编码氨基酸改变的碱基替换称为非同义替换。
核苷酸与碱基:一分子核苷酸由一分子五碳糖(核糖或脱氧核糖)、一分子碱基(A、G、C、T、U) 、一分子磷酸组成。
五碳糖决定核苷酸种类,五碳糖是核糖的核苷酸就是核糖核苷酸,五碳糖是脱氧核糖的核苷酸就是脱氧核苷酸。
核糖核苷酸有四种,那是因为碱基(A、U、C、G)不同;脱氧核苷酸也有四种,也是因为碱基(A、T、C、G)不同。
移码突变:在编码序列中,单个碱基、数个碱基的缺失和插入以及片段的缺失或插入等均科使突变位点之后的三联体密码阅读框发生改变,不能编码原来的蛋白质的突变。
单核苷酸多态性(SNP)根据其在基因中的位置,可以分为 基因编码区、基因非编码区、基因间隔区(基因之间的区域)。总的来说,位于编码区内的 SNP(coding SNP,cSNP) 比较少,转录序列 SNP 少于非转录序列。因为在外显子内,其变异率仅及周围序列的1/5。
从对生物的遗传性状的影响上来看,cSNP又可分为2种:同义cSNP(synonymous cSNP) 并不影响蛋白质氨基酸序列,而非同义cSNP(non-synonymous cSNP)则会改变蛋白质的氨基酸序列从而影响了蛋白质的功能,这种改变常是导致生物性状改变的直接原因。
不在蛋白质编码区的 SNP 仍可能影响基因剪接、转录因子结合、信使RNA降解或非编码区的RNA序列。受到这种 SNP 影响的基因表达被称为单核苷酸多态性表达(ESNP),可能发生在此基因的上游或下游。
INDEL 是指在原核苷酸序列中插入或丢失1个或多个相邻核苷酸,包括 small deletion 和 small insertion
当 indels 发生在编码区时,如果插入或缺失事件所涉及的核苷酸数目不是3的倍数,则会使处在突变发生位置下游的密码子阅读框架发生移动,这种突变称为移码突变 (frameshift mutation) 。它不仅可导致许多氨基酸的改变,而且还可能使终止密码子被抹掉或引入新的终止密码子,后果是产生长度异常的蛋白质。核苷酸插入引起的移码突变,可能通过缺失回复到野生型的DNA序列;但如果是由于缺失而引起的移码突变,则一般是不可能回复到突变之前了。
当插入或缺失连续排列的核苷酸是3的整倍数时,其结果是密码子的插入或缺失突变,而不引起移码突变。这种密码子整数倍的插入或缺失称为整码突变(inframe mutation)。移码突变同置换突变一样,都有突变热点(hotspot),即容易发生这些突变的位点。
SNV 单核苷酸变异(点突变) 一个碱基的改变,可以是SNP,也可以是INDEL
SV 结构变异 通常是上千个碱基,甚至是染色体级别上的变异
包括 缺失 deletion,重复 duplication( tandem串联,interspersed散在 ) ,倒位 invertion,易位 transposition
一般来说重点研究的是SNP,INDEL 还有SV
声明:本篇多为资料整理总结,仅用于自学记录和交流,侵删,谢谢。参考:
素锦时年_1b00 https://www.jianshu.com/p/df37d5f56bca
xuzhougeng https://www.jianshu.com/p/2a0ee4a010cb