基因(遗传因子) 是产生一条多肽链或功能RNA所需的全部核苷酸序列。带有遗传信息的DNA片段称为基因。(百度百科)
我们都知道,不论真核生物还是原核生物都离不开基因,它储存着生长、发育、凋亡等几乎全部生命过程的信息。
一、基因结构
基因包含编码区和非编码区- 编码区:真核生物基因的编码区是不连续的,分为外显子和内含子,它们交替出现。在原核生物中,基因是连续的,也就是说无外显子和内含子之分。
- 非编码区:不能编码蛋白质的区段叫做非编码区。非编码区位于编码区前后,同属于一个基因,控制基因的表达和强弱 。
二、编码区(Coding region)
- 外显子 Exon
外显子(expressed region)是真核生物基因的一部分。外显子是最后出现在成熟RNA中的基因序列,又称表达序列。 编码区中不连续的具有蛋白编码功能的DNA序列
- 内含子 Intron
内含子(Intron)又称间隔顺序,指一个基因或mRNA分子中无编码作用的片段。就是编码区中外显子之间间隔的非编码序列。
- 外显子的尾部与下一个内含子的头部大多是GT
- 内含子的尾部与下一个外显子的头部大多是AG
- 记做GT-AG法则,作为RNA剪切的识别信号。
- 起始密码子(ATG),终止密码子(TAA、TGA、TAG)
- 开放阅读框(ORF):从起始密码子到终止密码子的碱基序列,且不包含终止密码子
三、非编码区(Non-Coding region)
- 增强子 Enhancer
增强子是DNA上一小段可与蛋白质结合的区域,与蛋白质结合之后,基因的转录作用将会加强。增强子可能位于基因上游,也可能位于下游。一般位于转录起始位点上游大约100个碱基以外。
- 启动子 Promoter
启动子是特定基因转录的DNA区域,启动子一般位于基因的转录起始位点5‘端上游,启动子长约100-1000bp。与RNA聚合酶特异性结合。
CAAT box
第一个外显子的5'转录起始位点(TSS)上游大约70-80个碱基的位置,具有GGCCAATCT
共有序列的核苷酸序列。是RNA聚合酶的结合位点,其作用是控制转录起始频率。
GC box
位于CAAT box两侧,包含的碱基是GGCGGG
,它有转录调节、激活转录的功能。
TATA box
第一个外显子的5'转录起始位点(TSS)上游大约20-30个碱基的位置。包含的碱基信息是TATAATAAT
,其作用保证RNA聚合酶可以准确识别转录起始位点并开始转录过程。它影响转录的起始。
- 终止子 Terminator
终止子处于基因或操纵子的末端,给RNA聚合酶提供转录终止信号的DNA序列。
ATAAA
ATAAA 是 preRNA 在通过修剪后形成成熟mRNA 时在3'UTR产生ployA 是的加尾信号。这段序列再往下到转录终止位点(TTS)之前,是一个反向重复序列(7-20个碱基对),转录后形成一个发卡结构,可以阻碍RNA聚合酶移动,终止转录
回文序列 palindrome sequence
回文序列是双链DNA中的一段倒置重复序列,这段序列有个特点,它的碱基序列与其互补链之间正读和反读都相同。当该序列的双链被打开后,如果这段序列较短,有可能是限制性内切酶的识别序列,如果比较长,有可能形成发卡结构,这种结构的形成有助于DNA与特异性DNA与蛋白质的结合。
三、preRNA
- 转录起始位点 Transcription start sites (TSS)
TSS在启动子区下游和起始密码子上游
- 转录终止位点 Transcription termination sites (TTS)
TTS在终止子区下游&终止密码子下游
四、mRNA
- UTR:mRNA两端的非编码序列
- 5'UTR:上游非编码区,位于5'帽子与起始密码子(AUG)之间
- 3'UTR:下游非编码区,位于编码区末端的终止密码子到3’尾巴之间
- 5'帽子:作用就是帮助mRNA跨过核膜,进入胞质,并且此过程中保护5‘不被降解;翻译时保证IFiii和核糖体识别
- 3’poly-A尾巴:作用也是帮助mRNA跨过核膜,进入胞质,并且增加了mRNA在胞质中存在的稳定性。因为mRNA的降解过程是随着时间延长,A尾逐渐变短;
参考链接