mRNA:信使RNA(message RNA),基因转录产生的RNA,也称为转录本。由于剪接等因素,一个基因转录常常可以形成多个mRNA。
CDS:编码区(coding sequence),指mRNA中编码蛋白质的那段序列。CDS是已知的一个基因上确确实实翻译成蛋白质的区段,成熟mRNA中由一个或几个exon组成。
exon, intro: 基因DNA分为编码区和非编码区,编码区包含外显子和内含子,一般非编码区具有基因表达的调控功能,如启动子在非编码区。编码区则转录为mRNA并最终翻译成蛋白质。
ORF:ORF则是指,任意一段序列,只要起于ATG止于终止子,都可以叫做ORF。ORF是一种预测,而不是一种已知的翻译区。即随意写下一段DNA序列,只要以三个碱基为单位能找到ATG和终止子,就可以称作ORF,这段ORF甚至可能不是一段真正存在的DNA序列,但是它仍然是ORF。一段序列是可以有多个ORF的,只有当ORF符合已知的可翻译成蛋白的序列时,才能等同于CDS。
一个mRNA可能有多个CDS,一个CDS也可能有多个exon。