以下是对宋凡老师(中国农业大学)讲座的笔记和个人总结
1 线粒体基因组是什么?
线粒体是重要细胞器,主要功能是生物供能。
线粒体基因组为双链环状DNA,其作为分子标记的优点包括:
1)基因组成相对稳定,
2)同源性高易于分析,
3)基因组较小,测序费用低,易获得
线粒体基因组成相对稳定:
1)13个蛋白编码基因
2)22个tRNA(具有二级结构)
3)2个rRNA基因(具有二级结构):rrnL和rrnS
4)控制区(control region):最长非编码区,具有调控线粒体基因组复制和转录的功能。控制区在不同类群中的变异较大,不容易注释。
线粒体基因组中的基因排序是相对保守的,但在不同的类群中都存在基因重排(gene rearrangement),基因重排包括基因的顺序和方向的变化
2 线粒体基因组如何获得?
1)一代测序的方法
提取全DNA/提取线粒体DNA
PCR引物步移法,使用通用引物获得片段,进行一代sanger测序,但通用引物测得的片段往往不能覆盖全基因组,然后在片段基础上再设计引物,扩增出空缺的部分。
缺点:重复序列区不易获得,该方法耗时长,难度大,而且设计引物很碰运气,宋凡老师的经验是一个月获得一个线粒体基因组
2)二代测序的方法
提取全基因组,进行二代浅层测序,因为线粒体基因组是多拷贝的,从测序数据中钓取线粒体基因片段进行组装。
宋凡老师用该方法获得线粒体基因组参考的文献:Bulk De Novo Mitogenome Assembly from Pooled Total DNAElucidates the Phylogeny of Weevils (Coleoptera:Curculionoidea) Gillett et al.2014 MBE
3 线粒体基因组用来做什么?
1)作为分子标记用于相关分析
线粒体基因组和核基因一样也是一种分子标记,因此也可以用于系统发育树的构建、种群遗传学分析等分析,在建立起稳健的系统发育树的基础上,又能进行后续的演化分析。
用分子数据(包括线粒体基因组数据)造成系统误差的原因(尤其是高阶元的系统发育,以及进化比较快的类群):
碱基组成异质性,位点间演化速率异质性,问题在于我用于系统发育分析的模型还是同质化模型(没有考虑异质性),造成的结果就是长枝吸引:进化快,异质性高的亲缘关系较远的类群反而聚在一起。
优化系统发育分析的方法:
利用贝叶斯混合异质性模型和位点速率优化策略,有效降低了系统误差的影响,为进化树的准确构建提供了方法参考
2)比较基因组学的研究
线粒体基因组结构的演化,如线粒体基因组的裂化
4 昆虫线粒体基因组学未来?
仅用线粒体基因组数据作为分子标记进行系统发育分析或其他分析容易受到质疑,但线粒体基因组依然是最方便获得的分子标记,仍可用于对低级阶元的系统发育的构建(系统误差的影响相对较小)。线粒体基因组结构的演化也是值得研究的领域