19年了,开一个好头,希望每周文献真的是每周文献,别跟上次一样,变成每半年文献(虽然中间看了不少文献,但都疲于项目而没有总结下来,时间一久等于没看)。
因为毕业设计要求全文翻译一篇外文文献,我就找了这一篇,18年10月份导师让看的,我的毕业课题也借鉴了其中的一点方法。
目前我对于单细胞测序技术的认识仅限于知道这种技术能研究肿瘤细胞的异质性,细胞的分化发育历程,以及区分细胞亚型。按照一些生物技术一般从人的研究中来再应用于动物、植物的套路,我能推测出在不久的将来这种技术将应用于其他物种,结合我的本科专业背景,我觉得用不了几年单细胞测序就会应用于常见经济作物或是农作物害虫的组织器官发育的相关研究中,除此之外,也能给传统的遗传学基础研究带来新的方向,这一篇文献讲的就是这方面的内容。
全文有点长,我翻译出来有一万字左右,所以在这里先陈述Methods部分,剩下的顺序不变,可以只看方法部分,以免浪费您的时间。这篇文献的专业水平对于现在的我来说还是有些难的,我不确定翻译得准不准,尽管我尝试了在网上搜索,但基本都找不到(比如COCT)。如果您能找出一些翻译错误的地方,请帮我指出来,感激不尽:)
侵删
原文来源:Li X, Li L, Yan JB. Dissecting meiotic recombination based on tetrad analysis by single-microspore sequencing in maize. Nat Commun, 2015, 6:6648
方法
材料准备
2012年,在海南收获了SK和Zheng58自交系杂交得到的F1代个体。2013年夏季,将F1代个体种植于武汉。将未成熟的穗在显露之前收获,并保存于水中。利用SNP50芯片对来自相同亲本的由204个家系组成的重组近交系群体进行基因分型(ref. 27)。构建了含有13,703个多态性标记的高密度连锁图谱,其中包含2,486个独特的区域。
四分子单细胞的分离和溶解
我们使用微量玻璃移液管和可编程显微注射器PM 2,000 (MDI, South Plainfield, USA)来分离单个四分子和单个小孢子,并破除细胞壁。在显微镜载玻片上分离四分子样品期间,将四分体样品浸没于分离缓冲液(27%D-山梨糖醇)中。从花药中提取四分子置于载玻片上,并将单个四分子分别分离于新的液滴中。通过反复吸入和吹出单个四分子,分离出四个小孢子(图. 1a-g)。 然后将细胞吸取至装有来自REPLI-g Single Cell Kit (QIAGEN, Hilden, Germany)的PBS缓冲液的PCR管中。 将这些PCR管保存在冰盒中以确保DNA不会降解。 从具有相同基因型的两个F1个体的雄穗中分离来自56个完整四分子的所有四个小孢子(分别来自两个F1个体,一个n = 26,另一个n = 30)。
单细胞全基因组扩增
我们使用QIAGEN REPLI-g Single Cell Kit溶解单个细胞,并按照标准方法用MDA(ref. 24)扩增其DNA。全基因组扩增产物将用于质量控制和全基因组测序。
全基因组扩增产物的质量控制
为了评估全基因组扩增产物的质量和覆盖度,我们选择了10个多态性分子标记,每一个都来自于10条玉米染色体中的一条染色体(补充材料 表5)。 理论上,这些标记的基因型应该在来自相同四分子的四个小孢子中表现出2:2的孟德尔分离。 丢弃在10种标记中超过2种具有异常或不可检测分离的低质量扩增DNA样品。 共224个单细胞全基因组扩增样品中的180个显示了10种标记中超过8种的预期分离模式,并被选择用于进一步分析(补充材料 图 1)。 我们选择了24个四分子(分别来自两个F1个体,一个n = 7,另一个n = 17),其中所有四分子的四个小孢子都具有用于全基因组测序的高质量全基因组扩增产物。随机在24个四分子中选择了12个四分子,利用玉米SNP芯片进行了3074个SNP的基因分型,目的是与测序得到的结果进行比较(补充材料 表 1)。
全基因组测序和单倍体的变异检测
来自24个四分子的96个单细胞的DNA样品用TruSeq DNA Sample Prep v2 Kit (Illumina, San Diego, USA)构建Illumina标准DNA文库,并在Illumina Hiseq 2000平台上进行双端测序。我们从96个细胞中获得了40.5亿原始reads。 通过Trimmomatic 3.0去除低质量碱基和reads(ref. 50)。我们用bwa51和samtools52将这些reads比对到AGPv3玉米参考基因组上。用samtools mpileup52进行SNP变异检测。 玉米四分子小孢子的单细胞分离和测序详细方案可以从http://www.maizego.org/Resources.html下载。
两个亲本的变异检测
通过植物基因组DNA提取试剂盒(TIANGEN,Beijing,China)提取SK的叶片DNA并用于制备Illumina标准DNA文库,然后在Illumina Hiseq 2000平台上测序。Zheng58 (‘SRR449340’, ‘SRR449342’ 以及 ‘SRR449343’)的测序数据从NCBI的SRA数据库(http://www.ncbi.nlm.nih.gov/sra/)下载。亲本SK在全基因组的平均测序深度达到8.0x,而亲本Zheng58用于SNP变异检测的基因组序列数据具有15.7x的测序深度。之后上述的两个数据集均用Trimmomatic 3.0(ref. 50)过滤,用SOAP2比对到参考基因组(ref. 53)。以下标准用于SNP变异检测:(1)Q值(2)reads深度(3)唯一比对的reads深度(4)仅考虑纯合SNP。然后比较亲本基因型,并在它们之间鉴定多态性SNP(dSNPs)。我们要求两个SNP之间的最小距离不能小于4bp。最终,通过比较亲本全基因组序列获得1,269,588个原始SNP(补充材料 表 2)。
群体水平的SNP过滤
原始SNP按照如下标准进一步过滤:(1)不考虑最小等位基因频率小于0.1的SNP;(2)不考虑在10个以下小孢子中存在的SNP;(3)对于具有不同单倍体型的区段来说,如果该区段的SNP数量少于20个,并且在少于5个小孢子中发现,那么这些SNP也不予考虑。最终获得599154高质量的SNP(补充材料 表 2),将用于96个小孢子单倍体型的构建。
基因组水平的重组分析
我们从www. maizegdb.org下载了玉米基因组的注释文件‘Zea_mays.AGPv3.21.gff3’,并提取了53,648个适合转录本的AGT密码子和UGA密码子的物理坐标。我们搜索了距离每个CO最近的转录本。CO带的中心被认为是CO的位置。然后为了简单起见,我们将每个基因模型中ATG和UGA之间的距离调整为玉米中的平均基因长度(基于B73基因组计算得到的2,500bp)。 为了避免可能的错误,我们只关注了CO 带长度大于100 Kb的重组交换,一共581个(62.9%),用以绘制CO和ATG密码子之间的距离的频率图。另外做了5次模拟作为阴性对照,每次581个随机位置(图. 2c)。在更小的范围内,我们仅关注CO 带小于10Kb(一共234个,约为25.3%)的CO,以通过直方图确定与基因模型有关系的CO的确切位置(图. 2d)。
桑格测序验证COCT
从很好地比对到小于4Kb的小基因组区域的COCT中随机选择5个COCT,并结合PCR和桑格测序加以验证。引物信息附于补充材料 表 5中。
基于符合系数的重组干涉
CoC作为观察到的两个CO与预期两个CO的比率的一种评价指标。在这篇研究中,同时在单小孢子水平和四分子水平下计算了符合系数。在1Mb滑动窗口中计算重组的数量。 通过将来自两个任意位置的两个独立的重组发生率相乘可以得到两个重组同时发生的期望概率。CoC可以用来表示为两个对应位置观测到的两个重组同时发生的概率与期望概率的比值。最后,计算相同间隔距离的位点之间的平均CoC(图. 4a)。
符合系数,又称并发系数。实际双交换值与理论双交换值之比。符合系数通常介于0~1之间。一个区段发生交换后,使两条相同染色单体在其他区段再次发生交换称为负干涉,也称染色单体干涉,符合系数大于1。在噬菌体、细菌、真菌和家蚕中曾发现。——来源于百度词条
接下来就是讲故事环节了。
减数分裂重组驱动了真核生物有性生殖以及基因组多样性的产生。对来自一次减数分裂的四条染色单体进行分析的方法叫作四分子分析,这是一种研究同源重组机制的理想方法。为了进行单细胞全基因组测序,我们开发了一套方法用于从四分子中分离出单个小孢子。高分辨率的重组图谱表明重组交换(crossover)位点不规则地分布在基因组上,相比于基因间区更有可能发生在基因区域,尤其是在注释基因的5’和3’端更为常见。基因组交换(genomic exchanges)的直接检测表明转换(conversions)可能发生在大多数的交换区域。在群体层面观测到重组负干涉(interference)和微弱的染色单体干涉。综上所述,我们的发现促进了我们对于减数分裂重组的理解,对该领域的基础和应用研究具有重要意义。
在有性生殖中,减数分裂完成了从二倍体亲本细胞到单倍体配子的转变。在减数第一次分裂前期,染色体双链开始断裂,当发生染色单体同源重组时被修复,也导致了基因组交换(crossover, CO)或是伴随SDSA(合成依赖性的单链复性)的非交换(noncrossover, NCO)。重组交换和非交换类型都可能增加基因转换(GCs)的发生,一种同源非姐妹染色单体之间非互补的基因组交换,能导致新基因的产生(这里指的是b->B, B->b这种类型)。基因组交换重新洗牌了亲本的基因,通过双霍利迪连接体(double Holliday junction)交换在配子中产生了新的基因组合,修复非姐妹染色单体(DNA双链断裂修复);然而伴随GC的NCOs可以通过SDSA以另外一种不改变的背景来产生新的基因(ref. 1)。因此,在减数分裂的四个配子中将会出现2:2(伴随CO类型)和3:1(伴随带有GC的CO和NCO类型)的基因分离。减数分裂重组过程中借助染色体交叉的形成来稳定二价体,确保了染色体的正确分离(ref. 2,3)。减数分裂重组促进了基因的组合,为真核生物基因组的进化(ref. 5)和自然选择(ref. 4)创造了基础,其重要性不言而喻。
我找了一些资料,来解释这段话。图片来自中国大学MOOC,现代遗传学,厦门大学课程。
分子水平的DNA重组模型
- 两者的区别在于非姐妹染色单体是否真的交换了遗传物质,大多数的重组事件属于左边这种。
- 重组可以修复损伤的DNA。
- 注意图中红色箭头标记出的异源双链DNA区,GC发生在这里。另外,我有一个疑问,“the spot of recombination”指的是这段区域的中间还是一整个区域?
碱基错配激活错配修复机制(发生在减1),修复之后有以下几种类型:
前两种会使B、b的比例偏离2:2,后两种不变。
联想“CO”和“NCO”都有杂合双链区,所以“重组交换和非交换类型都可能增加基因转换(GCs)的发生”。
继续讲故事。
减数分裂重组的发生率和分布很大程度上决定了子代群体的基因分布和单体型结构。重组率表现出被标记的种內(ref. 6,7)和种间(ref. 8)变异,这能和迄今为止研究的几乎所有生物的基因组构成相联系(ref. 4,9)。在早期的研究中,研究者们通过观察由多次减数分裂得到的分离群体来理解重组。在酵母中,由减数分裂产生的四个单倍体子代被存储在子囊中,因而很容易研究。这些子代可以被分离,单个的减数分裂子代可以被克隆增殖,因此可以不用扩增就能直接测序(ref. 10,11)。在拟南芥中,qrt1突变体能保持成熟的花粉粒从四分子时期就处于聚集的状态,因此被视为能直接研究减数分裂产物的理想材料(ref. 12-15)。随着高通量测序技术和单细胞全基因组扩增技术的飞速发展,在配子水平研究减数分裂重组以及得到单碱基水平分辨率的可视化重组图谱已经成为可能(ref. 16)。在人类遗传学研究中,借助单细胞测序进行的精子,卵子,极体的相关研究为直接研究减数分裂重组提供了一种强有力的策略(ref. 17-19)。在植物学研究中,植物细胞壁阻碍了核酸的提取和溶解,因而单细胞测序仍然面临挑战。玉米作为细胞遗传学和遗传学的模式植物,已经被成功应用于重组变异的研究中(ref. 6,7,20-22)。
我们开发了一种简单的方法,对来自同一个四分子的四个小孢子进行分离和全基因组测序,这一方法促进了植物单细胞水平重组的研究。我们利用来自24个四分子的599154个单核苷酸多态性位点构建了高分辨率的重组图谱。结果表明基因组交换不规则地分布在基因组上,相比于基因间区更可能发生在基因区。我们直接检测到了基因转换,并且这些转换似乎存在于大多数的CO区段。我们观测到了重组负干涉,这说明两个重组交换同时发生的频率比预期明显要高。复杂的染色单体干涉首次在玉米中观测到,这意味着遗传背景可能影响着基因组选择和演化。这些发现为更好地理解减数分裂重组提供了有利信息,因此促进了植物育种。
结果
玉米四分子群体的单个小孢子测序
优良自交系品种Zheng58此前已经被深度测序(ref. 23),热带近交系品种SK挑选自地方品种,两者杂交得到F1玉米杂种个体,种于田间直至成熟。花粉发育阶段的细胞分裂主要有两种,从小孢子母细胞到四分子阶段的减数分裂,以及从分离小孢子到成熟花粉的有丝分裂。在这篇研究中,我们成功地捕获到了完整的四分子,甚至可以通过仔细地观测正常四分子发育状态下的分离过程,在四分子完全分离之前记录单个即将分离的小孢子。我们用玻璃微量吸管在显微镜下将来自同一个发育四分子的四个小孢子分离出来(图,1a-g)。由于细胞内部的渗透压较高,在整个分离过程中,细胞均处于27%的D-山梨糖醇溶液中。我们采用吸管吹吸的操作方法成功地破除了细胞壁,以及分离了四分子,在这之后,将四个小孢子细胞置于PCR管中,进行细胞溶解。我们使用多重置换扩增技术来扩增小孢子细胞的全基因组DNA(ref. 24),扩增后产物的覆盖度用10个分子标记来评估(补充材料 图,1);我们挑选了来自24个四分子的96个小孢子细胞用于进一步的分析。我们用3072个SNP标记对随机挑选的12个四分子进行了初步的基因分型,以此来验证其完整性。结果显示42%-62%的SNP标记被成功分型,同时杂合度也非常低(<1%),这表明通过MDA方法获得了高质量的DNA,足够用于全基因组测序(补充材料 表1)。
采用Illumina Hiseq 2000测序平台对96个小孢子进行了全基因组测序,平均测序深度约为1.4x,共得到38亿reads,基因组的覆盖度约为41%。大约92%的过滤后的reads成功比对到了玉米B73参考基因组(补充材料 数据 1)。我们从亲本中鉴定出了1269588个SNP位点。按照多重标准严格过滤之后得到599154个高质量的SNP,将用于进一步的分析(见 方法,补充材料 表格 2)。我们对每一个四分子进行变异检测,结果显示这些四分子的SNP数量在124957到335266之间,平均为271524。在每一条染色体上,相邻的SNP标记之间的中位距离是235bp,这为构建高分辨率的重组模型提供了支持。
图1:植物单个小孢子测序。(a)单个小孢子分离示意图。(b)取自穗部的四分子细胞团悬浮于缓冲液中,四分子被分离出来后,用微量玻璃吸管置于新的少量缓冲液中。(c)通过吸管的吸,吹操作可快速分离四分子的四个小孢子。(d-g)吸取出的小孢子分别放于PCR板上面,之后进行溶解和MDA扩增(比例尺,100um;1-4表示四个小孢子)。(h)高分辨率的SNP数据集已经得到,经过多重标准过滤后的SNP位点也已经被鉴定出来。表征相邻SNP位点之间距离的直方图和累计百分率显示了测序数据很高的覆盖度。(i)采用了测序技术和SNP芯片技术得到的四分子17的单倍体型,两者得到的重组模型是一致的,表明通过这种单细胞测序技术能得到高质量的数据。COCT,与CO相关的基因转换区段。
高分辨率的重组图谱
相比于其他的分离群体,例如重组近交系(RILs),通过鉴定同一个四分子的四条染色单体的基因组交换,我们可以直接评估减数分裂过程中的重组交换(图. 1i)。综合四个染色单体得到的重组模型与低密度SNP芯片得到的结果高度一致(图. 1i),这也证实了变异检测得到的SNP具有很高质量。在24个四分子中总共检测出924次CO(补充材料 数据 2),不同的四分子中CO的范围从24到50不等,平均为38次(补充材料 表 3)。这个结果比之前报道的每个玉米小孢子母细胞平均发生20.5次CO要高不少(ref. 20)。这可能是因为更高的遗传多样性(ref. 6)和/或重组干扰(见下文)。来自两个F1子代的四分子的平均CO数量也是显著不同的(P=4x10-4,方差分析),F1子代个体1(n=7,取了7个四分子)为31.6+/-5.6,F1子代个体2(n=17)为41.4+/-5.0(补充材料 表 4)。在单倍体子细胞中CO的数量为8到29(补充材料 数据 3)。
为了检测全基因组水平的CO分布,我们首先确定了每条染色体上的CO分布,发现每条染色体上CO数量与染色体长度和联会复合体长度显著相关(补充材料 图. 2;泊松分布r分别为0.95和0.98),这与此前的报道相吻合(ref. 25,26)。然后再从基因组水平评估CO数量。正如预期一样,CO更可能发生在每条玉米染色体的两端,且沿着着丝粒区域逐渐减少(图. 2a)。然而也有例外,在少数的着丝粒区域有很多的CO,这与预期相违背。这种非随机的CO分布与来自相同亲本(SK和Zheng58)并由玉米SNP50芯片基因分型的重组近交系群体得到的结果高度一致(泊松分布r=0.72; P=2.0e-16. 图. 2a)(ref. 27)。
高覆盖度的SNP可以很精确地定义CO,这些CO中的80.2%(741)都位于小于200Kb的区间内(图. 2b)。有些CO的区间长度很大,因为如下原因:(1)该基因组区域可能没有足够的遗传多样性(两个亲本的SNPs有差异)或者(2)某些样本在该区域的覆盖度可能较低。为了避免可能的错误,我们仅关注区间长度小于100Kb的581个CO区段,以此来定义与基因相关的CO的位置。在靠近基因的ATG起始密码子位置检测出大量的CO。我们做了5次模拟重复,在相同的区域都没有出现这么多的CO(柯尔莫可洛夫-斯米洛夫检验,P=3.2x10-6;具体细节见方法部分),这表明CO更可能出现在基因区周围(图. 2c)。这与酵母(ref. 28)、拟南芥(ref. 29)中的CO研究结果是相似的,但是与人类的CO研究显著不同(ref. 18,19,30),人类的CO研究表明基因转录本区域附近的CO减少。然后,我们只关注区间长度小于10Kb的CO(共234个,25.3%)来确定与预测基因(来自B73参考基因组AGPv3.21,由玉米基因组测序项目注释(ref. 31))相关联的CO的确切位置。CO通常更可能发生在基因的5’端和3’端(图. 2d)。这表明在玉米中重组导致的基因组交换倾向于替换基因的启动子/调节区域(5’和3’端),这可能造成了子代基因表达的改变。
图2:玉米中重组交换不均匀分布。(a)基于B73参考基因组,以3Mb为窗口大小得到的重组交换分布模型。(b) CO 区段长度的直方图和累计百分率。(c)重组交换到最近转录本的起始密码子之间的距离的频数分布图。红色表示已观测到的CO,多集中在基因区域,然而5次模拟的结果(黑色线和灰色线)显示在基因区域的CO较少,实际观测到的结果与模拟的结果有显著差异。(d)基因水平的CO分布。在频数分布图(c)中,观测数据集与5次模拟数据集有显著差异(柯尔莫哥洛夫-斯米尔诺夫检验,P=3.2x10-6)。在频数分布图(c)和直方图(d)中,CO到最近转录本的ATG的“距离”不是物理距离,而是标准化之后的距离。我们测量了ATG到UGA之间的平均注释距离,为2.5kb,据此按比例改变以得到标准化距离。在直方图(d)中,我们也假设ATG到UGA之间的距离占了转录本的60%(6个红柱子),5’和3’端的UTR区占了40%(图中的深蓝色柱子)。
大多数的CO都会发生基因转换
在GC过程中,来自供体染色体的DNA序列转移至同源染色体的姐妹染色体或染色单体的受体区域。从进化的角度来讲,基因转换至关重要,尤其对于重组过程的DNA修复来说更是如此32-34。在拟南芥中35,COCT(CO-associated conversion tracts,在CO类型的重组过程中进行基因转换的区段)的长度曾被报道是小于1kb,在酵母中10则是小于2kb。到目前为止,由于多方面的限制,比如小GC长度受限,高分辨率技术以及合适的遗传材料缺乏(像拟南芥中的qrt1突变体12)等等,玉米中的基因转换仅在基因组水平被研究过。在这篇研究中,我们检测出了924次重组交换,其中160含有非孟德尔分离(3:1)的区段,对应的,假设有基因转换发生(补充材料 数据 2)。因为测序覆盖度不够,区段长度较短,两个亲本存在多态性等原因,这些GC事件的数量可能被低估。在160个COCT中,有10个能很好地比对到基因组上不到10Kb的区域。其中7个有SK供体片段,然而仅有3个有Zheng58的供体片段,暗示了可能存在亲本的重组交换偏向性。但因为样本量太小,不能得出明确的结论(卡方测验, P=0.07)。
5个重组交换区段(包括两个经过高通量测序后估计没有可检测的转换的重组交换)经桑格测序检测之后确认有效故被挑选出来进行下一步分析。有一个GC区域仅仅发现了一个SNP,这可能是错误的发现。令人好奇的是,在全部的5个区段中GC均被鉴定出来,GC区段的长度从220到1875bp不等(图. 3a-e)。这些结果验证了之前的理论:基于双链断裂修复和错配修复可以导致至少在一个区段片段上出现非孟德尔分离的观测结果,可知重组交换会出现基因转换1。因此,当发生重组交换时,应该能经常检测到基因转换。而且,最长的GC区段(1875bp)对应的复杂COCT被发现于正常的DNA片段和一个未预料到的异源双链DNA片段(图. 3a)。这表明杂合双链断裂区域直到四分子时期可能还没有被完全修复。然而,既然在这个区域只有一个杂合SNP被发现,这也可能是全基因组扩增过程中的一个错误36,其出现概率约为10-6到10-7。
图3:经桑格测序验证的COCT。从那些能很好地比对到基因组短区间(< 4Kb)的区段中随机选出了这5个CO 区段。这5个区段上的基因转换都已经被桑格测序验证。被测序区间的起始位置(0bp)分别是:chr4:129,510,201; chr6:160,235,403; chr4:9,636,448; chr6:115,545,843; chr1:4,350,391。
玉米中存在大量的重组负干涉
在一条染色体上,靠近的位置发生了两次重组交换,那么实际的观测数将小于预期的观测数,这就是重组干涉。符合系数(CoC)是一种用来描述重组干涉强度的指标(ref. 37,38)。在全基因组水平上我们选取1Mb为窗口来计算CoC(图. 4a),在所有染色体水平上的随机位点组合鉴定出了强烈的负相关,除了一些小于10Mb位点组合。这表明将10Mb的窗口作为正向干涉和负向干涉的过渡点相对来说有些小(图. 4a)。与此前在人类(ref. 19)、酵母(ref. 39)、小鼠(ref. 40)和拟南芥(ref. 41)中报道的结果来比较,玉米在更短距离内有重组正干涉的存在,而在大于10Mb的距离下有重组负干涉,这些负干涉增加了重组交换的数量。在四分子水平,平均符合系数为1.15(在单细胞水平为1.43),也就是说,所观测到的CO发生率要比每个四分子期望的高0.15倍,比单个小孢子中的高0.43倍。因为重组干涉率在不同的玉米群体中是不一样的(ref. 6),所以在我们的研究中,比起之前的报道(ref. 20),重组负干涉可能分布在更多的重组中(见上文)。我们也能利用已有的数据精确地定位CO区间。同一条染色体上相邻的两个重组交换的区间长度的分布有三个清晰的峰值,分别约为10Mb,50Mb,120-180Mb(图. 4b)。而且在重组活跃区段,彼此距离小于10Mb的CO的可能性更高(补充材料 图. 3a)。不一致的重组活跃区段的分布(补充材料 图. 3b)可能是导致重组负干涉的潜在原因之一(图. 4b)
图4:遗传学干涉。(a)重组干涉。以1Mb为窗口计算出的平均符合系数显示了染色体水平上符合预期的重组正干涉(< 10Mb),以及不符合预期的重组负干涉(> 10Mb)。水平线代表没有干涉时(符合系数为1)的期望值。(b)相邻重组交换之间的距离分布。被观测到的三个峰值出现在间隔距离为10,50和120-180Mb的区间。(c,d)染色单体干涉。我们定义了四种重组交换类别,并在两个水平评价它们——发生在一条染色体两条臂上的两个重组交换(水平1,c)以及一条染色体相同臂的两个重组交换(水平2,d)。比率和bootstrapping分析结果表明染色单体干涉存在于以上两个水平(和人类研究的结果显著不同)。每一次的bootstrapping试验从24个四分子中随机挑选15个,重复进行100次,并且每一次都会计算出四种重组交换的比率。
玉米基因组检测出了较弱的染色单体干涉
当没有重组干涉存在时,重组交换将在所有的染色体上随机分布。此前的研究表明,人类19和真菌42-45有不同水平的染色单体干涉。在我们的研究中,来自同一个四分子的四个小孢子均被分离出来,因此可以用来分析植物中的染色单体干涉。为了精确地分析染色单体干涉,我们定义了如下四种染色单体重组交换:2 chr,两个染色单体之间的重组交换(一条染色单体来自亲本SK,一条染色单体来自亲本Zheng58);3 chr(Zh),三条染色单体之间的重组交换(两条染色单体来自亲本SK,一条染色单体来自亲本Zheng58);3 chr(SK),三条染色单体之间的重组交换(一条染色单体来自亲本SK,两条染色单体来自亲本Zheng58);4 chr,四条染色单体之间的重组交换(两条染色单体来自亲本SK,两条染色单体来自亲本Zheng58)(图. 4c,d)。我们从一条染色体的两条臂(水平 1,图. 4c)以及一条染色体的相同的臂(水平 2,图. 4d)这两个层面来统计这四类重组交换。按照水平1,上述四种定义的重组交换的观测数分别是58,61,57和49。出乎意料的是,bootstrapping算法分析表明,按照水平1,四种重组交换的比率为:36.1±3.2:38.0±2.8:35.7±3.1:30.8±3.0,这和CO随机分布下期望的1:1:1:1的比率显著不同(进行100次bootstrapping分析时,P=8.14x10-56)(图. 4c)。最少的一类重组交换(4 chr,占比22%)在四分子和单细胞水平与重组交换干涉的差异相关联。只有当4 chr小于25%时在单细胞水平的CoC才能够比在四分子水平的高。按照水平2,上述四种定义的重组交换的观测数分别是65,81,71和64。经过100次的bootstrapping分析,这四种重组交换的观测比率为:41.5±4.4:49.4±4.2:44.2±3.6:40.2±4.2,同样地,明显偏离了随机分布下期望的1:1:1:1(P=1.04x10-59;图. 4d)。这个结果表明,染色单体干涉可能不仅仅存在于染色体的一条臂上,也可能存在于两条臂之间,这一点不同于人类研究中的观测结果19。此外,在两种水平下3 chr(Zh)和3 chr(SK)重组交换比例的变化表明不同的遗传背景可能影响染色单体干涉,导致染色单体重组交换时存在亲本的偏向性。相同真菌物种的不同数据集也显示了不同程度的染色单体干涉43-45,表明在其它界中也存在遗传背景的影响。
讨论
在植物单细胞全基因组分析中,遗传材料的分离充满挑战,因为植物细胞存在坚硬的细胞壁。尽管如此,我们开发了一套简单的物理分离方法,以此成功地分离并测序了24个四分子的所有小孢子。借助这套方法,我们能够构建出玉米四分子群体中接近碱基分辨率的重组图谱。在约为1.4x的测序深度下,我们的方法能得到玉米单细胞基因组大约41%的覆盖度,比在相似测序深度下人类精子18(23%)和卵细胞19(32%)报道的要高一些。这一套分离方法也可能应用于其它开花植物。
四分子分析是精准研究减数分裂重组,CO/NCO相关的基因转换和遗传干涉的理想遗传学方法(ref. 11)。然而,全基因组水平的四分子描述仅在很少数物种中实现了,比如酵母,它的所有减数分裂产物,即孢子,被储藏在子囊中,很容易分离(ref. 10);再比如拟南芥中的qrt1突变体,它保留有完整的四分子(ref. 13)。在这篇研究中,我们开发了一种分析常规玉米四分子的四个减数分裂产物的方法,并且构建了高分辨率的减数分裂重组图谱。我们观测到每次减数分裂每条染色体平均发生3.85次重组交换,比拟南芥(ref. 35,46)中的1.8-2.0要大,比酵母(ref. 10)中的5.66要小。此前被研究过的物种之间的详细比较见表1。有趣的是,两个玉米F1子代的平均CO数量有显著差异(31.6与41.4,方差分析P=3.7x10-4)。两个F1子代的基因型是一样的,但是四分子细胞是在不同的时间,不同的环境条件下取的。这显然表明了环境因素能导致减数分裂重组的差异。之前在拟南芥中的研究也记录了在更高的温度下能增加重组交换的发生率(ref. 13)。这些都表明改变环境条件能够增加重组率,这个结果也许高度符合我们在育种中希望产生更多可选择变异类型的需求。然而,因为我们选用的只是一个小群体(7个四分子和17个四分子),所以缺乏额外的证据,为了排除这种现象不是由于随机误差引起的,需要采用更大规模的群体以及进行多次试验。
基因转换就是来自“供体”染色体的DNA序列单方向地转移至高度同源的“受体”上,被证实与人类的遗传疾病相关47。在植物中,基因转换所起到的作用还没有被很好地研究过。我们发现在被检测的24个四分子中,接近20%的重组交换发生了基因转换。这进一步地在5个COCT中用桑格测序证实了。在最近的拟南芥相关的研究中,在一次减数分裂中鉴定出了多达265.3次基因转换48,这比我们的研究结果多得多,也比其他拟南芥的研究结果高14,35,46。在人类的研究中,基因转换的发生率估计为0.3到10,这也表明在动物的研究中不同的遗传背景会导致不一样的重组发生率41。最近,bz基因座的研究显示大多数的重组体都发生了基因转换49。bz基因座内重组起始位点的两极分布现象非常像我们的发现——在基因的5’和3’端基因组水平的重组交换发生得更多(图. 2d)。我们相信在这篇研究中基因转换的发生率是被低估的,因为测序的覆盖度偏小还不足以鉴定出更小的CO/NCO相关的基因转换。我们不能鉴定出NCO相关的基因转换,因为每一个包含NCO相关的基因转换的区段的长度可以小到几十个bp,为了进行精细的研究至少需要50x的深度测序35。在未来,深度测序将使我们能够更精细地去研究基因转换及其机制。植物单细胞技术和全基因组测序技术的结合使得通过四分子细胞或是极体细胞基因分型来推断植物个体花粉或胚珠的单倍体型成为可能19。