Piepho HP, Möhring J (2007) Computing heritability and selection response from unbalanced plant breeding trials. Genetics 177:1881–1888. doi: 10.1534/genetics.107.074229
计算遗传和选择响应从不平衡植物育种试验
摘要
遗传力通常由植物育种者和遗传学家用作测试一个或一系列试验的精确度。 它的主要用途是计算对选择的响应。 提出用于计算遗传力的大多数公式隐含地假设平衡数据和独立基因型效应。 这两个假设在植物育种试验中经常被违反。 本文提出了一种基于模拟的方法来解决这个问题。 关键思想是直接模拟感兴趣的量, 例如,对选择的反应,而不是试图使用一些特定的遗传力度量来近似它。 该方法由三个示例说明。
遗传力通常由植物育种者用于量化单一田间试验或一系列田间试验的精度。它被定义为群体中的个体之间的表型方差中可遗传的遗传效应(也称为狭义上的遗传性)所占的比例。 类似地,广义上的遗传性被定义为归因于整个基因型效应占表型方差的比例,包括加性,显性和上位效应的总和( [N yquist 1991] ; [F alconer和M ackay 1996])。 遗传力是数量遗传学中的一个关键参数,因为它决定了对选择的反应。 在动物繁殖环境中提出了遗传力的原始定义,其中观察和选择的基本单位通常是单个动物。 相比之下,在植物育种中有许多不同的交配设计,观察单位是非常多样的,从单个植物到在设计实验中在广泛环境中测试的基因型的表型均值。 正如Holland等人(2003)所指出的,这使遗传力的定义和估计变得复杂。 一个特别的困难是几乎所有的遗传方程都假定平衡数据,而大多数试验表现出某种形式的不平衡。 具体来说,大量基因型通常在涉及不完整基因块的设计中进行测试,常见的遗传力定义不适用于此类情况。 此外,标准定义假设试验通过对区组,小区,植株等具有独立随机效应的模型进行分析,而田间试验的分析通常由空间模型进行,这意味着与观察单位有关的复杂方差 - 协方差结构。
对于在具有r个重复的随机完全区段中布置的m个试验的平衡系列,在entry平均基础上的广义遗传力被定义为(1)
( [Falconer和Mackay 1996],其中是基因型方差,是表型方差。 一些作者使用符号代替 , 如Nyquist (1991)。 此外,有时称为“重复力”。“表型”是每个试验(环境)和r个重复的基因型的平均值。这有方差(2)
其中 是基因型 - 环境相互作用方差 ,是残差误差方差。 类似地,平均值的狭义遗传度定义为
其中是加性遗传方差,如等式2中给出的。 在平衡设计的情况下, 和具有许多简单和直接的解释。 例如,是可以由基因型解释的表型的部分,其中表型是entry的算术平均值。 因此, 等价于(潜在)基因型对观察到的表型的线性回归的决定系数【】。 它也是预测(表型)值和实际遗传或基因型值之间相关系数的平方。 最重要的是,遗传力( 和)可用于预测对选择R的响应, (或 ),其中S是选择差( [F alconer和M ackay 1996],对植物育种者而言这也许是一个主要的用途。
当数据不平衡或当遗传效应相关或异方差时, [方程2]不再成立,并且没有简单的方程可用于计算对选择的响应。 基本上,这是因为表型和选择反应之间的相关性在不同基因型之间不同,因此在平衡情况下,在选择反应( R)和选择差异( S )之间没有简单的线性关系。 表型可以被认为是调整的输入平均值, 即 ,假设固定基因型效应的最佳线性无偏估计量(BLUE)。 然后,对选择反应的分析计算不仅受到调整平均值的方差的异质性,而且还受到通过最小二乘平差调整诱导的平均值之间的相关性的阻碍。 此外,对于不平衡数据和大量基因型,期望通过最佳线性无偏预测(BLUP)而不是BLUE来估计遗传效应,并且在BLUP的计算中,调节输入平均值(通常被认为是表型)通常不直接涉及。 当遗传效应相关时,出现进一步的并发症, 例如 ,当利用谱系信息时。
这提出了在不平衡数据和相关遗传效应的更一般情况下如何计算遗传力的问题。 在文献中可以找到各种方法,其中大多数提出了对不平衡数据和/或相关遗传效应的遗传力的一般定义( [H olland 等人 2003]; [Cullis 等人 2006];[H elms和H ammond 2006] ; [O akey 等人 2006]; K.E mrich ,未发表的结果)。 我们认为遗传性的替代定义有时是有问题的,因为它们并不总是与它们的平衡数据对应物具有相同的直接解释。 此外,通常不是感兴趣的遗传性本身,而是一些相关量,其在平衡情况下可以通过简单的方程直接从其计算,例如对于选择的响应。 我们认为仔细考虑遗传性的具体概念或定义是重要的,或者在平衡的情况下从其中得到的数量是直接的利益。 通常可以直接计算这样的量,并且在复杂的设置中,这可能比尝试计算遗传力的有意义的测量更直接。 例如,在不平衡数据或相关遗传效应的情况下,更准确地是直接计算对选择的响应,而不是将一些特定的遗传性估计插入到用于响应假定平衡数据和独立遗传效应的选择的标准方程中。 事实上, [H anson(1963],第127页)提出将遗传力定义为“当在定义的参考单位上进行选择时期望获得的选择差异的分数” [。] [(2003年],第11页),“遗传性只有参考定义的选择单位和反应单位,这些可能因育种计划而异。”在本文中,我们采用类似的观点,强调确定统计量基于其选择,在此表示为“选择统计量”,以及感兴趣的遗传效应(在此表示为“目标效应”)。例如,我们可以基于BLUP的加和两个亲本的遗传价值(选择统计),从而旨在选择具有最佳基因型值(目标效应)的后代。 一般来说,遗传的概念与选择统计和目标效应的相关性有关**。
在本文中,我们提出一种计算遗传力和相关数量的一般方法,如对选择的反应。 为了普遍适用,所提出的计算方法采用模拟。