大家好,本周给大家分享的是最近发表在NG上与跨地理区域的基因-环境相关性会影响全基因组关联研究相关的一篇文章。
文章题目:Gene–environment correlations across geographic regions affect genome-wide association studies (跨地理区域的基因-环境相关性会影响全基因组关联研究)
期刊:Nature genetics
影响因子:2021_IF=41.307; 中科大类: 生物1区; 中科小类: GENETICS & HEREDITY遗传学:1区;JCR分区: Q1
发文单位:荷兰阿姆斯特丹大学和阿姆斯特丹自由大学。
文章作者:荷兰阿姆斯特丹大学Abdel Abdellaoui为第一作者兼通讯作者。
摘要:基因-环境相关性影响全基因组关联研究(GWASs)中遗传变异和复杂性状之间的关联。该研究中作者在多达43516名英国兄弟姐妹中研究显示,教育程度多基因分数反映了基因与环境之间的相关性,并且移民将这些基因与环境的相关性从家庭扩展到更广泛的地理区域。然后,作者对254387名英国人的56个复杂特征进行了GWASs测试。控制地理区域显著降低了社会经济地位(SES)相关特征的遗传力,尤其是教育程度和收入。对于大多数性状,控制区域显著降低了与教育程度和收入的遗传相关性,最显著的是体重指数/体脂、久坐行为和物质使用,与区域社会经济差异相关的基因-环境相关性一致。控制出生地和当前住址的影响表明,基因-环境相关性既有被动来源,也有主动来源。该研究结果表明,DNA和SES的地理聚类引入了影响GWAS结果的基因-环境相关性。
主要结果:
1、兄弟姐妹的多基因得分
在存在基因-环境相关性的情况下,多基因得分可以预测性状的遗传和环境影响。这项研究是在12-21岁的儿童和青少年中进行的,其中大部分基因-环境相关性源自他们出生和成长的家庭(共享)环境,即被动基因-环境关联。在这项研究中,作者对22675对40-70岁的成年兄弟姐妹进行了类似的分析。同时作者拓展了分析,以调查跨地理区域的基因-环境相关性是否会导致预测能力的提高,并测试这是否受到主动的基因-环境相关的影响。 例如,当教育程度多基因得分较高的成年人比其教育程度低多基因得分的兄弟姐妹更有可能迁移到更有利的区域时,可能会出现积极的基因-环境相关性(图1)。本研究通过将出生地或当前地址的纬度和经度坐标(1-km分辨率)映射到地方当局区域或MSOA区域,获得地理区域(图1)。
图1. 基因-环境相关性示意图(rGE)。底部的地理区域是兄弟姐妹的出生地,他们成年后迁移到顶部的两个不同区域;多基因得分较高的兄弟姐妹迁移到左上角,环境影响更健康。当父母提供的环境(底部)与可遗传性状相关时,会出现被动基因-环境相关性,而当可遗传行为(例如,从底部到顶部的迁移)导致多基因效应和环境因素之间的相关性时,会发生主动基因-环境相关。
GWASs在教育程度和收入方面最能捕捉社会经济地位(SES)相关信号。通过拟合五个模型,作者测试了家庭水平和跨地理区域的基因-环境相关性:模型1包括作为预测因子的个体水平的多基因得分;模型2包括家庭内和家庭间的多基因得分作为预测因子;模型3包括区域内和区域间水平的多基因得分作为预测因子;模型4包括家庭内(区域内)、家庭间(区域内)和区域间水平的多基因得分作为预测因子;在模型5中,作者将家族内多基因得分分解为区域内和区域间效应,以测试主动的基因-环境相关性。区域是基于当前地址的中间层超级输出区(MSOA)区域(图2)。在跨地理区域的家庭层面以外存在基因-环境相关性的一个重要指标是,模型4中的家庭内效应弱于模型2,因为这意味着在个体层面而非家庭层面上捕获的部分效应是由于跨地理区域基因-环境相关。在该研究中共有254557名受试者的出生地和当前地址都有地理区域(图2)。
图2. 评估中心、地方当局和中间层超级输出区域(MSOA)。下面两张地图显示了GWASs中分析的参与者的出生地和当前地址。直方图显示了这些参与者在评估中心和出生地和当前地址的地理区域的分布。
作者将五个模型拟合到56个复杂性状的数据。10个性状中,在具有家族间效应的模型中加入区域间效应后,多基因得分的个体水平效应变得明显较弱(图3a)。将区域间效应添加到家庭间效应后,六个性状的R2增加大于2%(图3b)。当比较模型4内的固定效应估计时,大多数性状显示区域间效应高于家庭间效应(图3c),这意味着在个体或家庭层面上未捕获的地理区域的额外解释力。将家族内效应分解为区域内效应和区域间效应(模型5)后,大多数性状的区域间效应高于区域内效应(图3d),这意味着广泛的主动的基因-环境相关性。
图3.56个复杂性状的兄弟姐妹教育程度多基因得分分析结果。 a、模型2的效应内估计与模型4的效应内估算的比较。显示了显著下降的10个性状的性状名称。b、比较模型2和4的边际R2(即,由所有固定效应(包括年龄和性别)解释的方差)。c、模型4的家庭间效应和区域间效应估计的比较。d、模型5的区域内效应和区域间效应估计的比较。
2、受地理控制的GWASs
作者对254387名欧洲血统参与者的56个复杂性状进行了线性混合模型GWAS。在不控制地理区域的情况下,56个性状的基于SNP的遗传力在0.02到0.41之间(使用基于约120万个SNP的连锁不平衡(LD)得分回归估计),其中物理性状的遗传力估计值高于行为性状(图4)。每个类别基于SNP的平均遗传力如下:拟人,0.22;心血管疾病,0.17;认知和SES,0.10;抑郁,0.06;身体健康,0.07;复制,0.10;睡眠,0.07;社会性,0.05;物质使用0.05,其他行为0.05。图4和图5显示了控制地理区域后基于SNP的遗传力的变化。对于大多数性状,控制区域显著降低了与教育程度和收入的遗传相关性,最明显的是体重指数/体脂、久坐行为和物质使用,这与区域社会经济差异相关的基因-环境相关性一致。出生地和当前生活区域的影响表明基因-环境相关性的被动和主动来源。
图4、按地理区域校正和未校正的56个复杂性状基于SNP的遗传率。面板显示了根据出生地和/或当前地址控制地方当局或MSOA区域后估计的基于SNP的遗传率。误差条表示95%的置信区间。
图5、控制56个复杂性状的地理区域后基于SNP遗传力的下降率。通过将校正的基于SNP的遗传力估计值除以未校正的基于单核苷酸多态性的遗传力估算值来计算下降率。误差条表示95%的置信区间。
与社会经济成功相关的基因可以影响人们能够负担得起的社区,从而影响人们生活环境的质量。不同社区和地区的环境暴露会影响广泛的身心健康结果,这导致与社会经济成功相关的基因也与这些身心健康结果相关。作者研究了控制区域差异是否会降低与社会经济地位(SES)的遗传相关性。使用LD得分回归和∼120万个SNP,计算了56个复杂性状与教育程度和家庭收入的遗传相关性。图6显示了遗传相关性的变化及其意义。控制地方当局或MSOA区域显著降低了56个复杂性状中大多数与教育和收入之间的遗传相关性(图6)。研究表明在联合控制出生地和当前地址以及较小的MSOA区域时,下降幅度最大且最强。
图6、绝对遗传相关性的变化与教育程度(EA,顶部)和家庭收入(HI,底部)有关。通过LD评分回归计算遗传相关性。绝对遗传相关性的变化显示了遗传关系强度与教育程度或家庭收入的变化。
总之,该研究结果表明,DNA和SES的地理聚类引入了影响GWAS结果的基因-环境相关性,同时作者展示了如何显著减少GWAS信号中的这些影响。该研究目的在于揭示遗传变异和复杂性状之间的关联。
文中所有图片均来自Gene–environment correlations across geographic regions affect genome-wide association studies
文中有表述不当的地方,是我的问题,请在后台与小编联系修改,也可以自行阅读原文,谢谢理解与支持。如有团体或个人认为本文侵犯您的权利,请及时联系小编删除。
文章链接地址:https://www.nature.com/articles/s41588-022-01158-0
参考文献:
Abdellaoui, A., Dolan, C.V., Verweij, K.J.H. et al. Gene–environment correlations across geographic regions affect genome-wide association studies. Nat Genet (2022). https://doi.org/10.1038/s41588-022-01158-0