●英文题目《Whole-genome resequencing reveals world-wide ancestry and adaptive introgression events of domesticated cattle in East Asia》
●期刊:Nature Communications
●影响因子:2022_IF=17.694;中科大类: 综合性期刊1区; 中科小类: 综合性期刊1区; JCR分区: Q1
●发文单位:西北农林科技大学
●文章作者:西北农林科技大学陈宁博为文章第一作者;西北农林科技大学姜雨、雷初朝为文章共同通讯作者
摘要:牛的驯化和东亚牛品种的复杂历史值得进一步研究。通过对49个现代品种和8个东亚古代样本的基因组分析,根据Y染色体单倍型和常染色体变异,将世界各地的牛大致分为5个大陆群体。我们发现东亚牛种群主要由三个不同的祖先组成,包括早期的至少~ 3900年前东亚普通牛(taurine)血统到达中国,后来引入欧亚普通牛血统,和一个新的中国瘤牛(indicine)血统在约36600-49600年前与印度瘤牛分化。我们还报道了来自中国南方和青藏高原的家牛通过获得班腾和牦牛的基因组,分别获得~ 2.93%和~1.22%的基因组来实现快速适应。我们的发现为牛的进化历史和渐渗在东亚牛适应新环境挑战中的重要性提供了新的见解。
前言:将野生原牛 (Bos primigenius) 驯化为牛是新石器时代最重要的成就之一。通过为耕作和运输提供肉类、皮革和劳动力,牛成为东亚农业社会最重要的牲畜。今天,牛仍然是东亚重要的驯养动物资源。在中国,有 53 个品种约 1 亿头本土牛。现代牛品种可能起源于距今约 10,000 年以前的对不同地理区域的野生原牛的多次驯化事件。近东和印度河流域的两个主要驯化中心分别培育出了普通牛 (Bos taurus) 和瘤牛 (Bos indicus)。一般来说,与普通牛品种相比,瘤牛可以承受高温。基于基因组SNP 数据的种群分析揭示了三大类牛,分别为亚洲瘤牛、欧亚普通牛和非洲普通牛,并恢复了牛从其起源中心到世界各地的历史迁徙路线。然而,尚未对东亚牛的全基因组多样性进行深入研究。
虽然已经推断出几个本土驯化事件,但父系和母系谱系分析与东亚家养牛与其他普通牛和瘤牛背景起源一致。考古证据表明,B. taurus 可能在新石器时代晚期(距今约5000 到 4000之间)从西亚传入东亚,而 B. indicus 可能在之后从印度次大陆扩散到东亚, 时间大约为3500 到 2500年前,这导致了华中地区普通牛和瘤牛的杂交。基于基因组 SNP 芯片数据,先前的研究提供了 Bos 属内渗入的证据,例如 Bos javanicus(banteng)渗入中国海南牛以及牛渗入东亚的蒙古牦牛。所有这些事件都促成了东亚牛的复杂历史。
在这里,我们分析了 260 头现代牛和 8 头古代牛的基因组,目的是追踪祖先成分并恢复形成该地区目前观察到的东亚牛多样性的历史迁徙和基因渗入过程。
结果:
1、基于常染色体SNP的群体遗传结构
2、父系和母系系统发育分析
Y染色体和线粒体DNA (mtDNA) 单倍型在史前牲畜的研究中都代表着非常重要的关注点。这里,在质量控制和过滤之后,我们使用Y染色体18上的X-简并区域中的745个SNP来构建单倍型网络 (图3a) 和单倍型树。与使用多个基因座的早期分析相似,出现了三个常见的Y单倍群 (普通牛的Y1和Y2,瘤牛的Y3)。此外,在Y2 (Y2a和Y2b) 和Y3 (Y3a和Y3b) 单倍组中的每个单倍组中解析了两个不同的亚组。在欧洲品种中发现了三个普通牛单倍群。亚组Y2a在东亚的中国西北品种 (哈萨克,蒙古和柴达木) 中共享,而亚组Y2b在青藏高原和东北亚的牛中占主导地位。Y3 单倍群是 B. indicus 特有的。亚单倍群 Y3a 在中国南方的牛中占主导地位,而亚单倍型 Y3b 主要由三个印度的 B. indicus 品种携带 (图3a)。中国中北部为Y2a,Y2b和Y3a混合的品种 (图2c和3a)。
我们还使用完整的线粒体推断了母系谱系。现代普通牛表现出T单倍群和其他几个次要单倍群 (Q,P和R),而瘤牛仅携带I单倍群。组装的147个线粒体的覆盖率 >100倍,包括107头中国牛、12头非洲牛、11头欧洲牛、7头伊朗牛、6头韩国牛和4头瘤牛,与比对到24个线粒体参考基因组。系统发育分析表明,除韩国Hanwoo (属于欧洲野牛典型的P单倍群) 和2头藏牛 (携带牦牛单倍群) 外,所有东亚牛普通牛均以T单倍群为特征 (图3b),建议将欧洲野牛和牦牛母系归入东亚牛中。普通牛线粒体基因组单倍群的分布与先前的研究一致。东亚普通牛主要属于T3和T2单倍群,中东牛属于T2单倍群,非洲牛属于T1单倍群,只有1个藏族个体属于T4单倍群。在 B. indicus 谱系中,中国瘤牛主要属于I1a,I1内的一个新的亚单倍群 (图3c),以星形的方式发散,表明其种群从单个原始序列迅速膨胀。
3、东亚牛的古代变异和连续迁徙
DNA成功地从中国北方新石器时代晚期石峁遗址 (~ 3975-3835年) 发掘的化石牛标本中提取 (图1a)。获得了八只古代牛的低覆盖度基因组序列 ( 覆盖度范围从0.01 × 至2.63 ×)。为了研究石峁标本与当今东亚牛的关系,我们基于使用 ADMIXTURE 的遗传结构分析和使用 outgroup-f3 统计的系统发育分析选择了 “核心” 组。NJ树揭示了古代样本对韩国 Hanwoo 和日本牛的亲和力最接近 (图4a)。outgroup-f3 统计和 D 统计还证实,古代牛分别与东北亚牛和日本牛共享最衍生的多态性 (图4b)。在分离后藏牛可能会受到更强的漂变,这改变了它们的 outgroup-f3 值 (图4b)。结合父系谱系的分布 (图2c和3a),这一发现表明,东亚普通牛在历史上可能发生了两个迁移阶段。我们推测,最早的牛群 (东亚普通牛) 可能在约3900年之前引入,而第二次迁徙事件导致了在中国中部地区流行的外来渗入 (欧亚普通牛)。
4、B. javanicus(爪洼野牛)对中国瘤牛的渗入
中国瘤牛基因组与印度瘤牛牛的基因组分开聚集,在所有地理群体中显示出最高的核苷酸多样性 (图4c)。有趣的是,总共发现了12,696,752个 snp 在中国瘤牛中是特异性的,并且该值比任何其他牛群的 SNPs 高900万以上 (图4d)。这种显著的独特多样性可能会受到特定 (但未知) 的群体演化历史 (例如人口扩张) 的影响,但是这种独特多样性的规模表明来自不同牛品种的杂交或渗入。因此,我们使用了七个 Bovini 物种的全基因组重测序数据来确定中国瘤牛特异性 snp 的祖先状态(来源)。比较表明,中国瘤牛和爪哇野牛共享最多的等位基因 (〜 4.7 M SNPs),其次是普通牛和 Bos frontalis (gayal白肢野牛),表明中国瘤牛在历史上发生的种间渗入。因此,我们使用了包括 f3 统计,D 统计和 Treemix 在内的分析组合测试一下这种渗入假设。我们以中国瘤牛为目标 (混合种群),以印度瘤牛和其他Bovini 物种为来源种群,进行了 f3 统计分析。我们使用爪洼野牛和印度瘤牛作为来源进行测试,Z = -26.97,这是一个非常重要的值。根据拓扑树 (水牛,中国瘤牛; B. javanicus,其他 Bovini 物种) 进行统计检验,结果表明中国瘤牛可能有 B. javanicus 的渗入,产生高度显着的Zscore = -51.54。Treemix还证实了从爪哇牛到中国瘤牛的基因流 。用于分析蒙古牦牛内的渐渗杂交的相同方法被用来进一步评估爪哇野牛向中国瘤牛基因组的渐渗 (图5a,b)。
5、牦牛对西藏普通牛的渗入
西藏普通牛中牦牛 mtDNA 的存在以及 Treemix、f3 统计和 D 统计分析的结果表明类似的牦牛基因渗入(图 3b)。推断为牦牛血统的九头西藏普通牛的基因组比例在0.05% - 2.94% 之间。估计的基因渗入时间约为 1.9 千年(1.4 至 2.4千年,95% 置信区间)。我们利用了 2395 个基因渗入区间的基因,这些区间至少含有西藏牛普通牛的两种单倍型。显着渗入基因富集的功能类别主要包括嗅觉感官 (GO:0007608)、L-鸟氨酸跨膜转运 (GO:1903352)(Bonferroni 校正 P < 0.01)。 KEGG 显示最大的基因渗入组与抗病性有关(bta05323,移植物抗宿主病)(Bonferroni 校正的 P < 0.01)。在基因渗入区域共检测到 392 个错义突变。在这些基因中,我们检测到 IL-37,一种先天免疫的基本抑制剂,它可能在肠道炎症期间发挥抗炎作用(图 5c、f、i)。此外,我们在渗入区域检索了几个缺氧基因,这些基因可能有助于藏牛适应缺氧环境。这些包括 COPS5、IL1A、IL1B、MMP3 和 EGLN1,用于缺氧诱导因子途径,这些途径已在安第斯山脉、西藏牛和牦牛的高海拔适应性选择中反复鉴定。我们还观察到两个基因,RYR2 和 SDHD,参与介导调节缺氧反应的钙稳态。
6、东亚牛群体演化历史
多重顺序马尔可夫聚结 (MSMC) 方法使用 g= 6 的世代时间和每代的突变率μg = 1.26 × 10-8 用于重建五个“核心”牛群的种群历史。我们将此方法应用于所有牛群,每个牛群都有两个深度覆盖 (>15×) 个体。为了评估基因渗入对有效种群规模 (Ne) 和分化时间估计的影响,我们使用相同的数据重复 MSMC 分析,但排除了从野牛到两只中国瘤牛 (~3.5%) 或从牦牛到两只西藏牛普通牛的渗入区域 (~1.3 %)。结果表明,有限的基因渗入并未显着改变分化时间和 Ne 的估计值。
对于普通牛和瘤牛,在20-30 千年时发现 Ne 的共同急剧下降,这可能反映了最后一次冰川最大值(图6a) 结束时的主要气候变化早于牛的驯化。我们还观察到在7-9千年期间 Ne 的下降与驯化的开始一致 (图6a)。然后,我们使用 MSMC 来计算本研究中定义的五个“核心”牛群之间的分化时间。我们计算出 B. taurus 和 B. indicus 之间的交叉溯祖率【交叉溯祖率的值在0-1之间,越接近1代表两群体此时还是一个群体,rCCR跌倒0就代表两群体完全分化成为两个独立的群体。因此,rCCR的中点(rCCR=0.5)就被看作是两群体的分化时间。】在大约 201 至 213 千年时降低至 0.5(图 6b)。