大家好,本周给大家分享的是一篇2020年6月2日发表在Cell Host and Microbe上使用比较基因组学解析毛螺菌科分离株之间的功能和基因组变异并揭示其种间和种内的物种多样性的文章。
文章题目: Functional and Genomic Variation between Human-Derived Isolates of Lachnospiraceae Reveals Inter- and Intra-Species Diversity (人源毛螺菌科分离株之间的功能和基因组变异揭示了种间和种内的物种多样性)
期刊: Cell Host and Microbe
影响因子: 2020_IF = 15.923 ; 中科大类: 生物 1区; 中科小类: 微生物学 1区, 寄生虫学 1区, 病毒学 1区; JCR分区: Q1
发文单位:芝加哥大学
文章作者:Matthew T.Sorbara为第一作者,Eric G.Pamer为通讯作者。
摘要:在健康人体内,属于毛螺菌科的细菌是微生物群中数量丰富的专性厌氧成员。毛螺菌科通过产生短链脂肪酸,将初级胆汁酸转化为次级胆汁酸,并促进对肠道病原体的定植抗性,从而影响宿主。 为了加深对该科成员基因组和功能多样性的了解,本文作者从人类粪便中培养了来自Lachnospiraceae 11属27种的273株分离株,并进行了全基因组测序和基因注释。 该分析揭示了可能影响分离株影响宿主健康能力的途径中物种间和物种内的大量多样性。 这些差异可能通过抗生素表达或肠道酸化影响定殖抗性,通过丁酸盐的产生影响宿主粘膜免疫细胞和肠细胞,或通过异质性多糖代谢促进联合治疗内的协同作用。 这些特定功能的识别可以促进益生菌群的发展,驱动和/或恢复体内微生物组的功能。
主要结果:
1、毛螺菌科分离株的鉴定
作者对20个志愿者的粪便样本分别进行培养和测序。对粪便样本的宏基因组分析表明,毛螺菌科在所有志愿者中都丰富,平均丰度为23.4%(图1)。通过培养,获得了956个分离株。分离株是采用BLAST技术对宏基因组序列组装而成的16S rRNA基因序列进行分类。分离出志愿者中具有代表性的65%属 (图1),以及通过对粪便进行宏基因组测序检测到的属于毛螺菌科的所有属。基于16S rRNA序列分析,共鉴定出27种毛螺菌科273株分离株。
图1.人类志愿者共生菌株生物库的建立。上图宏基因组测序确定了人类志愿者粪便样品中细菌属水平的相对丰度,在下图中显示了未恢复的属。
2、毛螺菌科的系统发育
作者在毛螺菌科系统发育树上发现其分离株与同样属于梭菌目的瘤胃菌科或梭菌科的代表株不同,且活泼瘤胃球菌分离株被定位在毛螺菌科内(图2A)。还看了毛螺菌科分离株的全基因组GC含量,得出毛螺菌科的GC含量范围很广,并且特定种的分离株具有特征的GC含量,一个属内的分离株具有相似的GC含量(图2B)。
图2.来自人类志愿者的毛螺菌科分离株的系统发育研究(A) 基于16SrRNA基因序列构建系统发育树(B) 毛螺菌科分离株基因组的GC含量
3、分离株核心基因组的多样性
作者通过prokka进行基因注释,发现其基因组中只有50%的基因被注释。且在科水平上只存在397个核心基因,表明物种间的遗传多样性(图3)。将注释基因的功能映射到KEGG通路,发现不同分类水平的分离株之间共享的大多数基因都与新陈代谢有关,但不同分类水平的分离菌株所共享的代谢途径的类型是不同的(图3)。
图3。Lachnospiraceae分离株核心基因组的比较确定了分离株之间的多样性(A)绘制不同分类水平分离株共享的核心基因(注释蛋白和假定蛋白)数量。 (B)不同类别的编码序列的比例,根据注释的类型,成为在不同分类水平的分离株的子集共享。 (C)被分配到不同水平KEGG通路的基因的比例,成为在不同分类水平的分离株的子集共享。 (D)按科、属或种分组的分离株的子集共享到特定KEGG通路的基因百分比。
-
毛螺菌科分离株的遗传图谱
作者还分析了单个分离株的遗传图谱模式。通过 UMAP对所有毛螺菌科中是否存在注释的基因和蛋白质簇进行分析,结果表明,分离株根据其整个基因组形成了不同的簇。在大多数情况下,聚集的分离株只包含一个物种,而在极少数情况下,不能根据它们的遗传图谱区分两个物种。毛螺菌科是一种可以产生SCFAs的发酵共生菌,从而有助于近端结肠和盲肠内腔的正常适度酸化。酸化培养基的能力如何分布在毛螺菌科分离株中?在UMAP上,超高酸化与 UMAP 位置相对应,并且沿 UMAP 的两个轴的组合变化。SCFA丁酸盐对宿主粘膜免疫系统细胞具有重要的调节功能,在接受移植的患者中,编码丁酸合成途径的共生物种定殖与抗病毒感染有关。因此,作者检测了毛螺菌科分离株乙酰coa产丁酸盐的基因分布,在90/273株菌株中鉴定了乙酰coa产生丁酸的完整通路。在UMAP全基因组分析中,与单个物种相对应的具有乙酰辅酶A生产丁酸完整途径的分离株出现在不同的簇中。
图4.通过对单个分离株遗传库的分析,可以确定相关分离株的聚类。(A)Lachnospiraceae中存在或不存在独特编码序列(注释蛋白或未注释蛋白簇)的UMAP分析图。 (B) UMAP分析(来自A)显示单独分离株生长48小时后酸化。 (C)在乙酰辅酶a转化为丁酸盐的途径中分离出一套完整的基因。
-
核心基因组的序列变异性及评估16S rRNA相关性作为全基因组遗传图谱的象征
作者还看了毛螺菌科核心基因组的基因是否存在序列变异,以及这种变异是否与基于16S rRNA序列的种水平鉴定相一致。对每个注释的科水平的核心基因的蛋白质序列进行了比对,并将得到的多个序列连接成一个大的蛋白质序列(图5A)。然后,对连接的大序列进行比对,生成系统发育树。该分析表明,来自相同16S rRNA定义的种的分离株也通过其核心基因组的序列变异性而相互关联,且分离株之间的总体关系与16S rRNA衍生的系统发育关系一致(图5)。通过对全基因组编码序列的UMAP分析,来自相关类群的分离株(基于16S rRNA)倾向于定位在一起。为了进一步研究这一点,作者想看16S rRNA来源的系统发生树中的分离株之间距离是否与分离株之间的全基因组来源距离相关。结果表明,在37128个两两比较中,16S rRNA衍生距离与全基因组衍生距离呈显著正相关(r = 0.52)。虽然总体上存在正相关,但该分析表明,有一对分离株的全基因组距离比例高于或低于它们的16 s距离。但基于16S rRNA的亲缘关系可反映全基因组水平的遗传差异。
-
种内多样性
在某些情况下,单个物种的分离株形成多个不同的簇。为了直接检验种内基因组多样性,使用UMAP分析仅限于注释的或未注释的蛋白质编码基因的聚类。结果表明毛螺菌科某些物种的全基因组存在显著的多样性(图6A)。接下来,作者研究了在Blautia wexlerae 和活泼瘤胃球菌中,是哪些基因将一个物种的分离株分离成不同的簇。比较了Blautia wexlerae或活泼瘤胃球菌的核心基因组,并在单个簇中识别出仅是核心基因组的一部分的基因。分析发现,在Blautia wexlerae和活泼瘤胃球菌簇的核心基因组中分别存在1041和1603个差异编码序列。对这些差异表达基因进行检测发现,所有B簇的Blautia wexlerae分离株均编码一些利用纤维二糖的基因,而所有A簇分离株均编码利用L-半乳糖的基因。类似的地,活泼瘤胃球菌的A簇分离株共享不属于B或C簇核心基因组的乳糖代谢相关基因。这些结果表明,同一物种的分离株在碳水化合物利用能力上存在差异。另外,已经确定了几种可能的机制,有助于活泼瘤胃球菌与CD和炎症的关联,包括由一个30kb操纵子编码的基因产生促炎症多糖。为了确定该操纵子是否均匀分布于活泼瘤胃球菌的分离株和簇中,作者将从全基因组中读取的信息映射到已报道的操纵子。在分离株中发现了三种不同的生物合成操纵子覆盖模式,这表明活泼瘤胃球菌簇中产生这种促炎症性多糖的能力可能不同。同种不同菌株在基因组序列及碳源利用、产酸水平等方面存在差异,表明种内的遗传多样性。
该研究通过粪便样本的宏基因组测序和共生菌株基因组组装揭示了健康人群中细菌类群的显著多样性,并在一定程度上揭示了细菌种群之间和内部的基因组差异。总的来说,了解单个分类群(如毛螺菌科)内分离株之间的变异程度和类型,将是组装有效菌群的关键。