A chromosome-level genome assembly of Cydia pomonella provides insights into chemical ecology and insecticide resistance
今天的这篇文章是最近蛾类基因组文章中做的比较全面的一篇,值得反复阅读。这篇文章的通讯作者是浙江大学的李飞教授,涉及到的单位很多,其中我的博士后师兄 Rui Tang也参与到其中。
Abstract
苹果蠹蛾是危害仁果类的主要害虫,在过去的半个多世纪分布在世界各地。通过三代与二代测序技术的结合,产生了染色体级别的苹果蠹蛾基因组,并得到Z染色体和一部分W染色体(ZW:雌性)。通过对嗅觉受体OR3的研究,发现OR3有明显的复制现象,这揭示了其为寻找配偶和寄主植物而去探寻种间激素和种内性信息素的特征。通过GWAS分析证实杀虫剂抗性和易感品系存在上百个SNP位点,其中包括在CYP6B2的启动子区域的三个SNP。RNAi干扰掉CYP6B2后导致苹果蠹蛾对deltamethrin and azinphos methyl这两种杀虫剂的敏感性增加。
Background
苹果蠹蛾属于鳞翅目卷蛾科昆虫,主要危害苹果,梨和核桃。它在六大洲都有分布,但它明确的地理起源却不清楚。由于它强大的破坏力,超过20个国家建立了对它的隔离区。
什么因素导致其在新的环境中快速繁殖以及形成高的抗药性,为了去解决这些问题,科研人员采用Illumina和PacBio测序技术的结合再通过BioNano和Hi-C去辅助scaffold组装。
Results
Chromosome-length scaffold assembly of the codling moth.
DNA测序取样为42头雌性成虫,构建了四个PE文库,三个MP(mate-paired)文库。移除低质量reads后共产生245.5Gb的clean data,测序深度为390x(kmer分析以及流式细胞分析后的预估基因组大小为630Mb),之后构建8个PacBio RSⅡ文库,共测序38个cell产生54.6Gb数据,基因组测序深度为86x。
通过上述测序手段共获得2221个contigs(682.49Mb),contigN50为862kb,通过BioNano光学图谱矫正后,共产生1717个scaffolds(772.89Mb),scaffoldN50为8.9Mb,Hi-C交联图谱将1108个scaffolds锚定,排序,定位到29条染色体上(27常染色体,Z以及W染色体),超过97%的组装碱基定位到染色体上。
由于Hi-C构建染色体之后scaffolds间出现大量gaps,这可能由于基因组杂合度高导致的,所以他们构建了两个版本的scaffolds:(1) PacBio scaffolds followed by Hi-C scaffolding and (2) super scaffolds combining PacBio assembly, BioNano improvement, and Hi-C scaffolding。结果表明这两个方法产生的scaffolds有极高的共线性。为了评估基因组的完整性,他们将组装好的super-scaffolds做BUSCO评价,得到了98.5%的直系同源基因。为了进一步验证基因组组装质量,Nanapore基因组DNA测序得到71Gb的数据,超过99%的reads都比对到了组装好的scaffolds上。另外,PacBio全长转录组得到了超过1500个有完整ORF的一致性转录本,超过93%的转录本比对到了组装好的基因组上。其次,通过与染色体级别的斜纹夜蛾基因组做共线性分析表明两者的染色体连锁与基因方向呈现高度的保守性。
Genome annotation
共获得1,692,215个重复序列长度为341.5Mb占基因组大小的42.87%,通过Optimized Maker-based Insect Genome Annotation(OMIGA)流程注释到了16,997个蛋白编码基因(整合了28个相关RNA-seq样本的表达证据)。进一步的人工注释有关昆虫适应性的基因家族,包括嗅觉受体,味觉受体,离子型通道受体,气味结合蛋白,化学感受蛋白,细胞色素P450,ATP结合盒式转运蛋白,羧酸酯酶,谷胱甘肽转移酶,乙酰胆碱受体,乙酰胆碱酯酶,电压门控钠离子通道。85 olfactory receptors (ORs), 65 gustatory receptors, 39 ionotropic receptors, 50 odorant-binding proteins, 28 chemosensory proteins, 136 cytochrome P450s, 47 ATP binding cassette transporters (ABC transporters), 73 carboxylesterase, 30 glutathione S-transferase, nine nicotinic acetylcholine receptor, two acetylcholinesterase, and one voltage gated sodium channel。经过去冗余之后共获得17,184个蛋白编码基因,其中4727个基因与其他三种鳞翅目昆虫有同源基因对。
The Venn diagram indicates the numbers of treefam annotation families shared among the four Lepidoptera, C. pomonella, Bombyx mori, Spodoptera litura, and Trichoplusia ni. Each gene was blasted with the treefam database with the E-value 1e−5 and the best hit treefam annotation was selected.
通过小RNA测序,得到 small nucleolar RNAs by Infernal and 137,752 Piwi interacting RNA by Piano,14, 2435 transfer RNAs (tRNA) using tRNAscan-SE,15, 334 ribosomal RNAs (rRNA) using RNAmmer, and 217 microRNAs (miRNA) using miRDeep2 with sequencing data from a small RNA library。
通过OrthoMCL鉴定苹果蠹蛾与其他19种昆虫的直系同源基因((Lepidoptera, Diptera, Coleoptera, Hymenoptera, Hemiptera,Isoptera, and Orthoptera),物种进化树与分歧时间估计使用Gblocks将500个直系同源基因(452,467个aa),串联到一起。
The phylogeny was inferred from 500 strict single-copy genes with 59,621 reliable sites by RAxML maximum likelihood methods employing LG+ G model and 100 bootstrap replicates. All nodes received bootstrap support= 100. Divergences were estimated by the PhyloBayes Bayesian method using a relaxed clock with nodes calibration (Supplementary Materials): mean age is given for each note with gray bars indicating 95% posterior densities. Bars giving gene counts are subdivided to represent classes of orthology. 1:1:1 indicates universal single-copy genes, duplication in a single genome and absence less than two moth species. N:N:N indicates other universal genes. SD species-specific duplicated genes, ND species-specific genes. Others indicates all other orthologous groups.
Synteny, karyotype evolution, and sex chromosomes.
以前的细胞遗传学分析表明,苹果蠹蛾由27条常染色体,W染色体以及neo-Z染色体(Z染色体与家蚕15号染色体的同源常染色体的融合),以及另外两个融合事件,chr2 (fusion of Chr5 and Chr22 of S. litura) and chr3 (fusion
of Chr7 and Chr8 of S. litura),这都在与斜纹夜蛾染色体共线性分析中得到证实,这三起染色体融合事件导致了苹果蠹蛾的 n=28 的染色体核型。
通过重测序三头雌蛾和三头雄蛾,得到了scaffolds间雌雄性别的测序深度差异,确认了组装结果中Z染色体和一部分常染色体的存在,常染色体在雌雄个体的覆盖深度的比例为1:1,chr1雄性为雌性的两倍,即为Z染色体,chr29呈现明显的偏雌覆盖比率,为W染色体,而W染色体在不同雌雄个体间的覆盖深度比例变化较大,这可能反应W染色体上存在很多的转座子(TE),这些转座子与基因组的其他位置的TEs有同源区段。
b Male:female coverage ratios for each scaffold, plotted by scaffold length. Each point represents a single scaffold. The solid gray line is the theoretical expectation for autosomes and the dotted blue line shows the expectation for the Z chromosome. c Male:female coverage ratios plotted in 500 bp windows across scaffolds for Z, W, and a representative autosome (Chr 2). Line colors as described in (b).
以前的细胞遗传学实验表明Z和W染色体有很少的序列同源性,表明neo-Z染色体的缺失或退化。而ZW染色体共线性分析也支持了这种结果,然而细胞遗传学实验表明ZW染色体大小类似,而chr29大小仅为chr1的1/10,表明chr29仅为W染色体的一部分,而未组装上的neo-W染色体可能与neo-Z染色体存在同源区段。
通过进一步分析chr29与其他基因组区域的序列特征,chr29属于gene-poor and repeat-rich,几乎没有蛋白编码表达,只有大量的TEs。A de novo clustering analysis of sex-specific sequencing data identified at least two repeats that were significantly enriched in females, and presumably W-linked.
OR3 duplication enhances the ability to locate food and mates.
在昆虫中,化学感受系统调控其取食,寻找栖息地,寻找配偶,以及定位产卵位置等行为。研究表明,雌雄蠹蛾都可以被梨酯所吸引,而雄蛾则被雌蛾所产生的性信息素组分苹果小卷蛾性诱剂所特异性吸引。然而这两种化合物在雄蛾中的协同机制还不清楚。有研究表明触角上OR3基因的蛋白产物梨酯,可以感受基因组注释到了85个OR,进化分析表明PR枝出现扩张,并且OR3基因出现复制现象,形成CpomOR3a and CpomOR3b,这两个基因具有相同的基因长度,基因结构也相同,基因间区为9812nt。为了确认OR3是否存在复制现象,对所有重测序的个体进行鉴定。
为了确定OR3基因复制是否会增强蠹蛾感受梨酯的能力,首先,通过RT-PCR,确认这两个基因的表达,然后计算来自24个不同组织的RNA-seq数据中CpomOR3a and CpomOR3b的表达量(FPKM),CpomOR3b只表达在成虫触角,而CpomOR3a 表达在成虫触角,成虫头,以及幼虫头部。原位杂交实验表明,CpomOR3a and CpomOR3b表达在同一感器中的邻近神经元中,这些结果表明,CpomOR3a and CpomOR3b有不同的表达谱,可能有不同的功能。
由于OR3a已经报道可以感受梨酯,那OR3b(与OR3a相似性为89%)则可能会增强其敏感性。通过将两个受体与CpomORco的共注射非洲爪蟾卵母细胞,并用双电极电压钳记录其对梨酯或其他化合物的反应。结果表明CpomOR3a and CpomOR3b对梨酯和苹果小卷蛾性诱剂有电生理反应。
然后,通过RNA-i分别干扰掉这两个OR,qPCR验证其干扰效果。结果表明两个受体间没有相互影响。注射虫蛹后的72h以后,对成虫触角做触角电生理,electroantennography (EAG).结果表明,雄蛾对这两种化合物的反应在所有处理组中都下降了,而雌蛾只有当这两个受体同时干扰掉才会降低对梨酯的反应。
在Y型管行为实验中,同时干扰掉CpomOR3a and CpomOR3b可以显著降低雌雄蛾对梨酯的trace,而单干扰掉CpomOR3b就可以降低雄蛾对性信息素的trace能力。
Step 1: female adults locate fruits and find mating sites on leaves. Step 2: male adults locate fruits as potential mating sites from a long distance. Step 3: male adults locate females in a close distance via codlemone sensing process. Steps 4 and 5: oviposition of females and food location of newly hatched larvae via OR3a detection of pear ester.
GWAS identifies SNPs associated with insecticide resistance
在苹果蠹蛾中杀虫剂抗性主要依赖于解毒酶活性的增加以及降低靶蛋白对杀虫剂的敏感性。对于解毒酶的研究主要集中于P450,P450的水解能力与昆虫的抗杀虫剂的化学谱相关。在蠹蛾中共发现146个P450基因,形成16个基因簇。高数量的P450基因意味着苹果蠹蛾对植物次生代谢物以及合成杀虫剂的抵御能力很强。
为了鉴定杀虫剂抗性的遗传变化,从三个不同品系的蠹蛾种群中重测序6只个体,S品系对杀虫剂敏感,Raz品系对甲基谷硫磷有抗性,Rv品系对溴氰菊酯存在抗性。
6个个体随机从每个品系中抽取,重测序得到472.6Gb的数据,基因组覆盖度大约40x,通过基因组的关联分析鉴定有杀虫剂抗性相关的SNPs位点,S与Raz相比存在109个SNPs(非同义替换和同义替换),而S与Rv比较得到242个SNPs位点。
在Raz和Rv品系中共有的为18个SNPs,这些中的11个位点通过对单个个体的Sanger测序确认其中7个位点为固定的SNP位点,这些位点的突变中,毒蕈碱受体:muscarinic receptors (mAChR), 章鱼胺β受体:octopamine beta receptors and 细胞色素P450:CYP6B2 P450 genes,这些基因与抗药性有关,值得进一步研究。
由于P450基因抗性主要与其基因表达相关,突变可能发生在基因调控区,通过5'RACE获得了69个P450的5'UTR,将这些基因回贴到scaffolds上确定其转录起始位点(TSS)及启动子区(TSS的上游300bp到下游100bp),这69个P450启动子区域中分别由9个和10个SNPs在Raz和Rv中,其中CYP6B2: A52T: A (−52)T, T(−57)T, and T(−110)G (gene ID: CPOM05212)这3个SNPs在Raz和Rv中都存在,经过qPCR验证,在两个突变品系中,CYP6B2基因呈现过表达现象,这些SNPs可能在CYP6B2基因表达调控中起重要作用。
为了进一步验证CYP6B2的表达水平与杀虫剂抗性有关,对其进行RNA-i干扰,然后测量干扰品系对甲基谷硫磷,溴氰菊酯以及吡虫啉这三种常用杀虫剂的LC50值(半数致死浓度),结果表明,敲除掉CYP6B2能显著增加昆虫对甲基谷硫磷,溴氰菊酯的敏感性,但对吡虫啉没有明显效果,说明CYP6B2不参与到对其的代谢